2024年2月24日

Stability AI推出Stable Diffusion 3:提升图像处理与生成质量,微软Copilot聊天机器人上线新功能:“笔记本”支持高达18000字符,渲染1小时仅出1分钟!OpenAI视频生成模型Sora遭质疑?,Sora视频生成神器,Copilot将迎来超强搭档?快来一探究竟!,谷歌推出Gemini for Workspace:AI辅助功能全新上线,定价策略详解,谷歌DeepMind推出Gemma开放AI模型:性能超越竞品,兼容多平台,Adobe推出全新AI助手:助力用户高效处理PDF文档,Apple Silicon芯片迎新突破:博士生团队推出mlx-graphs项目,神经网络处理速度飙升十倍,OpenAI发布Sora文生视频大模型,清华大学亦有新专利公布,字节跳动推出创新视频模型Boximator:文本精确控制动作,Gartner警告:生成式AI或致搜索量暴跌25%,企业营销战略需大调整,OpenAI发布Sora模型:可根据文本生成多视角视频,电影行业或受冲击,Reddit与神秘AI巨头达成数据授权协议,年价值约4.32亿元人民币,谷歌人工智能项目重大更新:Gemini新功能亮相,修复问题并提升用户体验,OpenAI挑战谷歌搜索霸主地位,新搜索产品能否扭转乾坤?,IBM推出AI编程助手“watsonx”助力解决COBOL人才短缺问题

作者 算力云

阿尔及尔裸金属,刚果(布)vps_

【ITBEAR科技资讯】2月23日消息,近日,Stability AI对其产品页面进行了更新,并向用户发出了测试邀请,以体验其全新的文本到图像生成模型——Stable Diffusion 3。据官方透露,此次更新在多个方面实现了显著的提升,包括处理复杂提示词的能力、生成图像的质量,以及对拼写错误的纠正等方面。

目前,Stable Diffusion 3尚未进入公开测试阶段,但已经启动了早期预览计划。有兴趣的用户可以访问相关页面,提交必要的信息后加入等待名单,以便在模型正式发布之前率先体验并提供宝贵的反馈。

据ITBEAR科技资讯了解,Stable Diffusion 3在扩展性能方面也取得了重大突破,支持从8亿到80亿个参数等不同规模,这一设计使得模型能够更好地满足不同用户的需求和硬件能力。此外,Stable Diffusion 3还创新地结合了扩散型变换器(diffusion transformer)架构,该架构融合了深度学习和扩散模型的各自优势,能够将随机噪声逐步转化为具有实际意义的图像或视频内容,为用户带来更加丰富和生动的视觉体验。