
2025年1月第2周AI资讯
下面是2025年1月第二周AI资讯:
Minimax海螺“Subject Reference”功能
本周,Minimax海螺推出了革命性的“Subject Reference”功能,该技术允许用户通过上传一张参考图,快速生成一致的人物形象视频,且不需要任何复杂的模型训练。只需提供一张参考图和输入提示词,用户即可生成各种风格的数字人物,无论是现实人像、动漫风格、3D模型,还是动物形象都能完美呈现。通过这项功能,用户可以轻松创建连续一致的画面,赋予人物多种角色和场景。这意味着,未来每个人都可以成为自己的导演,自主创作视频内容。该功能支持每次生成一个持续6秒钟的高清视频,并能够保留参考图中人物的面部特征,用户可以通过更换提示词来替换不同的场景。也可以上传数码风格图像,生成流畅的动画视频。该功能目前还处于测试阶段,海螺的中文版暂时无法使用,但它为未来AI视频生成和创作提供了极大的潜力。
Flux模型优化
黑森林实验室与英伟达合作,优化了Flux模型,显存需求大幅减少,生成速度也得到了显著提升。此次优化还推出了一种全新的工作流,支持3D引导的生成式AI创作。预计优化后的Flux模型将于2月正式发布,并为创作者提供更加高效的AI工具,特别是在复杂的3D创作过程中,能够显著提升工作效率。
Transpixar视频生成技术
Adobe本周推出了全新的Transpixar技术,该技术支持生成带透明背景的RGBA格式视频,与传统的视频生成技术相比,它能够生成具有透明背景的图像,从而更加方便地进行视频合成。Transpixar不仅支持文本生视频,还可以将静态图像转化为动态画面,这将大大简化视频后期处理的流程,提高视频合成的效率。在线体验:https://huggingface.co/spaces/wileewang/TransPixar 项目地址:https://github.com/wileewang/TransPixar
Runway和Luma更新
Runway的GEN3 Alpha模型本周新增了超分辨率模式,支持将生成的视频提升至4K画质。通过这一功能,用户生成的视频可以从原本的720P分辨率提升至4K,画质有了质的飞跃。对于Runway的付费用户来说,这是一个非常有用的功能,将为视频创作提供更多高质量的输出选项。与此同时,Luma也发布了一段预告视频,暗示其即将发布的新模型,并且随着Google VO2模型的发布,视频生成领域的技术迭代速度在加快。
英伟达Sana模型开源
英伟达的Sana模型正式开源,它支持4K分辨率的图像生成,并且处理速度非常快。Sana的轻量版本散I0.6B能够在16GB显存的笔记本电脑上运行,生成1024分辨率图像仅需1秒钟。Soni模型不仅能够在较低的硬件配置上高效运行,还支持ConfUI工作流,适用于快速AI部署。
通义万相模型升级
阿里旗下的通义万相模型完成了升级,增强了视频生成能力,支持生成1080P高清视频,并且具备时空上下文理解能力。该模型首次实现中文字体渲染,并能生成符合现实物理规律的复杂运动。此外,通义万相还增强了图像生成能力,支持多张图像拼接和联合描述,能够生成连续的漫画场景或视频内容。
Wegic网站生成工具
Wegic 2版本升级为一站式AI建站和管理工具,集网站设计、开发、域名绑定、管理服务于一体。通过AI设计团队的支持,Wegic 2能够自动生成网站并完成管理任务,同时具备自我学习能力,提升自动化网站建设的效率。用户可以方便地使用该工具快速搭建网站。