Yetu- A Global Content Sharing and Monetization Platform

2025-01-20 00:18

2025年1月第2周AI资讯

下面是2025年1月第二周AI资讯：

Minimax海螺“Subject Reference”功能
本周，Minimax海螺推出了革命性的“Subject Reference”功能，该技术允许用户通过上传一张参考图，快速生成一致的人物形象视频，且不需要任何复杂的模型训练。只需提供一张参考图和输入提示词，用户即可生成各种风格的数字人物，无论是现实人像、动漫风格、3D模型，还是动物形象都能完美呈现。通过这项功能，用户可以轻松创建连续一致的画面，赋予人物多种角色和场景。这意味着，未来每个人都可以成为自己的导演，自主创作视频内容。该功能支持每次生成一个持续6秒钟的高清视频，并能够保留参考图中人物的面部特征，用户可以通过更换提示词来替换不同的场景。也可以上传数码风格图像，生成流畅的动画视频。该功能目前还处于测试阶段，海螺的中文版暂时无法使用，但它为未来AI视频生成和创作提供了极大的潜力。

Flux模型优化
黑森林实验室与英伟达合作，优化了Flux模型，显存需求大幅减少，生成速度也得到了显著提升。此次优化还推出了一种全新的工作流，支持3D引导的生成式AI创作。预计优化后的Flux模型将于2月正式发布，并为创作者提供更加高效的AI工具，特别是在复杂的3D创作过程中，能够显著提升工作效率。

Transpixar视频生成技术
Adobe本周推出了全新的Transpixar技术，该技术支持生成带透明背景的RGBA格式视频，与传统的视频生成技术相比，它能够生成具有透明背景的图像，从而更加方便地进行视频合成。Transpixar不仅支持文本生视频，还可以将静态图像转化为动态画面，这将大大简化视频后期处理的流程，提高视频合成的效率。在线体验：https://huggingface.co/spaces/wileewang/TransPixar 项目地址：https://github.com/wileewang/TransPixar

Runway和Luma更新
Runway的GEN3 Alpha模型本周新增了超分辨率模式，支持将生成的视频提升至4K画质。通过这一功能，用户生成的视频可以从原本的720P分辨率提升至4K，画质有了质的飞跃。对于Runway的付费用户来说，这是一个非常有用的功能，将为视频创作提供更多高质量的输出选项。与此同时，Luma也发布了一段预告视频，暗示其即将发布的新模型，并且随着Google VO2模型的发布，视频生成领域的技术迭代速度在加快。

英伟达Sana模型开源
英伟达的Sana模型正式开源，它支持4K分辨率的图像生成，并且处理速度非常快。Sana的轻量版本散I0.6B能够在16GB显存的笔记本电脑上运行，生成1024分辨率图像仅需1秒钟。Soni模型不仅能够在较低的硬件配置上高效运行，还支持ConfUI工作流，适用于快速AI部署。