PyramidFlow是一款来自中国的开源AI模型,能够制作虚拟高分辨率(768p)视频。据其背后的团队称,该模型可以在不到一分钟的时间内生成一段时长五秒的384p视频。MIT许可证涵盖了PyramidFlow,该模型在开源数据集上进行了训练。
PyramidFlow是一种新的AI模型,已经在YouTube教程视频中流行起来,它基于开源数据集进行训练,总共约有1000万个视频。PyramidFlow是汇集了北京大学、快手科技和北京邮电大学AI研究人员的团队的成果,本身就是开源的。受MIT许可条款的保护,它可以生成虚拟高分辨率(768p)视频内容,在处理384p时显然会大放异彩。据其创建者称,它可以在不到一分钟的时间内制作出一段五秒钟的视频(据说是在未公开的硬件配置中使用A100GPU)。
在某些情况下,PyramidFlow表现出色。然而,在处理某些文本提示时,结果远不能令人满意。与许多生成式AI应用程序的情况一样,使用这样的工具具有一定的随机性。好的一面是,该模型的方法使用的计算能力远低于其竞争对手,而且由于其代码是开源的,感兴趣的人可以在本地或云应用程序中使用它,而不必担心许可部分。
然而,创建PyramidFlow的人工智能研究人员列出了用于训练它的所有数据集,但没有提到可能出现的版权问题。虽然一些内容创作者声称使用开源材料制作的虚拟视频侵犯了版权持有人的权利,但PyramidFlow可能有助于微调此类内容,而无需任何第三方的参与。
那些从开源角度对人工智能感兴趣的人可以从亚马逊购买JDTjonWolf的《开源人工智能:数据研究的未来》,价格为9.99美元(Kindle版)或12.99美元(平装版)。
标签:
免责声明:本文由用户上传,如有侵权请联系删除!