微信里点“发现”,扫一下
二维码便可将本文分享至朋友圈。
近日,Meta首次公开展示了其AI视频生成工具Meta Movie Gen,这款工具对标OpenAI的文生视频工具Sora,功能包括文本生成视频和音频、编辑已有视频、图片生成视频。在展示中,Meta Movie Gen在文生视频的一些常见难题上表现优异。
在包括文生视频在内的各个AI赛道,我国科技公司始终跟随世界领先水平。我国智能算力年增速超过65%,是各地、各公司布局的热门领域。随着AI大模型走向落地,市场上智算中心、智能算力服务的“成色”将接受检验。
文生视频工具新“王者”
Meta表示,无论是希望在好莱坞大展身手的电影制作人,还是爱好为观众制作视频的创作者,相信每个人都应该有机会使用有助于提高创造力的工具。
尽管目前不少AI公司推出了自己的视频生成工具,但这些工具生成的视频仍有不少和现实世界不符之处。在Meta Movie Gen演示的视频中,一些难题表现优异。比如奔跑小女孩衣服上的褶皱符合现实中的褶皱变形运动,在人物转头、正视前方、微笑的动作中,面部依然可以保持稳定状态等。
在音频配备方面,Meta Movie Gen可直接生成和视频画面具有较高适配度的背景音乐、音效等,真正让普通人也能用视频生动讲述完整故事。
据Meta公布的论文,这一全新生成式AI工具背后最大的视频生成模型是一个30B参数的Transformer模型,可以生成最长为16秒、帧率为16 FPS(每秒帧数)的视频。为了训练这个模型,Meta使用了多达6144台H100 GPU,每一台的热设计功耗为700W,并且都配备了容量为80GB的HBM3显存。
难产的Sora获巨额融资助力
和突然亮相的Meta Movie Gen相比,Sora自发布以来,迟迟未能与大众见面。OpenAI的解释是,Sora仍处于研究阶段,需要进一步完善技术,降低生产成本,并解决潜在的安全和法律风险。
而从生成成本的角度来看,算力不足难以上线满足用户需求是难题之一。不过,近日OpenAI的新一轮融资有望为Sora增加助力。
OpenAI在最新一轮融资中筹集了66亿美元,融资后估值达到1570亿美元。这是全球创业公司近年来规模最大的融资。
OpenAI表示,新资金将用于巩固公司在前沿AI研究方面的领导地位,提高计算能力,并继续构建帮助人们解决难题的工具。数据显示,现在每周已有2.5亿人在使用ChatGPT。
我国智能算力需求旺盛
我国科技公司并未缺席AI在视频赛道的机遇,视频内容巨头也成为赛道上的活跃者,持续提升计算能力同样是我国AI公司面临的重要课题。
从算力供给来看,近年来,我国算力基础设施建设规模持续扩大。工业和信息化部总工程师赵志国在2024中国算力大会上表示,截至今年6月,全国在用算力中心机架总规模超过830万标准机架,算力总规模达246EFLOPS(每秒百亿亿次浮点运算),位居世界前列。我国工业、教育、医疗、能源等多个领域算力应用项目超过1.3万个,全国算力中心平均电能利用效率(PUE)降至1.47,创建国家绿色数据中心246个。
我国智能算力在算力总规模中的占比不断加大。截至今年6月底,我国智能算力的规模超过76EFLOPS,年增速为65%,我国已建和正在建设的智算中心超250个。
在各地纷纷上马智算中心的浪潮中,智算中心的“成色”也不容忽视。在算力大会上,中国信息通信研究院公布了智算中心算力性能等级认证结果,商汤临港AIDC获评全国首个5A级智算中心算力性能认证,成为我国智算中心的样本之一。
今年1月,上市公司群兴玩具宣布跨界入局算力业务。群兴玩具董事长张金成在接受记者采访时表示,公司的目标是打造千卡、万卡集群的算力规模。
“AI的发展没有天花板,这是一个长远的赛道。”张金成认为,性价比、规模化以及客户服务等都是智算供给的竞争点。此外,国内智算行业需要从单纯的算力租赁模式转型到算力服务模式,智算中心需要将异构智算算力资源服务化,像公有云一样,把智算算力封装成标准的服务,客户随用随取。