微信里点“发现”,扫一下
二维码便可将本文分享至朋友圈。
近期,AI大模型的迭代还在加速。北京时间2月18日,知名企业家埃隆·马斯克(Elon Musk)与xAI团队在X平台上进行直播,发布了xAI开发的最新版大模型Grok 3。该模型被马斯克描述为“地球上最聪明的AI”。xAI团队成员称,为训练Grok 3,他们将数据中心10万张GPU扩充到20万张。
2月初,中国初创企业DeepSeek发布新版大模型DeepSeek-R1,以极低的训练成本和使用成本,搅动大模型领域格局。随后,谷歌、xAI、OpenAI、Anthropic等公司也相继宣布将发布新版大模型。同时,有更多公司表示将采取开源策略。机构认为,大模型的开源大幅降低了应用成本,看好AI应用带来的新机会。
大模型迭代升级
对于新公布的大模型Grok 3,马斯克在直播中表示:“Grok 3的性能比Grok 2提升了一个‘数量级’,和Grok 3聊天会觉得非常有趣。”2023年7月,马斯克成立xAI公司。2023年11月,xAI发布第一款大模型Grok 1,该模型拥有3140亿参数,成为当时参数量最大的开源大语言模型。2024年8月,xAI发布Grok 2,有业内专家当时表示,该模型在性能上与ChatGPT的新模型相媲美。
而为了打造更强的Grok 3,马斯克与xAI团队成员表示,在训练过程中,团队搭建了大型算力集群,并克服了散热、电力等问题带来的挑战。第一阶段,团队用122天将首批10万张GPU投入使用,随后又用92天将集群规模扩大一倍,GPU数量达到20万张。
xAI团队在直播中展示称,Grok 3和Grok 3mini在多方面的测试得分都超过或媲美Gemini、DeepSeek和ChatGPT等对手。团队还演示用Grok 3生成代码,通过运行这段代码,画面上显示出飞船在地球和火星间往返的动画。随后,xAI团队又用Grok 3制作了一款类似于俄罗斯方块的游戏。
此外,xAI宣布推出名为DeepSearch的Grok 3智能搜索引擎。xAI团队表示,Grok 3的所有功能将在一周后陆续上线,并将开源上一代模型Grok 2。开源证券表示,全球AI领域迎来多项重大进展,这些突破有望加速AI应用普及。
市场竞争激烈
马斯克的xAI成为大模型领域强有力的竞争者,参与这场竞技的还有DeepSeek、OpenAI、谷歌等企业。
近期,中国初创企业DeepSeek发布开源推理大模型DeepSeek-R1,以极低的成本实现高性能表现,超越部分对标模型,搅动了大模型市场格局。公开资料显示,DeepSeek-V3使用了2048张英伟达H800 GPU训练了两个月,训练成本为557.6万美元,仅为GPT-4o的十分之一。
DeepSeek新模型发布后,2月初,谷歌发布Gemini2.0系列模型,该系列模型强化了编码与推理能力,向所有用户开放使用。OpenAI则于近日宣布,公司将在未来几个月内推出新一代人工智能模型GPT-5和GPT-4.5。据称,GPT-5将整合OpenAI的多项核心技术,包括o3推理模型。另有消息称,Anthropic计划在未来几周内发布新的混合型大模型Claude 4,用户可以自行控制使用时的推理成本。
同时,DeepSeek还掀起了大模型领域的开源革命,推动大模型成为各领域的“水电煤”。2月18日,阶跃星辰宣布与吉利汽车集团联合开源了两款阶跃Step系列多模态大模型——Step-Video-T2V视频生成模型和Step-Audio语音模型。百度宣布,其大模型产品文心一言将于4月1日起全面免费,所有PC端和App端用户均可体验其最新模型。2月13日凌晨,OpenAI也宣布免费版ChatGPT将在标准智能设置下无限制使用GPT-5进行对话。
中国信息通信研究院技术与标准研究所工程师龚正指出,AI技术的成熟正在改写商业模式,DeepSeek等开源模型的崛起正在重构行业生态。
将重塑产业链
截至中国证券报记者发稿时,据不完全统计,已经有数百家公司和机构正式接入DeepSeek研发的大模型,包括芯片、云服务、网络科技、金融、汽车等行业。
日前,DeepSeek接入拥有近14亿用户的微信。微信自2月15日起开始灰度测试接入DeepSeek-R1模型,增强其搜索功能。2月16日晚间,百度搜索宣布将全面接入DeepSeek和文心大模型最新的深度搜索功能。
一位关注AI创新的投资服务业人士告诉记者,未来大模型企业可以通过向企业端提供解决方案获得收益。对于大模型企业来说,未来的估值将不再单纯依赖于模型本身,投资者将更多地关注其生态建设、用户规模、数据质量以及增值服务的盈利能力。
大模型的应用已经影响到内容创作、金融、电信、自动驾驶等领域。国信证券表示,三大运营商年后陆续接入DeepSeek,运营商庞大的数据有助于为DeepSeek的模型训练与优化提供丰富素材,运营商接入DeepSeek有助于开发新的AI驱动型业务,运营商云平台有望实现AI能力深度集成,加速云业务增长。
在内容创作领域,大模型可以帮助企业快速生成文案、图片、视频等内容,提高创作效率。阅文集团近日宣布,旗下作家辅助创作产品“作家助手”应用已集成独立部署的DeepSeek-R1大模型。数字文化内容产业集团中文在线也宣布,公司已在部分内部AI网文创作流程中部署DeepSeek-R1,帮助增强创作效率。
在智能客服领域,大模型可以实现更智能的交互,提升客户满意度。一汽丰田汽车销售有限公司近日宣布已借助腾讯云的大模型知识引擎接入DeepSeek模型,在智能客服等业务场景深度应用,大幅提升在线智能客服、电话外呼、系统运维工单等多场景的服务效率和用户体验。
在金融领域,大模型可以用于风险评估、投资决策等,提高金融机构的运营效率和风险管理能力。例如,国金证券表示,将把DeepSeek应用于信息检索、文档处理、行业研究及市场分析等多个场景,未来还计划进一步拓展至智能服务、风险管理、投资分析等核心业务领域。
清华大学公共管理学院教授、清华大学人工智能国际治理研究院副院长梁正在近期接受采访时表示,AI未来的发展将向终端化与轻量化发展,随着多模态、强化学习等技术进步,服务机器人、无人驾驶车辆、无人机的规模化部署将成为可能。
交银国际发布研报称,看好垂类大模型在办公、零售、客服、金融、营销、教育、文娱领域场景落地,以及云服务提供商BAT(百度、阿里巴巴、腾讯)价值重估的机会。摩根资产管理表示,将关注以人工智能为驱动力的科技产业、新能源产业、高端制造业以及以创新药为主的医疗健康产业。