全国两会上,“人工智能+”“大模型”“算力”等被写入政府工作报告。当前和今后一段时期,我国“人工智能”发展面临哪些机遇和挑战?“人工智能+”如何更好服务经济社会发展和百姓生活?
“当前最重要的是尽快发展行业大模型。预计下个月我们将有一个新成果要发布,可以对全国算力进行调度,从而大大降低企业利用AI、发展行业大模型的门槛。”中国工程院院士、紫金山实验室荣誉主任兼首席科学家刘韵洁近日接受记者采访表示。

DeepSeek出现前,大模型行业信奉“算力即权力,规模即护城河”的逻辑。当DeepSeek用不到同行十分之一的价格训练出效果更优的大模型,行业开始担心算力需求会下降,但也有业内人士表示由此所带来的技术普及,是更大的算力需求。
刘韵洁对此表示赞同。他表示,随着AI大模型的发展,国产算力仍面临挑战。可国内高端GPU目前仍与国外存在差距。弥补短板的办法之一是建设算力网络“把整个算力连起来”,进行分布式训练。
“分开练”,如何确保数据传输无误,达到“集中练”效果?今年年初,刘韵洁带领团队历时十余年科研攻关,推动建设的国家重大科技基础设施——未来网络试验设施(CENI)正式建成。其间,团队先后突破“光电融合技术”“确定性网络技术”“CENI大网操作系统光电融合调度技术”三大关键技术,可实现2000公里无电中继远距传输、400G零丢包无损传输、全颗粒切片按需传输。
“我们利用确定性网络技术、光电融合技术等进行了测试,多个异地训练达到单点训练的98%效率,成本节省60%。据我所知,同样的工作,国外也有企业在做,传输效率有的是83%、有的是96%。”刘韵洁认为,这证明分布式训练、协同训练是可行的。

刘韵洁还指出,AI决胜未来在于赋能千行百业。而很多时候行业的问题是不能用通用模型去解决的。需要基于行业的知识、数据,训练一个行业的大模型,才能更好地去解决问题。
“要重视发展行业大模型。”刘韵洁提出,“中国行业数据最完整、全面。我们在这方面有基础、有条件。但当前,国内数据的共享、流通程度仍有待加强,这对训练行业大模型产生了影响。”刘韵洁分析,限制数据流通的关键因素之一,就在于算力生态未能建立起来。企业使用算力成本高、算不好。
刘韵洁的这一看法,也 可从行业选择中得到侧面印证。记者走访了多家研发大模型的科技公司,发现的确不少企业都把目光聚焦到了与产业发展更直接的行业大模型,有企业负责人直言,他们现阶段更注重让大模型先去服务产业,攻克实际生产难题。
截至2025年1月,根据国家网信办《生成式人工智能服务已备案和已登记信息》,全国已有302个大模型产品通过备案,最新一批行业大模型占比超50%。2024年11月,沙利文咨询公司发布《2024年中国行业大模型市场报告》称,2023年中国行业大模型市场规模达105亿元,预计2028年行业大模型市场规模有望达到624 亿元。
刘韵洁提出,走行业大模型赛道,需要政府、企业、资本一起努力。国内模型企业如果能够在通用大模型基础上,“把行业数据真正高效地用起来”,做好行业大模型,“完全可以走出中国道路”。
刘韵洁透露,他的目标是要让算力像“自来水”一样随用随取,甚至更方便,“毕竟我们不能自主选择用哪一个水厂的水。但是未来算力我们可以做到,让用户自主选择要用哪一个算力中心的算力”,进而支撑数据高效流转和利用,赋能企业打造更多的行业大模型,促进工业等行业数智化产业升级。
来源| 南京日报/紫金山新闻/江苏未来网络集团
