韦乐平：随着模型规模的日益扩大，跨域训练是必然趋势

更新时间：2025-04-24 03:33:56 发布时间：12小时前浏览：3347 评论：0

内容摘要飞象网讯（易欢）4月23日消息，在今天举办的“2025云网智联大会”上，SNAI推委会荣誉主席、原中国电信科技委主任韦乐平分享了对智算拉远的思考。谈及大模型训练智算拉远的市场需求，韦乐平坦言，可以以网补算，提升闲散智算中心算力资源利用率。“

飞象网讯（易欢）4月23日消息，在今天举办的“2025云网智联大会”上，SNAI推委会荣誉主席、原中国电信科技委主任韦乐平分享了对智算拉远的思考。

谈及大模型训练智算拉远的市场需求，韦乐平坦言，可以以网补算，提升闲散智算中心算力资源利用率。“面对大批分散部署、利用率很低的小规模智算中心，若能通过网络互联形成一个大型的逻辑智算池来适应规模日益增长的大模型训练，有望大幅提升闲散智算资源的利用率。”

与此同时，他指出，迈向未来，跨域训练是必然趋势。按照统计，大模型参数每1-2年增长10倍，而对应的GPU芯片的算力仅增长2-4倍，远低于模型规模的增速。随着模型规模的日益扩大，单体的算力、电力、空间资源终将受限，可能需要在园区甚至更大范围内由多个智算中心互联形成一个超级逻辑智算资源池，进行联合训练才有可能支撑超大模型的训练。

韦乐平强调：“至于推理与具体业务场景和访问量相关，更需要跨域实施。”

针对大模型训练智算拉远的挑战，韦乐平认为复杂的商用场景，势必会面临大量不同功能、性能的异构GPU、规模不同的AIDC的互联、不同业务场景、不同设备和不同组网方式、不同模型和不同参数的协同挑战。

此外，还面临一些技术挑战。在韦乐平看来，一是带宽收敛问题。“无收敛带宽普适性和前瞻性好，部署快，但成本太高；收敛比4-8时，带宽成本可以降至10%之内，但是只适用特定业务场景下的特定模型拆分方式，缺乏普适性和前瞻性。”

二是功能和性能问题。拉远后必然面对丢包、抖动乃至中断故障等诸多挑战，对ROCE网络的功能和性能有不少严格的要求。

统一管理和运维也是挑战之一。韦乐平认为，现有固化的组织架构和生产流程不适合快速部署逻辑统一的异地智算中心，需要对现有管理运维体系、生产流程、监控管理平台改造升级。

举报收藏打赏 评论 0

版权声明 本文仅代表作者观点，不代表本站立场。
如遇本文系为网络转载到本站发表，图片或文章有版权问题的请联系客服确认后会立即删除文章。
如遇本文系作者授权本站发表，未经许可，不得转载。

--结束END--

有问题投稿请发送至: 邮箱/

本文标题: 韦乐平：随着模型规模的日益扩大，跨域训练是必然趋势

本文链接: http://line.ztc188.com/news/show-395804.html (转载时请保留)

0 条

一年接待读者295.4万人次荔湾区图书馆2024年度报告发布

科技 ydc188 ⋅ 10阅读量 ⋅ 0评论 ⋅ 28分钟前

2025-04-24
世界最大跨度三塔斜拉桥合龙有“绝技”

科技 tsbcq ⋅ 2阅读量 ⋅ 0评论 ⋅ 28分钟前

2025-04-24
英唐智控2024年财报：营收53.46亿元，同增7.83%

科技 kuuhbggy ⋅ 16阅读量 ⋅ 0评论 ⋅ 28分钟前

2025-04-24
中国—拉美和加勒比国家科学日在京举行

科技 kingtecsh ⋅ 19阅读量 ⋅ 0评论 ⋅ 28分钟前

2025-04-24
广佛三馆借书实现通借通还

科技 wnt1381 ⋅ 20阅读量 ⋅ 0评论 ⋅ 28分钟前

2025-04-24
十五运会倒计时200天全市公园景区开展“悦走羊城”活动

科技 huayinong999 ⋅ 10阅读量 ⋅ 0评论 ⋅ 28分钟前

2025-04-24
中国一重造出620℃超超临界汽轮机“心脏”部件

科技 yanandbin ⋅ 13阅读量 ⋅ 0评论 ⋅ 28分钟前

2025-04-24
外交部：美方想跟中方谈，就应该停止威胁讹诈

科技 wlswzxjzpc ⋅ 15阅读量 ⋅ 0评论 ⋅ 28分钟前

2025-04-24
家居企业凭创新突围开拓新市场

科技 hazag ⋅ 14阅读量 ⋅ 0评论 ⋅ 28分钟前

2025-04-24
视网膜揭示心理健康遗传风险

科技 meron ⋅ 8阅读量 ⋅ 0评论 ⋅ 28分钟前

2025-04-24

韩婷

去ta空间

24小时热闻

今日推荐