腾讯Angel机器学习平台获殊荣,通信成本直降七成引领科技突破

   时间:2024-11-20 18:24 来源:ITBEAR作者:柳晴雪

在浙江乌镇,全球瞩目的2024年世界互联网大会盛大启幕,会上传来了一则振奋人心的消息:腾讯凭借其卓越的创新成就,荣获了大会新设奖项——杰出贡献奖之创新突破类。这一荣誉不仅彰显了腾讯在全球互联网领域的影响力,更是对其不懈探索与创新精神的肯定。

不仅如此,腾讯Angel机器学习平台也在本次大会上大放异彩,一举夺得本年度世界互联网大会领先科技奖。据悉,该奖项被誉为科技界的顶尖荣誉,从270个申报项目中脱颖而出,仅有20个项目获奖,腾讯Angel机器学习平台的实力由此可见一斑。

评选委员会对腾讯Angel机器学习平台给予了高度评价,指出其成功攻克了万亿级模型分布式训练和推理以及大规模应用部署等世界级难题。这一突破主要体现在通信、效率和规模三个方面。

在通信方面,腾讯自研的RDMA网络实现了集群的高速互联,单节点带宽高达3.2T,相比同类领先产品,性能提升了30%,成本则降低了70%。这一技术的突破,为大规模模型训练提供了坚实的通信基础。

在效率方面,腾讯自研了训练/推理框架,并创新性地提出了显存加主存的一体化机制,实现了多维并行和算子优化。这一框架的推出,使得训练性能相比开源框架提升了2.6倍,推理速度也提升了2.3倍,极大地提高了模型训练和推理的效率。

在规模方面,腾讯Angel机器学习平台实现了单任务万卡的线性扩展,GPU集群加速比从50%提升至99%,这一突破使得大规模模型训练成为可能,进一步推动了人工智能技术的发展。

那么,腾讯Angel机器学习平台究竟是做什么的呢?简单来说,它就像一个强大的“数据加工厂”。当你手握一堆杂乱无章的数据时,只需将这个“原材料”交给Angel机器学习平台,它就能通过清洗、训练、加工等一系列工序,将这些数据转化为一个功能强大的大模型。

在整个过程中,底层由GPU、云服务器等计算硬件提供算力支持,中层则是腾讯Angel机器学习平台这一“加工厂”,负责处理数据、开发算法和执行训练任务,而上层则是经过训练后的大模型,可以应用于各种场景,为人们的生活带来便利。

 
 
更多>同类内容
全站最新
热门内容