Meta自研AI训练芯片测试启动,意在降低对英伟达依赖并降成本

   时间:2025-03-11 19:29 来源:ITBEAR作者:杨凌霄

近期,社交媒体巨头meta宣布了一项重大技术进展:其正在测试一款自研芯片,旨在优化人工智能系统的训练过程。这款芯片标志着meta在减少对外部供应商依赖、推进定制化芯片设计方面迈出了决定性步伐。

据知情人士透露,meta已开始小规模部署这款自研芯片,并计划根据测试结果逐步扩大生产规模,以实现更广泛的应用。这一举措是meta长期战略的一部分,旨在降低基础设施成本,特别是在人工智能领域的支出。

据了解,meta在2025年的预计总支出将达到1140亿至1190亿美元,其中高达650亿美元将用于人工智能基础设施建设。这款新训练芯片作为专用加速器,专注于处理人工智能任务,相较于传统的集成图形处理单元(GPU),在能效方面展现出显著优势。

meta与中国台湾地区的芯片制造商台积电合作生产这款自研芯片。目前,该芯片已完成首次“流片”,标志着从设计到生产的重要里程碑。然而,流片过程充满挑战,不仅成本高昂,且耗时三至六个月,且成功率并非百分之百。若测试失败,meta需重新诊断问题并进行流片。

尽管meta在自研芯片领域曾遭遇挫折,甚至一度放弃了一款类似开发阶段的芯片,但公司并未放弃努力。去年,meta已在其推荐系统中成功部署了一款自研推理芯片,用于运行Facebook和Instagram新闻推送中的人工智能系统。meta高管表示,他们计划从2026年开始使用自研芯片进行训练,以应对计算密集型任务。

meta首席产品官克里斯·考克斯在近期的一次会议上表示,公司正在研究如何为推荐系统进行训练,并逐步探索生成式人工智能的训练和推理。他形容meta的芯片开发工作为“从爬行到行走再到奔跑”的过程,并指出第一代推理芯片取得了巨大成功。

然而,meta的自研芯片之路并非一帆风顺。此前,一款自研推理芯片在测试部署中失败,导致相关项目暂停。2022年,meta转向英伟达,订购了价值数十亿美元的GPU。尽管meta一直保持作为英伟达的最大客户之一,但近期随着人工智能领域对大型语言模型“扩展”潜力的质疑,这些GPU的价值开始受到挑战。

 
 
更多>同类内容
全站最新
热门内容