谷歌推出“最强”TPU芯片,非GPU阵营活跃起来了

0次浏览     发布时间:2025-04-10 16:57:00    

当地时间4月9日,谷歌发布第七代TPU(Tensor Processing Unit,张量处理器),并称该芯片是谷歌目前功能最强大的TPU,且是谷歌首款面向AI推理时代的TPU。这款芯片名为“Ironwood”,单芯片峰值算力可达4614 TFLOPs。

谷歌这款新芯片的特点还包括节能。相比通用的GPU(图形处理器),TPU等ASIC(专用集成电路)的特点就包括较低功耗。除了TPU,还有其他芯片希望凭借较低功耗等特点抢占AI芯片市场,非GPU阵营颇为活跃。

谷歌TPU迭代

谷歌在“Google Cloud Next 25”大会上推出了第七代TPU。“它专为大规模思考、推理AI模型设计,是谷歌迄今为止最节能的TPU。”谷歌表示。Ironwood可扩展至9216片芯片集群,性能是第六代TPU Trillium的2倍,能效则比2018年谷歌第一款Cloud TPU高出近30倍。

这款新TPU在内存带宽等方面有所改善,加快了数据访问速度。每颗Ironwood芯片的HBM(高带宽内存)容量为192GB,是Trillium的2倍。HBM带宽也有所提升,单颗Ironwood芯片的内存带宽达7.2Tbps,是Trillium的4.5倍。Ironwood芯片间互联(ICI)带宽则为1.2Tbps,是Trillium的1.5倍。

谷歌的TPU用于公司内部工作负载,不对外出售芯片,但谷歌自研的TPU部署量已经不小。据市场研究机构TechInsights数据,谷歌早在2023年就成为全球第三大数据中心处理器设计公司,位列CPU霸主英特尔和GPU霸主英伟达之后。

依托于自研芯片,谷歌在当地时间周三重申了今年的资本支出计划。谷歌计划今年斥资约750亿美元建设数据中心,押注生成式AI,这笔投资将用于构建改善谷歌核心资产所需的芯片和服务器,并支持Gemini等AI服务的开发。

一般来说,ASIC芯片的通用性比GPU弱,但适用于高效执行特定范围的功能,能耗和成本可以做到更低,业界分析人士认为这类芯片适合用于AI推理。

随着AI应用逐渐铺开,推理所需的AI芯片需求也有望增加。作为数据中心供应链上的厂商,铠侠株式会社首席技术执行官柳茂知告诉记者,市面上出现各种AI服务器,此前以训练型、学习型服务器为主,近段时间受DeepSeek等AI模型推动,出现越来越多推理型服务器。

除了谷歌TPU,其他云厂商也在自研这类能耗较低的ASIC芯片,例如亚马逊旗下有Trainium系列芯片,Meta有专为AI训练和推理设计的MTIA,微软有Azure Maia。

非GPU阵营活跃起来

除了ASIC芯片,其他新架构芯片也在迎合AI服务的灵活、低功耗需求,试图在AI时代分一杯羹。

采用RISC-V指令集架构的芯片也具备较低功耗的特点,且该指令集开源,目前RISC-V厂商也瞄准了AI服务的需求。3月,阿里达摩院的玄铁最高性能处理器C930开启交付,面向服务器级别高性能应用场景。这是一款CPU芯片,核内AI算力相比前代有所提升,采用RISC-V精简指令集,而非x86、ARM这两种目前被广泛使用的指令集。同月,睿思芯科也推出一款高性能RISC-V服务器芯片,面向智算场景。

“AI推理产生的算力需求将指数级增长,近期各行各业本地化部署DeepSeek,产生巨大的算力需求,导致很多智算中心算力供不应求,RISC-V芯片能凭借低功耗和灵活定制的优势改变这个现状。” 在近日中科创星发起的好望角科学沙龙上,中国科学院计算技术研究所副所长、研究员包云岗表示。

芯片厂商奇异摩尔相关负责人告诉记者,RISC-V架构具有开放性和可定制性,其开源和模块化特性允许开发者根据特定AI应用的需求定制指令集,从而优化性能和功耗。AI推理产生算力需求,使RISC-V在AI领域变得更加重要。

作为一种年轻的指令集架构,加州大学伯克利分校的研究团队2010年才首次发布RISC-V。另外两种主流指令集x86和ARM都较为封闭,x86基本不对外授权,企业要使用ARM架构需向其所属公司支付授权使用费,RISC-V的路径则是开源免费。但相比x86和ARM生态的成熟,RISC-V生态仍在完善过程中。此前RISC-V多应用于物联网领域,目前则在探索应用于高性能计算,例如用于AI服务。

包云岗表示,国内香山高性能处理器核IP、玄铁C930服务器芯片等推出,验证了RISC-V在高性能计算领域的可行性。市场研究机构Omdia预计,AI将对该架构芯片扩大应用有所助力,2030年基于RISC-V的AI处理器出货量将超过5亿颗。

RISC-V的研究热度也有所升温。近日东壁科技发布的相关报告显示,RISC-V领域研究自2019年起进入快速增长期,2022年进一步升温,目前该领域的研究进入稳定增长阶段。RISC-V领域的研究热点就包括人工智能与机器学习、物联网与边缘计算、拓展高性能计算应用等。国内学者发布的RISC-V相关论文数已超300篇。

不过,包云岗也指出,RISC-V在应用中还需攻克“三座大山”,分别是工具链短板、标杆案例缺失和人才缺口,尤其是人才缺口。目前该领域从芯片设计、验证、解决方案、技术支持等各个层次的人才均不足。

相关文章

  • 海光新一代处理器斩获“2025中国创新IC-强芯领航奖”
    近日,在2025中国集成电路设计创新大会暨第五届IC应用展(ICDIA-IC Show)上,“强芯中国-2025创新IC”评选结果揭晓,天津高新区企业海光信息从近220个参评项目中脱颖而出,海光新一代C86处理器荣膺“2025中国创新IC-强芯领航奖”。“强芯评选”面向全国设计企业征集评选出一批技术
    2025-07-22 09:43:00
  • 到2027年底培训60万人次 河北开展“技能照亮前程”培训行动
    近日,河北省人社厅、省财政厅印发《关于深入开展“技能照亮前程”培训行动的通知》(以下简称《通知》),决定自2025年至2027年底,深入实施“技能照亮前程”培训行动,2025年至2027年底,全省开展各类补贴性职业技能培训60万人次以上。《通知》明确,培训行动将聚焦防止返贫监测对象、毕业年度高校毕业
    2025-07-20 16:39:00
  • 中国“数字民生”实践为上合国家实现“智慧生活”提供新方案
      7月11日拍摄的2025上合组织数字经济论坛互动体验区的医疗AI辅助系统。新华社记者 曾晋 摄新华社天津7月13日电(记者曾晋、尹思源)从解决日常需求到智能技术应用平台,再到智能化人文关怀守护银发群体,中国数字经济正以润物无声的方式重塑民生图景。“中国的‘数字民生’建设成果为上合组织国家提供了新
    2025-07-14 10:05:00
  • 龙芯发布新一代服务器处理器
    长沙晚报掌上长沙7月1日讯 据人民网消息 龙芯中科近日正式发布基于国产自主指令集龙架构研发的服务器处理器龙芯3C6000系列芯片、工控领域及移动终端处理器龙芯2K3000/3B6000M芯片以及相关整机和解决方案。龙芯3C6000系列芯片采用自主指令系统龙架构,不需要国外授权,综合性能达到2023年
    2025-07-01 18:13:00
  • 今年张家口市新增高校毕业生等青年群体就业13914人
    今年以来,我市始终把高校毕业生就业作为重要政治任务、扛起重要责任、摆在重要位置,大力实施就业扶持全覆盖专项行动,促进高校毕业生高质量充分就业。截至6月底,全市城镇新增就业29728人,其中高校毕业生等青年群体就业13914人。为促进高校毕业生等青年群体实现就业,我市研究下发《关于做好2025年高校毕
    2025-06-30 11:20:00