2025-04-19 19:27
近年来,AI手艺的迅猛成长对计较能力提出了更高的要求。GPU做为AI芯片的支流选择,凭仗其强大的并行处置能力和普遍的使用场景,持久以来占领了市场的从导地位。然而,跟着AI使用的不竭深切和复杂化,功耗和成本等方面的问题逐步,ASIC架构的兴起则为AI芯片范畴带来了新的成长标的目的。算力凡是是指计较机处置消息的能力,出格是正在进行数字运算、数据处置和施行法式时的速度和效率。按照利用设备和供给算力强度的分歧,算力可分为根本算力、智能算力、超算算力。智能算力即AI算力,担任供给AI算法模子锻炼取模子运转办事的计较机系统能力,其算力芯片凡是包罗GPU、ASICFPGA、NPU等各类公用芯片。
目前通用的CPU、GPU、FPGA等都能施行AI算法,只是施行效率差别较大。但狭义上讲一般将AI芯片定义为“特地针对AI算法做了特殊加快设想的芯片”。FPGA和ASIC架构,按照场景能够分为云端和端侧。当前市场支流AI芯片为GPU和ASIC,国际上,NVIDIA的H200Tensor Core GPU以其杰出的计较机能和能效比领先市场,而Google的第六代TPU Trilium ASIC芯片则以其专为机械进修优化的设想供给高速数据处置。正在国内,寒武纪的思元370芯片(ASIC)凭仗其先辈的计较处置能力正在智能计较范畴占领主要地位,已取支流互联网厂商开展深切适配,海光消息的DCU系列则基于GPGPU架构,以其类“CUDA”通用并行计较架构较好地适配、顺应国际支流贸易计较软件和AI软件。
正在GPU取CPU的关于AI市场的争锋中,GPU凭仗其奇特的架构和并行处置能力占领了显著的劣势地位。跟着AI生态的不竭强大和算力需求的持续提拔 ,当下支流GPU架构呈现较着的机能瓶颈。以英伟达最新发布的H100 GPU为例,其理论算力达到1979 TFLOPS,但正在现实AI锻炼使命中,无效操纵率往往不脚30%。这种效率丧失次要源于GPU的通用计较架构设想,使其正在处置特定AI使命时发生大量冗余计较。ASIC架构针对特定算法和使用进行优化设想,正在特定使命上的计较能力强大,如正在某些AI深度进修算法中实现高效的矩阵运算和数据处置。虽然GPU具有强大的并行计较能力,具有浩繁计较焦点,可同时处置多个使命,正在通用计较和图形处置方面表示超卓,合用于大规模的数据并行计较,如科学计较、图形衬着、视频处置等,但GPU正在特定使命上的计较效率可能不如ASIC,特别是正在能效方面。
ASIC凡是具有较高的能效比,因其硬件布局是为特定使命定制的,能最大限度削减不需要的功耗。GPU因为其通用的设想架构,正在施行特定使命时可能存正在一些功耗华侈。具体而言,谷歌TPU v4正在划一功耗下,AI锻炼机能较GPU提拔3倍以上,能效比提拔5倍。这种劣势就是源于ASIC针对特定算法进行硬件级优化,消弭了通用计较架构中的冗余设想。正在天然言语处置使命中,ASIC芯片的推理速度可达GPU的10倍,延迟降低80%。
此外,成本也是ASIC架构无望成为支流的环节缘由。ASIC因其硬件布局是为特定使命定制的,削减了良多针对通用加快计较的不需要的硬件设想,其单元算力成本比拟GPU或更低。谷歌TPUv5、亚马逊Trainium2的单元算力成本别离为英伟达H100的70%、60%。
目前,全球科技巨头已展开ASIC结构,谷歌TPU已迭代至,亚马逊推出Inferentia芯片,特斯拉自研Dojo超算系统。这些公用芯片正在各自范畴展示出惊人机能,此中TPU v4正在图像识别使命中实现99。9%精确率,Inferentia将推理成本降低70%,Dojo使从动驾驶锻炼效率提拔10倍。值得一提的是我国AI芯片公司多以 ASIC 为从如出名的昇腾、寒武纪等都属于这一品类。正在近两年的全球大模子竞赛中,中国企业并未掉队太多,而正在将来百花齐放的使用时代,ASIC将不再成为软肋,也将跟着 AI芯片的成长大放异彩。
将来三年,ASIC架构将沉塑AI计较款式。估计正在2025年,全球AI芯片市场规模将冲破1000亿美元,此中ASIC占比将跨越40%。跟着工艺制程进入3nm时代,ASIC的机能劣势将进一步扩大,鞭策AI计较进入公用化时代,届时,全球AI芯片话语权必然呈现新的变化。
壹零社:用图文、视频记实科技互联网新颖事、电商糊口、云计较、ICT范畴、消费电子,贸易故事。《中国知网》每周全文收录;中国科技报刊100强;2021年微博百万粉丝俱乐部;2022年抖音优良科技内容创做者。
福建宏波信息技术有限公司
Copyright©2021 All Rights Reserved 版权所有 网站地图