基于1β制程的第二代HBM3——美光加速AI应用创新的又一里程碑
来源:中关村在线
以各类GPT为代表的生成式AI让人们看到了智能世界的无限可能,与此同时,新一代AI技术对IT基础架构的要求也在与日俱增,使得CXL、HBM、光模块市场呈现了高速增长。其中,HBM自2013年上市以来,就被视为推动高性能和加速计算的有效途径之一,HBM是一种基于3D堆栈工艺的高性能DRAM架构,能够实现巨大的内存带宽,尤其是HBM3与CPU整合使用之后,可以显著推动片中内存的发展,让多元的业务负载能够充分受益于共享计算、内存、存储资源融合后的内存级结构创新。
“AI应用和基础设施与內存的成长息息相关。”美光副总裁暨计算与网络事业部计算产品事业群总经理Praveen Vaidyanathan表示,“AI服务器与通用型服务器不同,其所需的內存是一般服务器的六至八倍,其中包括与CPU相连的內存,如DDR、与GPU相连的內存,如HBM,以及其他相关的內存解决方案。由于HBM能支持AI应用和服务器基础构架的成长,我们预测未来三年HBM市场将有巨大增长,年复合增长率超过50%。”
(资料图片)
美光副总裁暨计算与网络事业部计算产品事业群总经理Praveen Vaidyanathan
美光将AI分为三大类,第一类是生成式AI,例如利用Mid-Journey、ChatGPT等生成文字、图片或视频,驱动了大量的计算性能需求和内存需求;第二类是深度学习,例如虚拟助理、聊天机器人和医疗诊断,需要处理大量的数据,会通过算法来诠释数据,并加以预测,是推动AI和高效能计算增长的重要领域;第三类是高效能计算,例如要解决天气预报等重大的科学问题时,会涉及全基因体定序(genome sequencing),这同样驱动了庞大的计算和內存需求增长。
这些应用需要通过服务器等基础设施来支持,像服务器要考虑性能、容量、功耗的要求,驱动生成式AI的LLM(大型语言模型)离不开强劲的算力,这需要足够的内存带宽,通常来说,计算性能的瓶颈超过半数都与內存的带宽有关。随着LLM的参数数量迅速攀升,要在足够小的体积内存放足够多的数据,就需要架构层面的创新,同时,还要确保功耗尽可能低。要知道有数据显示,未来七年内,全球近8%的电力将消耗在数据中心上。
为了满足上述需求,美光推出了首款8层堆叠的24GB容量第二代HBM3内存,其带宽超过1.2TB/s,引脚速率超过9.2Gb/s(NRZ),比当前市面上现有的HBM3解决方案性能可提升最高50%,美光第二代HBM3产品与前一代产品相比,每瓦性能提高2.5倍,可以缩短大型语言模型(如GPT-4及更高版本)的训练时间(减少30%以上),为AI推理提供高效的基础设施,并降低TCO,在已经部署的1000万个图形处理器用例中,单个HBM模块可节约5W功耗,能在五年内节省5.5亿美元的运营费用。2024年第一季度,美光12层堆叠的36GB容量产品也将开始出样。美光第二代HBM3内存会在日本工厂生产,并在中国台湾进行封装。
8层堆叠的24GB容量第二代HBM3内存
据了解,美光采用了互补式金属氧化物半导体(CMOS)技术打造晶体管,并在逻辑基础层和DRAM堆叠中加入了很多制程方面的技术,驱动了更快的时序速度。封装方面,美光提供了两倍的硅通孔(TSV)数量,所有晶粒对晶粒的封装互联缩小了25%(DRAM最上层和下层TSV的距离)。同时,在电路设计上注重时间控制,使速度更快,再加上噪声容限设计(Noise tolerance)等技术,构成了更优的信号完整性、配电网络、电源完整性,获得了更高的性能表现。
提升硅通孔和封装互联数量、DRAM层间空间等设计,可以让内存内部的热量快速从较热层传到较冷层,再加上增加金属密度,并采用高能效数据路径设计,可以解决HBM的热阻抗问题,降低功耗。数据中心的能耗降低后,就可以把更多的电力分配给GPU或ASIC,提升了整体的系统性能和效率。
作为在2.5D/3D堆叠和先进封装技术领域的存储领导厂商,美光也与台积电共同组建了3DFabric联盟,携手推进半导体和系统创新。在第二代HBM3产品开发过程中,美光与台积电携手合作,为AI及高性能计算设计应用中顺利引入和集成计算系统奠定了基础。目前,台积电已收到美光第二代HBM3内存样片,正与美光密切合作进行下一步的评估和测试,助力客户的下一代高性能计算应用创新。
美光将硅通孔(TSV)数量翻倍,增加5倍金属密度以降低热阻,以及设计更为节能的数据通路
硅通孔、DRAM堆叠是由美光独立完成,中介层则是与台积电合作。“尽管美光会自行打造封装,但是我们也会和台积电紧密合作,以便让中介层与内存、GPU、ASIC等元件可以完美整合。”Praveen Vaidyanathan介绍称,“高带宽可以满足AI训练和推理的需求,例如某服务器集群要花三个月的时间训练大型语言模型,采用HBM3之后,可以节省30%以上的训练时间,减少至两个月。在推理过程中,HBM3的使用可以让每天的查询量和提示量增加50%,减少等待时间。”
继LPDDR5、DDR5之后,第二代HBM3内存是美光推出的第三款1β制程的产品,2024年上半年,该公司还将推出基于1β节点、32Gb单块DRAM裸片的128GB容量DDR5模组,同时,美光还在与伙伴合作研发下一代产品,即“HBM Next”,每秒带宽将超过1.5TB,容量会增至36GB以上。为了应对生成式AI领域快速增长的模型规模,HBM可以在设备端以非常高效的方式提供所需的带宽和容量。而在一些AI推理的场景中,需要用到高算力和高內存带宽,但不需要更大的容量,则可以使用GDDR来满足要求。
因此,美光在AI基础设施领域提供了全面的解决方案,例如GDDR6X、GDDR7(研发中,明年推出)可以融入内存组合,满足带宽需求,从GPU内存到CPU内存,192GB、256GB模块将陆续应用,此外,美光也在计划开发满足各类新规格和标准的产品,打造更低功耗的DRAM,满足新一代数据中心的要求,并且在持续探索连接GPU的高带宽內存、CPU的高容量內存、处理器的低功耗DRAM的架构创新。
“可以说,美光在技术、产品、功能上都是领先的,我们在全球有着广泛的研发、设计、制造团队,对于质量有着高标准的执着追求,这种坚持深度融入到我们的设计理念和方法论之中。凭借着我们在产品技术上长期深耕的经验,以及技术的专业性,美光能够在持续推出领先的创新制程、技术及产品的同时,提高制造效率。”Praveen Vaidyanathan表示,“我们在不同领域拥有着很多的客户,包括GPU制造商、数据中心,以及ASIC相关的企业,他们已经收到这些产品并开始进行测试验证,带来的反馈都是很好的,客户觉得非常有价值。”
以各类GPT为代表的生成式AI让人们看到了智能世界的无限可能,与此同时,新一代AI技术对IT基础架构的要求也在与日俱增,使得CXL、HBM、光模块市场呈现了高速增长。其中,HBM自2013年上市以来,就被视为推动高性能和加速计算的有效途径之一,HBM是一种基于3D堆栈工艺的高性能DRAM[LJ(G1] 架构,能够实现巨大的内存带宽,尤其是HBM3与CPU整合使用之后,可以显著推动片中内存的发展,让多元的业务负载能够充分受益于共享计算、内存、存储资源融合后的内存级结构创新。
“AI应用和基础设施与內存的成长息息相关。”美光副总裁暨计算与网络事业部计算产品事业群总经理Praveen Vaidyanathan表示,“AI服务器与通用型服务器不同,其所需的內存是一般服务器的六至八倍,其中包括与CPU相连的內存,如DDR、与GPU相连的內存,如HBM,以及其他相关的內存解决方案。由于HBM能支持AI应用和服务器基础构架的成长,我们预测未来三年HBM市场将有巨大增长,年复合增长率超过50%。”
[LJ(G1]确认一下~这里是不是多了一个S
(8305800)
关键词:
相关阅读
-
基于1β制程的第二代HBM3——美光加速AI...
来源:中关村在线以各类GPT为代表的生成式AI让人们看到了智能世界的无 -
走啊,一起去拍江豚!
“碧烟芳树汉阳城,晴日江豚拜浪生。鷁转画楼帆过影,鹤归仙管笛飞... -
中报速递|保利发展上半年收入约1370亿...
8月30日,保利发展控股集团股份有限公司(简称“保利发展”)发布20... -
泰凌微新一代芯片面世
8月29日,泰凌微发布了其高性能TLSR922x系列SoC产品。TLSR922x系列SoC -
关于开展“清朗·杭州亚运会和亚残运会...
各省、自治区、直辖市党委网信办、版权局,新疆生产建设兵团党委网信办 -
一人之下:关于冯宝宝的两个胡扯
瞎胡扯开始:一 冯宝宝是八奇技的来源从目前的剧情来看,冯宝宝和无根 -
外资二季度追捧A股三大产业 新能源尤其...
【外资二季度追捧A股三大产业新能源尤其受青睐】随着上市公司半年报的 -
资金“越跌越买” 8月股票型ETF净申购...
【资金“越跌越买”8月股票型ETF净申购逼近千亿份】尽管8月以来市场... -
CCTV5直播中国男篮,APP转美网+中国女篮...
CCTV5直播中国男篮,APP转美网+中国女篮国手李梦出战WNBA+足协杯,足协 -
普利制药:司美格鲁肽原料药已完成小试开发
普利制药在互动平台表示,公司的司美格鲁肽原料药已完成小试开发,并满 -
重庆皇冠大扶梯在地铁哪个出口?
1号线两路口站-3号口出。皇冠大扶梯位于重庆市渝中区两路口中山三路107 -
神舟战神新品T8来袭,灯光更炫,实力更强
前不久神舟召开了发布会并带来新品战神T8系列游戏本,不只是配置上更加 -
37岁老将韩硕祝福易建联:榜样的力量!...
37岁老将韩硕祝福易建联:榜样的力量!祝福!,韩硕,祝福,易建联,四川男 -
天津宝坻城六区规划 明年年底前通车
天津宝坻城六区规划明年年底前通车连接北京与天津宝坻的两条城际铁路建 -
万马股份股东户数下降11.11%,户均持股1...
万马股份最新股东户数9 96万户,高于行业平均水平。公司户均持有流通股 -
农历是阴历还是阳历
阴历。农历是中国传统历法。农历取月相的变化周期即朔望月为月的长度, -
菜根谭(关于菜根谭简述)
,你们好,今天0471房产来聊聊一篇根谭,根谭简述的文章,网友们对这件 -
浙江武义公安:为群众的美好生活保驾护航
民主与法制网讯(记者傅潇潇□蒋定国通讯员李琳)自夏季治安打击整治行动 -
莎衣(关于莎衣简述)
,你们好,今天0471房产来聊聊一篇衣,衣简述的文章,网友们对这件事情 -
lenovo(a500)
来为大家解答以上问题,lenovo,a500很多人还不知道,现在让我们一起来