爱游戏-边缘AI时代已至,如何突破存储瓶颈?

[导读]“AI 一天,人世一年”,一句市场风行语完善阐释了现在AI年夜模子的高速成长和普遍利用。以人们平常利用的智妙手机为例,浩繁知名厂商在AI海潮囊括之下,紧跟AI前沿趋向,纷纭推出搭载端侧年夜模子或采取“端云协同”摆设方案的AI手机,促使手机的聪明化、智能化到达全新高度,按照市场调研机构 IDC猜测,2024年全球新一代AI手机出货量将到达1.7亿部,占智妙手机总出货量的15%,表现了AI手机在电子消费市场的广漠前景。 “AI 一天,人世一年”,一句市场风行语完善阐释了现在AI年夜模子的高速成长和普遍利用。以人们平常利用的智妙手机为例,浩繁知名厂商在AI海潮囊括之下,紧跟AI前沿趋向,纷纭推出搭载端侧年夜模子或采取“端云协同”摆设方案的AI手机,促使手机的聪明化、智能化到达全新高度,按照市场调研机构IDC猜测,2024年全球新一代AI手机出货量将到达1.7亿部,占智妙手机总出货量的15%,表现了AI手机在电子消费市场的广漠前景。 除手机范畴外,AI在各类边沿利用落地的趋向也愈发显著。自ChatGPT横空出生避世以来,短短一年多的时候,生成式AI已悄然渗入至电脑、智能家居甚至汽车等多个范畴,与千行百业延续深切融会,迸发出史无前例的立异活力与利用潜力。 释放边沿AI潜力,“存力”成要害引擎 生成式AI,特别是在处置年夜说话模子和高精度图象生成使命时,常常需要重大的存储和计较资本作为支持。好比在图象生成方面,建立高分辩率图象常常陪伴密集的卷积运算和反卷积运算,而这些运算需要高带宽、高容量的内存来撑持数据的快速传输。 是以,重大的市场机缘与成长所带来的挑战老是慎密相依,边沿装备在导入生成式AI方面仍面对着容量、带宽、能耗和散热等方面的瓶颈,这些身分深入影响并制约着边沿AI的成长。 具体而言,边沿装备导入生成式AI时凡是会晤临以下瓶颈: 存储容量限制:以LLamA2 7B年夜型说话模子为例,即使在优化至INT8精度时,也最少需要7GB的内存容量来支持其运行,而在进一步紧缩至INT4精度下,内存需求仍高达3.5GB。这意味着大都现有的边沿装备需要进行内存扩容进级,才能实现模子的当地高效运算、显著下降响应延迟; 数据传输带宽不足:当前主流AI手机遍及采取LPDDR5内存,其带宽约为68GB/s。将来LPDDR6的带宽虽有望到达150GB/s,但可能仍不足以知足高端AI利用的需求。而HBM虽机能出色,却因本钱与功耗太高,难以在边沿装备中普和利用; 能耗和散热挑战:运行复杂的生成式AI模子相较一般利用会发生年夜量计较热量。是以,边沿装备需要设计有用的能源治理和散热系统,以确保装备运行的杰出机能和不变性。 CUBE:小号“HBM”,完善弥补市场空白 今朝,AI手艺的深度拓展利用在很年夜水平上仍需要借助云端,这意味着用户的每次要求指令均需穿越收集抵达云端,才能进行复杂的处置,随后再将处置成果反馈至用户,是以云端凡是触及传输延迟、数据隐私和效益本钱方面的挑战,这年夜年夜限制了AI手艺和利用的普和广度。 与云计较偏重年夜范围数据处置分歧,边沿计较的数据处置产生在数据源或端点处,是以具有及时处置、阐发和决议计划的快速能力,可年夜幅下降传输延迟性,契合复杂多变的情况和使命处置。是以边沿AI市场也催生了对中低容量、超高带宽和低功耗内存解决方案的需求,而且生成式AI的呈现也让存储行业催生了新的成长机缘——定制化的存储需求利用而生,这首要基在两年夜缘由: 市场缺少兼具本钱效益与高机能的方案:今朝的HBM3E带宽可达1.2TB/s,但功耗太高;固然LPDDR6带宽将来有望跨越150GB/s,但在这两者之间缺少既能有用节制本钱,又能知足边沿装备高机能需求的抱负内存解决方案; 末级缓存(Last Level Cache):跟着半导体系体例程不竭向7nm以下推动,SRAM微缩效益不再较着,而且AI运算使其容量需求增添,高容量SRAM占有年夜面积进一步致使本钱快速升高。是以,市场上亟需可以或许削减SRAM占用面积,下降整体本钱的高效解决方案。 为知足日趋增加的边沿AI市场需求,助推其高效立异成长,华邦专门推出CUBE(半定制化超高带宽元件)产物,年夜幅优化内存手艺,可实此刻夹杂云与边沿云利用中运行生成式 AI 的机能,为边沿AI量身定制完善的内存解决方案。与市道上现有方案比拟,CUBE 的中小容量超高带宽的特点极具差别化,合用在机械人、可穿着装备、边沿办事器等多种高级利用。 CUBE在功耗、机能、尺寸设计和带宽等范畴具有出色特征,全方位知足边沿AI的成长需求。在带宽方面,CUBE可以或许到达 256GB/s – 1TB/s,相当在 HBM2或4-32 个 LPDDR4x 4266Mbps x16 IO;而且,CUBE的功耗低在 1pJ/bit,在供给超高带宽的同时还可极年夜削减能源耗损。另外,经由过程立异性TSV 手艺和 uBump/ 夹杂键合,CUBE可下降功耗并节流 江南体育SoC 设计面积,从而实现高效且极具本钱效益的解决方案。 整体而言,CUBE 凭仗更高的带宽、更高的能效、更快的响应时候、可定制化特征和紧凑外形,在释放 AI利用潜力方面阐扬主要感化,可以或许让壮大的 AI 从云落地至边沿装备和夹杂云利用中。 跟着生成式AI不竭向边沿端演变,分歧利用场景下的边沿端产物数据传输量爬升,并催生出对低功耗、高带宽存储产物的火急需求,这一系列新趋向为存储市场斥地了广漠的成长空间。作为深耕存储行业的带领厂商之一,华邦秉承不懈立异、不断改进的成长理念,延续开辟用在终端产物特定利用的DDR4/LPDDR4,另外,华邦还致力在研发定制化超高带宽内存解决方案,联袂OSAT(半导体封装测试)火伴为边沿装备SoC带来抱负的中小容量超高带宽内存,配合摸索内存手艺的立异前沿,鞭策边沿AI实现更高效、更蓬勃的成长。

欲知详情,请下载word文档 下载文档

7月24日,第十七届英特尔收集与边沿计较行业年夜会在天津进行,跨越400位生态火伴和客户代表齐聚一堂,与英特尔配合切磋边沿AI的将来成长趋向,并介绍了浩繁基在英特尔边沿AI解决方案,在教育、智能制造等垂直范畴的最新出色利用...

要害字: Intel 边沿AI

周全现货供给、供给快速交付的全球电子元器件和主动化产物分销商 DigiKey 今天公布与 Kingston Technology(金士顿)合作,向全球分销其内存产物和存储解决方案。

要害字: 内存 存储

Jun. 25, 2024 ---- 全球市场研究机构TrendForce集邦咨询不雅察,2024年年夜型云端CSPs,如Microsoft、Google、Meta、AWS等厂商,将仍为采购高阶主打练习用AI server的...

要害字: DRAM 边沿AI

上一篇:爱游戏-IBM 发布《2024年数据泄露成本报告》:企业数据泄露成本创新高,AI和自动化成为"数据保卫战"突破口 下一篇:爱游戏-梦想之车,造就真实: AUTOMOBILI PININFARINA在蒙特利汽车周首次亮相由客户亲手打造的赛车杰作