Arm为何采用Helium技术而不用Neon?.docx
《Arm为何采用Helium技术而不用Neon?.docx》由会员分享,可在线阅读,更多相关《Arm为何采用Helium技术而不用Neon?.docx(7页珍藏版)》请在第壹文秘上搜索。
1、首先,我们需要了解HC1.iUm、Neon是什么?He1.ium是针对ArmCortex-M处理器系列的一种架构延伸,特别是为小型低功耗嵌入式系统提供高效的信号处理效般,它针对区域与电力诳行优化,为M系列架构带来了类似于针对Cortex-A的S1.MD指令的能力,这使其成为应对音讯装置、感测岩中板设备、关键字识别、语音命令控制等运算挑战的理想选择。Neon是Arm架构中的一种S1.i(D(单指令多数据)技术,主要用了加速多媒体和信号处理等密集型计算任务,它特别适合处理大量数据并行的场景,如图像处理、视频编码解码等.Arm为何采用HeIiUm技术,而不用Neon?经过Arm研究团队多年的不懈努力
2、,Ar于2019年推出了适用于Ar三v8-M架构的AraCortex-M矢量犷展技术(MYE)ArmHe1.iua技术.起初,当我们面临Cortex-M处理的数字信号处理(DSP)性能竣待提升的需求时,我们首先想到的是采用现有的Neon技术。然而,面对典型的Cortex-M应用的面枳限制条件下乂需要支持多个性能的需求,意味苕我们仍需从头开始。作为一种较轻的情性气体,以氮气(He1.ium)作为研究项目的名称似乎再合适不过了.该研究项目主要针对中端处理器,旨在实现数据路径宽度增加两倍的情况下将性能提高四倍,而这正与氮气的原子量(4)和取子序数(2)不谋而合.最终,在许多数字信号处理(DSP)和机
3、器学习(M1.)内核上,我们成功地实现了提升四倍的目标。毋嗨置疑,“He1.ium”已经深入人心,成为Cortex-M处理器系列MVE的品牌名。要想打造具备R好DSP性能的处理器,主要关键在于可为其提供足够的数据处理带宽.在Cortex-A处理器上,128位Neon负枚可以轻松地从数据馈存中直接提取。但是,Cortex-M处理器通常没有缓存,而是使用低延迟静态随机存取存储器(SRAM)作为主内存。对于许多系统来说,无法将SRAM路径(通常只有32位)拓宽到128位,因此导致面临内存搽作停滞长达四个周期的可能性.同样,乘加(MAC)指令中使用的乘法器需要很大的面积,在小型Cortex-M处理上使
4、用四个32位唳法洪是不切实际的.就面积限制层面而言,嫌小的Cortex-M处理器与能够乱汴执行指令11.功能强大的Cortex-A处理战的大小可能相差几个数我级.因此,在创建M系列架构时,我们必须认其考虑充分利用每一个gate.为了充分利用现有硬件,我们需要确保高成本资源(如通往内存的连接和乘法器)在每个周期都保持同时繁忙的状态.在高性能处理器(如Corte-M7)Jt,可以通过矢量HAC双发射来达成这一目标”此外,还有一个Ifi要的目标,即在一系列不同的产品上提高DSP性能,而不仅局限于麻端产品上。想要解决以上这些问即,露要借器参考几十年前的矢做链理念中的一些技术,V1.DRVM1.AV1.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Arm 为何 采用 Helium 技术 不用 Neon
