如 Synced上所写: https://syncedreview.com/2017/11/21/makers-put-their-specialized-ai-chips-on-the-table/

制造商展现专用的AI芯片

就像砖砌房屋一样,芯片是任何计算机系统必不可少的组成部分。但是,迄今为止,已经使AI发生了革命性变化的卷积神经网络(CNN)使用了最初用于其他目的的大杂烩芯片构建而成。为了提高CNN的性能,行业领导者和新兴公司都在竞相开发专用的AI芯片。

GPU首次出现在2012年的CNN中,当时AI研究人员半发现它的并行计算能力使它们适合AI任务。领先的GPU制造商Nvidia通过其最新版本Tensor V100突破了GPU的极限,Tensor V100被普遍认为是改变游戏规则的人。但是GPU恰恰是这个名称所宣传的:图形处理单元,设计用于基于图形的矢量任务,而不是用于CNN。

尽管GPU仍然是当今AI计算的首选,但它们是否是未来?可能不是。 Facebook AI研究负责人Yann LeCun最近表示,“还有更多的空间可以使用更加专业的芯片,从而提高效率。”

例如,移动AI芯片专门用于在智能手机上运行AI应用程序,而智能手机以前必须连接到云服务器才能执行AI应用程序所需的高级任务。华为和苹果今年9月将这种AI芯片整合到了他们的手机中

苹果的A11仿生芯片包括一个神经引擎,可启用Face ID或Animoji等功能。该公司称赞A11为“智能手机中最强大,最智能的芯片。”同时,华为最新的SoC(片上系统)麒麟970还具有神经处理单元,使其比顶级移动CPU更快,更节能。

麒麟970由中国独角兽Cambricon的技术支持,该公司生产用于云服务器,移动设备,计算机视觉应用程序和自动驾驶的AI芯片。该公司最近在其A轮融资中筹集了惊人的1亿美元。

其他许多AI初创公司也将重点放在用于相机,家用电器和移动平板电脑等设备的AI嵌入式芯片上,其中大多数将在未来五到十年内变得智能化。赌注很高,去年英特尔以约4亿美元的价格收购了设备芯片制造商Movidius(未披露价格)。

智能芯片公司现在正在针对特定目的(例如深度学习或神经网络)量身定制其设计。硅谷芯片初创公司Gyrfalcon联合创始人弗兰克·林(Frank Lin)说:“以旨在识别人脸的监控摄像机为例,它只需要基于CNN的AI芯片。” 9月,该公司发布了首款专用AI芯片Lightspeeur 2801S神经处理器,该芯片结合了高性能和令人印象深刻的9.3 TOPS / Watt的能效等级。

Lightspeeur集成了28,000个并行计算核心和一个新架构,该架构可加速内存中的AI,直接消除数据移动-这是其他架构中的一个步骤,需要消耗大量功率,否则会导致过热。

过热是阻碍AI芯片开发的问题。您可以构建一个大型系统来冷却云服务器,但这无法在嵌入式设备的AI规模上发挥作用。” Lin说。

Lightspeeur支持CNN,RNN和LSTM,尤其适用于CNN,因为它在运行142帧/秒(224 * 224 * 3)图像时在50 MHZ时仅消耗0.3瓦。

Nov-21-2017 14-55-59 (1).gif
Lightspeeur的测试视频,运行142帧/秒(224 * 224 * 3)图像。

与此同时,在麻省理工学院,一个名为Eyeriss的项目正在使用另一种方法应对过热挑战。 他们的高能效深层CNN芯片具有由可重新配置的片上多播网络馈送的168个处理元件的空间阵列,可通过利用数据复用来最大程度地减少数据移动。 数据门控和压缩用于减少能耗。 该芯片可以在AlexNet中以35 fps的速度运行CNN,功耗为278兆瓦,比移动GPU的能源效率高10倍。

尽管专用AI芯片的广泛实施尚需时日,但没有一家芯片制造商愿意在争取实现这一目标的竞争中落伍。 自动驾驶公司AutoX的创始人肖剑雄说:“使用通用芯片只是浪费资源。 如果专门使用ASIC(专用集成电路)或FPGA(现场可编程门阵列)芯片进行卷积运算,结果将更好。”