原文源于 ZDNet:https://www.zdnet.com/google-amp/article/ai-startup-gyrfalcon-spins-plethora-of-chips-for-machine-learning/

人工智能初创公司Gyrfalcon研发了大量用于机器学习的芯片

一个有30年历史的定制人工智能芯片的想法终于在硅谷的初创公司Gyrfalcon中得到了实现,该公司吸引了三星等大客户,并且正在快速推出多个版本的芯片。

30年前,加州大学伯克利分校的一名博士生Lin Yang想到了一种特殊的芯片,该芯片可以加快人工智能的计算速度。

可以将其视为一个三十年的开端。

如今,其中一些见解已成为现实,因为Yang的初创公司 Gyrfalcon Technology(他担任首席科学家)通过为AI提供一系列雄心勃勃的不同芯片产品,希望在竞争日益激烈的芯片竞争者中脱颖而出。

Gyrfalcon总部位于硅谷边缘的米尔皮塔斯(Milpitas),成立于2017年初,正在实现Yang在30年前的见解:由相同电路组成的矩阵并行执行矩阵乘法,从而加快了神经网络的基本操作。

Gyrfalcon总裁Frank Lin说:“我们是唯一以矩阵乘法作为基本计算元素而走到这一步的人。”

Lin清楚地意识到,许多新兴公司都在夸耀AI的新颖半导体设计,例如ZDNet最近介绍的那些,包括 CornamiFlex LogixEfinix

Lin说:“其他芯片制造商,其中一些正在考虑采用矩阵或张量的新架构,但是Gyrfalcon在一月份已向其客户提供了第一批芯片。对于真正的芯片,我们是唯一一家有真正芯片的公司。”

一些主要客户打赌Gyrfalcon将提供他们需要的商品,包括三星电子,LG电子和富士通。

“我们刚开始时只有7个人,” Gyrfalcon的营销主管Marc Naddell补充道,“想象一下,只有一小部分人专注于在开始使用后的八个月内挖掘芯片。” Naddell和Lin都强调,Gyrfalcon是三星唯一的AI芯片合作伙伴。

他说:“我们确实拥有成功的第一款芯片,这就是为什么这样一家年轻的小公司赢得了三星的大标志”。

该公司零件的关键在于它的能源效率超过了英特尔(Intel)传统cpu和英伟达(Nvidia) gpu的性能。“我们是大卫要与歌利亚抗衡,”林说。

“ Lightspeeur”作为公司零件的商标,始于今年1月在美国消费电子展上亮相的“2801”芯片,该零件用于“7机器学习的一部分。神经网络使用它在训练阶段学到的知识来为新问题提供答案。该部分针对的是智能手机、智能扬声器或笔记本电脑等“前沿”设备。

Gyrfalcon认为,通过在每个相同的计算单元周围放置内存,一种被称为“内存中的人工智能处理”(AI Processing in memory,简称APiM)的方法,可以大大减少外部内存的使用,从而大幅降低人工智能芯片的功耗预算。

2801提供了以一瓦特的能量每秒计算9.3万亿次运算的能力,其中每个运算都是一个乘法累积的步骤。如今,此类“ TOPS”测量是AI芯片中能效的常见表达。

Lin说,它“比Intel的Movidius部件高90%的能效”,指的是Intel收购同名公司时获得的推理芯片。

继2801之后,上个月又推出了“ 2803”  ,该产品旨在云服务器中处理更重的推理负载。它进一步提高了性能和能耗优势,每瓦能源可提供24 TOPS的能量。Gyrfalcon提出2803不仅可用于推理,而且还可用于训练,它使用一种称为“Markov Chain Monte Carlo”的技术来优化网络,以代替更常见的随机梯度下降。

2801和2803都可以组合在电路板上,以通过PCIe作为插接板并行运行。

这两部分均具有嵌入式存储器,2801的内存约为9兆字节。存储器与每个计算元件集成在一起,使芯片可以执行几乎所有的推理工作,而不必从芯片外转移到DRAM。该公司将其称为“内存中的AI处理”或“ APiM”。

林说:“我只需一次将网络模型、权重和激活单元预加载到芯片上,然后就不必出门了;这样可以节省很多能源,这就是为什么性能如此之高的原因。”

而在本月,该公司在下一阶段中给出了一个高峰,其重点是“物联网”应用,直到下个月才正式宣布。最新的部件2802为该表带来了另一个有趣的方面:​​非易失性存储器。

2802用“磁性” RAM或MRAM代替了2801和2803部件中使用的静态RAM(SRAM)。与NAND闪存类似,断电时MRAM不会丢失其数据。这意味着,一个神经网络可以由客户预先加载,甚至可能在工厂,在零件装运之前。

Gyrfalcon公司正在处理的50项专利申请中,有一项是在与增压器-累加器单元相同的芯片上制造MRAM的方法。 快速搜索美国专利局的申请数据库,以及在授予专利权,就能找到有关Gyrfalcon技术的详细信息。(伯克利 在1992年与他的主管Leon Chua一起获得了Yang的原始芯片设计的专利。顺便说一下,Chua在该领域的广泛工作可以在许多领域进行探索,包括Chua在1998年出版的著作《Cnn: A Paradigm for Complexity.》)

当然,关键是软件。与CPU和GPU不同,Gyrfalcon的专用集成电路(ASIC)没有现成的编程堆栈。