美国AI创企设计高效、低成本芯片,抢占英伟达份额
曾为英特尔、AMD和特斯拉工作的芯片设计师Jim Keller正试图通过设计比英伟达更高效的芯片来降低人工智能(AI)应用的价格,以期夺取部分市场份额。
Jim Keller现在是美国一家设计AI芯片的初创公司Tenstorrent的CEO,他在芯片设计圈以担任过AMD Zen系列首席设计师而闻名,许多人认为,在2010年代后期AMD努力跟上英特尔的步伐后,该系列将支持AMD东山再起。他也是开发特斯拉自动驾驶软件Autopilot芯片的领军人物。“他简直就是一个传奇人物。”日本AI独角兽Preferred Networks的芯片设计负责人Junichiro Makino说。
Jim Keller表示,随着AI的应用扩展到智能手机、电动汽车和云服务,越来越多的公司正在寻找更便宜的解决方案,并补充说“英伟达在很多市场上表现不佳,很多小公司不愿意为英伟达的高端图形处理单元(GPU)支付2万美元”,而英伟达GPU被视为市场上最好的选择。
Tenstorrent成立于2016年,正准备在2024年底出售其第二代多用途AI芯片。该公司表示,在某些领域,它拥有比英伟达的AI GPU 更好的能效和处理效率。据Tenstorrent称,其Galaxy系统比英伟达的DGX(AI服务器)效率高出三倍,价格便宜33%。
Jim Keller表示,这种情况可能出现的原因是该公司将不使用高带宽存储器(HBM),这是一种流行的先进存储芯片,能够快速传输大量数据。HBM是生成式AI芯片的重要组成部分,在英伟达产品的成功中发挥了重要作用。然而,HBM也是AI芯片能耗巨大、价格高昂的罪魁祸首之一。
“即使是使用HBM的厂商,也在为它的成本和设计时间而苦苦挣扎。”Jim Keller表示,并补充说他做出了不使用这项技术的决定。
在典型的AI芯片中,每次执行一个过程时,GPU都会将数据发送到内存。这需要HBM的高速数据传输能力。然而,Tenstorrent专门设计其芯片,以大幅减少此类传输。
Jim Keller表示,通过这种新方法,公司的芯片设计可以在AI开发的某些领域取代GPU和HBM。
他说,该公司还在设计其产品,使其“尽可能具有成本效益”。他补充说,该领域的许多其他公司也在寻找更好的存储解决方案,但他更谨慎地承认,要颠覆“庞大”的现有HBM行业需要数年时间。
Jim Keller预测,不会有一家公司取代英伟达,而是会有更多新玩家出现,填补这家美国公司尚未服务的各种AI市场。
Tentorrent芯片的主要特点是其100多个内核中的每个内核都有小型CPU,即“大脑中的大脑”。
通常,单个芯片内核只有一个小型计算器和内存,只负责解决单个给定任务。然而,Tenstorrent芯片的内核将能够自行“思考”,决定先处理哪些数据,或者是否放弃某些被认为不必要的任务,从而提高整体效率。
Tentorrent表示,由于每个内核都相对独立,因此可以通过堆叠更多或更少的内核来适应更广泛的应用。例如,少量内核的芯片足以用于智能手机或可穿戴设备,而100颗芯片可以组合起来用于AI数据中心。
这种灵活性很重要,因为AI如何开发以及未来的用途仍是悬而未决的问题。
Jim Keller说,不可能预测出AI最佳应用是什么。“我今天无法判断这个数字是会更大还是更小。所以我们的策略是打造一种适合各种产品的技术。”他说。(校对/张杰)