吉姆·凯勒(左)与小池淳义握手(11月,美国圣何塞市)
“一家企业持续垄断市场是不可能的”,美国d-Matrix的CEO针对GPU表示。从该公司AI半导体“Corsair”来看,相同成本的运算量是英伟达主力GPU的13倍以上,速度是9倍以上。加拿大Tenstorrent也致力于改善GPU的节电性能等……
在半导体领域,探索作为生成式AI(人工智能)运算基础的图形处理器(GPU)的替代技术的动向正在加强。这是因为GPU原本是面向游戏而发展的,存在电力消耗大的课题。加拿大和美国的新兴企业开发出适合生成式AI的半导体,向GPU领域约占80%份额的美国英伟达发起挑战。
“希望成为第一个客户”,力争在日本代工最尖端半导体的日本Rapidus的社长小池淳义于11月宣布,作为开拓客户的第一步,将与设计开发AI半导体的加拿大Tenstorrent展开合作。在美国圣何塞市的联合记者招待会上送出秋波的是Tenstorrent的首席执行官(CEO)吉姆·凯勒。
凯勒先后任职于苹果、特斯拉和AMD等美国企业,在各家企业参与了主力半导体的设计。在硅谷被称为“传说中的半导体工程师”。小池强调称“被他选中在行业内具有重大意义”。
Rapidus计划加深与无厂企业Tenstorrent的关系,在2025年投产的北海道千岁市的工厂承接后者设计开发的AI半导体的生产。希望重现过去英伟达和最大的半导体代工企业台积电(TSMC)借助分工体制取得的飞跃。
GPU有“弱点”
崇拜凯勒的技术人员陆续从大企业转移到2016年成立的Tenstorrent,目前该公司有350名员工负责开发专门针对AI的半导体。2023年从韩国三星电子旗下的投资基金和现代汽车集团等成功筹集了1亿美元资金。
对于英伟达具备优势的GPU,凯勒断言称“不是为AI而设计的”。英伟达的GPU虽然擅长大量数据的并行处理,但原本是面向游戏处理超高清图像而开发的,要嵌入作为生成式AI基础的数据中心的服务器,存在很多弱点。
最大的问题是电力效率低下。由于在芯片上负责运算的运算器和存储信息的存储器相互分离,GPU在数据交换方面耗费大量电力,而不是运算本身。有估算称,被认为使用数万个英伟达GPU的生成式AI“ChatGPT”每天的电费等运营成本按日元换算达到1亿日元。
Tenstorrent正在开发的AI半导体通过让运算器和存储器位置靠近,缩短了数据的移动距离,减少了电力浪费。凯勒比喻称,“在AI中,就像运算器相互对话一样,将运算结果直接传递到下一个运算是很自然的事情”。
英伟达在决定半导体运行的“指令集”上使用英国ARM的技术,而Tenstorrent则采用了任何人都可以免费使用和修改的开源的“RISC-V”。目的在于控制授权费支出,同时也方便根据客户的需求灵活变更半导体的设计。
凯勒表示,“对于想要开发价值数百万日元的机器人的企业来说,数百万日元的GPU就太贵了”。该公司正力争开发除了节电性能之外、在价格方面也足以对抗英伟达的新一代AI半导体。
通过存储器运算
目前生成式AI 处于发展阶段,开发企业将大部分运算资源用在提高精度的“学习”上。今后,随着ChatGPT等各种服务进入全面普及期,AI输出问题答案等“推理”的运算所消耗的电力比重或将提高。还出现了专注于这一推理领域、致力于改善GPU课题的初创企业。
美国英特尔出身的CEO Sid Sheth等人在2019年设立的d-Matrix就是其中之一。该公司提出的目标是,使用一种让存储器具备运算功能的“内存运算”技术,大幅减少数据中心的服务器在推理运算中消耗的电力。
从该公司将于2024年开始供货的AI半导体“Corsair”来看,相同成本的运算量是英伟达主力GPU的13倍以上,运算速度是9倍以上。d-Matrix 的Sid Sheth预测称,“在有的用途上,GPU的性能过高”。他预测称“一家企业持续垄断市场是不可能的”。
在d-Matrix涉足的内存运算领域,美国OpenAI的CEO山姆·奥特曼以个人身份出资的2017年设立的美国Rain AI也被认为很有竞争力。美国媒体报道称,Rain AI有可能负责向OpenAI供应半导体。
由于生成式AI热潮,GPU的需求非常紧张,价格一直居高不下。英伟达2023年8~10月的营业利润率达到半导体相关领域罕见的57%。据分析,该公司以市场支配力为基础,在价格上增加了很大的利润空间,这是生成式AI的开发成本上升的主要原因。
一直依赖英伟达GPU的生成式AI开发企业也越来越关注替代技术。2023年,美国微软旗下的风险投资公司与新加坡主权财富基金等一起向d-Matrix投资了1.1亿美元。Sid Sheth表示,除了微软之外,美国Meta也已经启动初期的产品评估,有意在自己的生成式AI上采用。
继美国谷歌先于其他企业在2016年发布自主开发的AI半导体之后,微软最近也自主设计了最适合ChatGPT等运行的半导体。美国亚马逊也在11月推出了专门面向AI学习的新型半导体。
被追赶的英伟达将努力巩固领先地位。2023年冬季,该公司CEO黄仁勋参加了美国亚马逊网络服务(AWS)等云技术企业的技术活动,向汇聚一堂的技术人员等推销了将于2024年投入使用的新型GPU。
美国调查公司Gartner预测称,AI半导体的市场规模到2027年将扩大到1194亿美元,达到2022年的2.7倍。凭借现有技术掌握主导权的英伟达与试图通过技术创新瓦解该公司大本营的新势力之间的攻防战将日趋激烈。
本文来自微信公众号“日经中文网”(ID:rijingzhongwenwang),作者:山田辽太郎