芯片的下一步是什么

芯片的下一步是什么

大型科技公司、初创公司、人工智能设备和贸易战将如何改变芯片的制造方式及其驱动的技术。

《麻省理工学院技术评论》的“下一步是什么”系列着眼于各个行业、趋势和技术,让您对未来有一个初步的了解。您可以在这里阅读其余内容 

由于人工智能的蓬勃发展,芯片世界正处于巨大潮流转变的风口浪尖。人们对芯片的需求不断增加,这些芯片可以更快地训练人工智能模型,并从智能手机和卫星等设备上对它们进行 ping 操作,使我们能够在不泄露私人数据的情况下使用这些模型。各国政府、科技巨头和初创企业都在竞相在不断增长的半导体市场中分得一杯羹。 

以下是未来一年需要关注的四个趋势,它们将定义未来芯片的外观、制造商以及它们将解锁哪些新技术。

CHIPS 在世界各地开展活动

在菲尼克斯郊区,全球最大的两家芯片制造商台积电和英特尔正在竞相在沙漠中建设园区,希望这些园区能够成为美国芯片制造实力的所在地。这些努力的一个共同点是资金:3 月份,乔·拜登总统宣布为英特尔在全国范围内的扩张提供 85 亿美元的直接联邦资金和 110 亿美元的贷款。几周后,台积电又宣布获得 66 亿美元的投资。 

这些奖项只是美国通过 2022 年签署的 2800 亿美元芯片和科学法案涌入芯片行业的补贴的一部分。这笔资金意味着任何涉足半导体生态系统的公司都在分析如何重组其供应链以受益从现金中。虽然大部分资金旨在促进美国芯片制造,但其他参与者(从设备制造商到利基材料初创公司)仍有申请的空间。

但美国并不是唯一一个试图将部分芯片制造供应链本土化的国家。日本自己花费了 130 亿美元,相当于《芯片法案》,欧洲将花费超过 470 亿美元,今年早些时候,印度宣布斥资 150 亿美元建设本地芯片工厂。塔夫茨大学教授、 《芯片战争:争夺世界最关键技术之战》一书的作者 Chris Miller 表示,这一趋势的根源可以追溯到 2014 年。从那时起,中国开始向其芯片制造商提供巨额补贴。 

克里斯·米勒 (Chris Miller) 的《芯片战争:争夺世界上最关键技术》的封面

“这造成了一种动态,其他政府得出结论,他们别无选择,只能提供激励措施或看到企业将制造业转移到中国,”他说。这种威胁,加上人工智能的激增,导致西方政府为替代方案提供资金。明年,这可能会产生滚雪球效应,更多国家因担心落后而启动自己的计划。

米勒表示,这笔资金不太可能催生全新的芯片竞争对手,也不太可能从根本上重组最大的芯片厂商。相反,它将主要激励像台积电这样的主导企业在多个国家扎根。但光靠资金还不足以迅速做到这一点——台积电在亚利桑那州建厂的努力陷入了错过最后期限和劳资纠纷的泥潭,而英特尔也同样未能满足其承诺的最后期限。目前尚不清楚,无论何时这些工厂投产,其设备和劳动力是否能够达到这些公司在国外的先进芯片制造水平。

米勒表示:“供应链只会在数年甚至数十年内缓慢转变。” “但情况正在发生变化。”

更多边缘人工智能

目前,我们与 ChatGPT 等 AI 模型的大部分交互都是通过云完成的。这意味着,当您要求 GPT 挑选一套衣服(或成为您的男朋友)时,您的请求会 ping OpenAI 的服务器,提示其中的模型处理该请求并得出结论(称为“推理”),然后再发回响应给你。依赖云有一些缺点:一方面,它需要互联网访问,而且还意味着您的一些数据会与模型制作者共享。  

这就是为什么人们对人工智能边缘计算产生了很大的兴趣和投资,其中 ping 人工智能模型的过程直接发生在您的设备上,例如笔记本电脑或智能手机。随着行业越来越致力于人工智能模型对我们了解很多的未来(萨姆·奥尔特曼向我描述他的杀手级人工智能应用程序,它“绝对了解我一生的一切,我的每封电子邮件,我曾经进行过的每一次对话”) ),需要更快的“边缘”芯片,可以在不共享私人数据的情况下运行模型。这些芯片面临着与数据中心芯片不同的限制:它们通常必须更小、更便宜、更节能。 

美国国防部正在资助大量针对快速、私有边缘计算的研究。今年 3 月,其研究部门国防高级研究计划局 (DARPA) 宣布与芯片制造商 EnCharge AI 合作,打造一款用于人工智能推理的超强大边缘计算芯片。 EnCharge AI 正在致力于制造一款能够增强隐私性但运行功耗极低的芯片。这将使其适用于卫星和离网监视设备等军事应用。该公司预计将于 2025 年发货这些芯片。

人工智能模型将始终依赖云来实现某些应用程序,但新的投资和对改进边缘计算的兴趣可以为我们的日常设备带来更快的芯片,从而带来更多的人工智能。如果边缘芯片变得足够小且足够便宜,我们可能会在家庭和工作场所看到更多人工智能驱动的“智能设备”。如今,人工智能模型主要局限于数据中心。

EnCharge AI 联合创始人 Naveen Verma 表示:“我们在数据中心遇到的许多挑战都将得到克服。” “我预计人们会重点关注边缘领域。我认为这对于大规模实现人工智能至关重要。”

大型科技公司加入芯片制造领域

在从快时尚到草坪护理等行业中,公司正在支付高昂的计算成本来为其业务创建和训练人工智能模型。例如,员工可以用来扫描和汇总文档的模型,以及虚拟代理等面向外部的技术,可以引导您修复损坏的冰箱。这意味着对云计算来训练这些模型的需求正在急剧增加。 

提供大部分计算能力的公司是亚马逊、微软和谷歌。多年来,这些科技巨头一直梦想通过为自己的数据中心制造芯片来提高利润率,而不是从像英伟达这样的公司购买芯片,英伟达是一家几乎垄断最先进人工智能训练芯片、价值超过 GDP 的巨头。 183 个国家。 

亚马逊于 2015 年开始努力,收购了初创公司 Annapurna Labs。谷歌在 2018 年推出了自己的芯片 TPU。微软于 11 月推出了首款人工智能芯片,Meta 于 4 月推出了新版本的自家人工智能训练芯片。

这种趋势可能会让英伟达失去优势。但在大型科技公司眼中,英伟达不仅扮演着竞争对手的角色:无论云巨头内部如何努力,他们的数据中心仍然需要英伟达的芯片。部分原因是他们自己的芯片制造工作无法满足他们的所有需求,但也是因为他们的客户希望能够使用顶级的 Nvidia 芯片。

“这实际上是为了给客户提供选择,”微软 Azure 硬件工作负责人 Rani Borkar 说。她表示,她无法想象微软为其云服务提供所有芯片的未来:“我们将继续保持强有力的合作伙伴关系,并部署来自与我们合作的所有芯片合作伙伴的芯片。”

当云计算巨头试图从芯片制造商手中夺取一些市场份额时,英伟达也在尝试相反的做法。去年,该公司推出了自己的云服务,这样客户就可以绕过亚马逊、谷歌或微软,直接在 Nvidia 芯片上获得计算时间。随着市场份额争夺战的展开,未来的一年将关乎客户是否将大型科技公司的芯片视为类似于英伟达最先进的芯片,还是更像他们的小表弟。 

英伟达与初创公司的较量 

尽管英伟达占据主导地位,但仍有一波投资流向初创公司,这些初创公司旨在未来芯片市场的某些领域超越英伟达。这些初创公司都承诺提供更快的人工智能训练,但对于哪种华丽的计算技术能够实现这一目标,从量子到光子学再到可逆计算,他们有不同的想法。 

但 28 岁的 Murat Onen 是这样一家芯片初创公司Eva的创始人,他在麻省理工学院攻读博士学位后创办了这家芯片公司,他直言不讳地谈到了现在创办一家芯片公司的感受。

“Nvidia 是山中之王,这就是我们生活的世界,”他说。

许多这样的公司,如 SambaNova、Cerebras 和 Graphcore,都在试图改变芯片的底层架构。想象一下,AI 加速器芯片必须不断地在不同区域之间来回移动数据:一条信息存储在内存区,但必须移动到处理区,在那里进行计算,然后再存储回内存区进行安全保管。所有这些都需要时间和精力。 

提高这一过程的效率将为客户提供更快、更便宜的人工智能培训,但前提是芯片制造商拥有足够好的软件来允许人工智能培训公司无缝过渡到新芯片。如果软件转型过于笨拙,OpenAI、Anthropic 和 Mistral 等模型制造商可能会坚持使用大牌芯片制造商。这意味着采用这种方法的公司(如 SambaNova)不仅将大量时间花在芯片设计上但在软件设计上也是如此。

Onen 提议进行更深层次的变革。他没有使用传统晶体管,几十年来,传统晶体管通过变得越来越小而提供了更高的效率,而是使用了一种名为质子门控晶体管的新组件,他说 Eva 是专门为人工智能训练的数学需求而设计的。它允许设备在同一位置存储和处理数据,从而节省时间和计算能源。使用此类组件进行人工智能推理的想法可以追溯到 20 世纪 60 年代,但研究人员永远无法弄清楚如何将其用于人工智能训练,部分原因是材料障碍——它需要一种材料,除其他品质外,能够精确地控制室温下的电导率。 

有一天,在实验室,“通过优化这些数字,并且非常幸运,我们得到了我们想要的材料,”奥南说。 “突然之间,这个设备就不再是一个科学博览会项目了。”这提高了大规模使用此类组件的可能性。经过几个月的努力确认数据正确后,他创立了 Eva,该成果发表科学》杂志上。

但在这个领域,许多创始人都承诺要推翻领先芯片制造商的主导地位,但都失败了,奥南坦言,他还需要数年时间才能知道设计是否按预期工作以及制造商是否会同意生产它。 。他说,领导一家公司克服这种不确定性需要灵活性和接受他人怀疑的胃口。

“我认为有时人们对自己的想法过于执着,然后就会感到不安全,因为如果这种想法消失,接下来就不会再有任何事情了,”他说。 “我不认为我有这样的感觉。我仍在寻找有人挑战我们并说这是错误的。”