“现在错过就来不及了”……崔泰源会长、黄仁勋押注的”AI工厂”详解

Photo of author

By Global Team

“AI工厂(AI Factory)”是把电力和数据输入进去,大量“生产”作为AI输出结果的“代币(token)”的下一代数据中心。这个概念是把它比作用原料制造产品的工厂。

如果说传统数据中心只是存储和传输数据的仓库,那么AI工厂就是把数据转化为“智能”这一高附加值产品的数字化生产基地。

由于激增的AI需求,通用数据中心已难以应对,因此需要把GPU、高性能存储器、电力和网络整体打包、为AI量身定制的设施。

决定胜负的核心是电力。它需要的是城市级耗电量的吉瓦(GW)级设施,‘每单位电力产出多少代币’将决定竞争力。

AI工厂与“AI主权”密切相关。与英伟达合作的SK、三星、现代汽车、Naver等企业已开始在韩国建设,首个设施目标是于2027年投入运行。SK还计划在2028年至2029年间在日本建设AI工厂。

最先映入眼帘的是这个陌生的名字。AI工厂到底是什么,竟然值得从韩国一路建到日本去?崔泰源会长将其解释为“生产AI核心单位——代币的工厂”。也就是说,这是把SK的存储半导体与英伟达的图形处理器(GPU)结合起来,高效处理海量数据的设施。

把这一概念推广到全球的人是英伟达首席执行官黄仁勋。他一直把下一代数据中心称为“AI工厂”,强调存储数据的仓库将转变为不断生产名为代币的高价值产品的工厂。就在8日访韩时,他也接连宣布了与SK、LG、现代汽车、Naver、斗山等韩国5家企业合作建设AI工厂的计划。

那么,AI工厂到底是什么?为什么现在企业无论在韩国还是日本都要建设这种设施?不妨以工厂作比,逐一拆解。

要理解AI工厂,首先要看传统数据中心。数据中心是存储和传递照片、视频、文档等信息的巨大仓库。通过即时通讯发送的照片被保存在某处,搜索结果能瞬间出现,也都得益于这类设施。

AI工厂则更进一步。它不只是堆放信息,而是把数据和电力作为原料,生产出“智能”这一结果。黄仁勋曾将其形容为:存储数据的仓库,正在变成不断生产“代币”这一高价值商品的工厂。

这里的关键就是代币。代币指的是AI处理语言时最小的单位。“我喜欢你”这句话在AI内部会被拆分成“我”“喜欢”“你”等代币。AI通过逐个预测这些片段来生成句子。代币生产得越多、越快,就能输出更多回答、分析、图像和代码。

如果把它比作工厂,画面就更清楚了。汽车工厂把钢板和零部件投入后生产出整车,AI工厂则把数据和电力投入后生产出代币。原料是数据和电力,制成品则是AI输出的智能。

驱动这座工厂的设备也不同于普通数据中心。核心是图形处理器(GPU)。这类原本用于渲染游戏画面的芯片,擅长同时处理大量相同运算,因此成为AI的大脑。

在它旁边的是高速传输数据的高带宽存储器(HBM)。再加上电力、散热、网络和运维软件,整体作为一个巨大单元运作。

规模也超乎想象。要训练尖端AI,需要把数千个GPU通过网络连接起来,像一台巨型电脑一样运行。英伟达之所以宣布自己从卖芯片转变为设计整套设施的“基础设施企业”,正是因为如此。AI工厂不是单卖一颗芯片,而是整座工厂的整体设计业务。

这座工厂生产的“产品”看不见摸不着。AI工厂产出的代币会变成聊天机器人回答、外语翻译、寻找新药候选物质的分析,以及自动驾驶汽车识路的判断。也就是说,一座工厂可以同时生产数千种智能服务。就像钢铁工厂曾成为汽车乃至建筑骨架等各种产品的基础一样,AI工厂产出的智能将成为几乎所有产业的原材料。

AI工厂之所以受到关注,背后是爆发式增长的需求。随着生成式AI能够生成文字、图像和代码,甚至出现能自主处理多个步骤的“AI代理”,需要处理的计算量急剧上升。人们每次向聊天机器人提问并获得回答,都会消耗代币。

传统数据中心并不是为此设计的。通用数据中心是为了多种任务都能处理而建。

但AI任务的特点是同样的运算要重复无数次,因此只有从一开始就为AI整体设计的设施才能发挥性能。AI工厂之所以把GPU、存储器和电力整合在一起,原因正在于此。

AI的工作主要分为两类:训练AI,以及让训练好的AI在实际场景中给出答案的推理。训练是一次性消耗巨额资源的过程,而推理则会随着用户增加而无休止地重复。如今聊天机器人用户已达数亿,如何降低推理成本,决定着商业成败。

在这一点上,电力成为决定性因素。AI工厂消耗的电力堪比一座城市。SK电讯与英伟达正在建设的设施也被认为是吉瓦(GW)级。1吉瓦相当于一座大城市的用电量。持续运转的GPU所产生的热量需要冷却,而这同样要消耗大量电力和水。

因此,业内竞争聚焦于“每单位电力产出多少代币”。在相同电力投入下,能产出更多代币的一方就占优。为了提高电力效率,更多面向推理的新芯片不断推出,能够从同一设施中榨取更多代币的软件技术也在快速发展。最终,AI工厂就是一场比拼“把电力转化为智能的效率”的舞台。

AI工厂之所以不只是大型数据中心,还因为它与“AI主权”直接相关。能在本国的基础设施上运行、承载本国语言、数据和价值观的AI,通常被称为“主权AI(Sovereign AI)”。实现这一目标的基础,正是AI工厂。

专家认为,在AI基础设施竞争中一旦落后,就很难追赶。因为这需要巨额电力、半导体和资本同时到位。台湾与英伟达制定国家级战略,也是在这一背景下展开。是停留在“借用AI”,还是具备“自己制造并供给AI”的能力,已经成为衡量国家竞争力的标准。

竞争已在国界之外展开。美国大型科技公司正投入数百兆韩元建设AI工厂,而拥有充足资本与能源的中东产油国也已从国家层面加入。AI工厂已从“企业机房”升级为“国家的发电站与工厂”。可以说,拥有更多电力的国家,也就拥有更多智能的国家。

AI工厂还是产业的“大脑”。工厂中的传感器和生产管理系统产生的数据会被AI读取并判断、控制。它还向自动驾驶汽车、机器人和通信网络提供智能。黄仁勋所说的“未来的通信网络不是传输比特的网络,而是与AI结合的网络”,指的正是这一趋势。

韩国之所以忙碌,原因正在这里。SK、三星、现代汽车、Naver、斗山一方面向英伟达提供核心技术,另一方面也扮演着成熟AI工厂的需求方。

制造存储芯片的SK海力士和三星电子,是进入AI工厂核心的HBM领域全球强者。Naver运营着自有数据中心“各世宗”,积累了相关经验;SK电讯则希望凭借通信网络运营经验,成为向韩国各产业提供AI计算能力的关键通道。

开头提到的SK在日本建设AI工厂的计划,正体现了这一趋势。崔泰源会长表示,正在寻找可提供相当于一座大城市用电量的吉瓦(GW)级设施所需的大面积土地和电力来源。

选择日本的理由是其半导体材料和设备生态系统相对完善。他还提出,希望将其作为帮助日本企业应用AI、展示自身半导体技术的“展示窗口”,同时提出把韩日经济连成一体的“经济共同体”愿景。

剩下的课题也很明确。AI工厂需要巨额电力、广阔土地、稳定冷却水和专业人才同时具备。首都圈的电力和用地已经捉襟见肘。谁能拥有电力、半导体、场地和人才兼备的地方,谁就能拥有最便宜、产量最高的代币工厂。

这是一个智能成为基础设施的时代。过去工业化的标尺是钢铁和电力,而AI时代的标尺则是生产代币的能力。谁先建设、谁又能更高效地建设AI工厂,将重新绘制未来十年的产业版图。