
昨天,当 OpenAI 作念智高手机的具体规格与供应链爆料发布时,我第一响应不是「他们要作念手机了」,而是「OpenAI 最终也不得不踏出这一步」,同期思起两周前 Richard Ho 在 Stanford 那场相通。
Richard Ho 是 OpenAI 的硬件认真东说念主,从 Google 作念 TPU 出来。

Richard Ho |图片着手:Synopsys
那场在 IEEE 里面组织的相通上,他莫得讲过一次「手机」这个词。但把昨天的新闻和他那时说过的话放在沿途看,整条旅途其实依然被讲得很了了——仅仅那时莫得一个具体的居品形态来锚定它。
OpenAI 作念手机这件事,在外界看来像一次跨界。但顺着 Richard Ho 那场相通的逻辑往下推,你会发现这是一条早就铺好的路。
毕竟对于扫数模子厂商来讲,手机都仅仅至极之一,不是发轫。
01
模子的下一次「跃迁」,出生自硬件
那场相通的中枢,是对于 OpenAI 为什么必须我方作念硬件。
Richard Ho 反复强调的一句话是:「真实的舍弃不再仅仅模子,而是算力、能耗、本钱、延迟,是扫数这个词系统。」
听起来像一句庸碌的时间陈诉。但放在 OpenAI 的位置上,这句话的重量皆备不一样——它意味着这家公司依然不把我地契纯行为一家模子公司。
GPU 是为通用并行诡计想象,在推选系统、传统的并行任务,跑得很好。
但面临今上帝流的 Transformer、agent、长高下文推理,其实依然偏离了 GPU 当初的想象假定。尤其是 agent——多轮、持续实行、跨任务协同,扫数这个词系统层的低效会被放大好多倍。Richard Ho 那时的原话是:「GPU 把咱们带到了今天,但它并不是为这种(AI 负载任务)而想象的。」
这句话背后的含义其实是:不时依赖 NVIDIA 所设定好的硬件旅途,OpenAI 经久没办法把模子推到下一个量级。不是说 GPU 弗成用,而是说在能耗、本钱、成果这些维度上,OpenAI 无法一直被迫地给与外部的硬件节律。
是以这件事的本色从一启动就不是「OpenAI 插足芯片/硬件行业」,而是 OpenAI 思再行拿回 AI 运行的底层适度权。
要是只看媒体报说念,你会合计 OpenAI 在作念的事情是「拼装一台手机」大略更真切一些的「自研一颗 AI 芯片」。但 Richard Ho 我方剖释得很平直:「咱们不是在作念一颗芯片,而是在作念一个系统。」
这个「系统」包括芯片、机架、集合、电力、散热、数据中心——和 Google 当年作念 TPU 的旅途很像,但更强调端到端的适度。
经由的部分有点出乎我料思。Richard Ho 说团队是从零搭起来的,但「两年期间依然从空缺走到 tape-out(芯片想象完成录用流片坐褥)」,况且依然有芯片在真实 workload 中跑了——他有益强调这不是纸面上的数据,而是「依然在真实环境里 work 的东西」。
两年从零到 tape-out 是个什么想法?传统芯片公司从架构到流片,五到七年很闲居。Google TPU 第一代用了约莫三年,而且是有 Jeff Dean 这种基础枢纽大牛背书、又有 Google 里面好意思满的工程协同体系作撑持。OpenAI 能作念到两年——背后只然则两件事:要么是从 TPU、Apple、Google 等公司挖了无数依然锻练的硬件团队(这是事实),要么是 Broadcom 这类相助方在底层 IP 上提供了绝顶大的赞助(这也部分是事实)。
但更值得说的是 OpenAI 和硬件供应商之间的关联范畴。
「他们会参与 IP、physical design、packaging。」Richard Ho 谈到 Broadcom 时说得很克制,紧接着补了一句——「他们并不看到好意思满的架构。」他还专门讲解,「好多时候他们只看到一部分,但看不到全体是怎样拼起来的。」
这句话其实自满了 OpenAI 自身的一个判断:架构层和工程层是两件事,前者必须皆备捏在我方手里。Broadcom 提供的是模块和制造能力,系统级的想象逻辑——也便是「这颗芯片到底要怎样和模子配合」这件事——必须留在里面——就像苹果作念硬件的逻辑一样。
Richard Ho 提到,外界看到的模子是几个月发布一次,但里面其实是一条运动的 pipeline——「咱们能看到接下来 6 到 9 个月模子会怎样变」。
这句话才是整段最枢纽的。它意味着 OpenAI 的硬件团队不是在为今天的模子想象芯片,而是在为还没出现的模子「辩论」想象。
具体到细节上,这种「上前看」会影响好多决定:模子对内存压力的变化会平直决定 HBM 应该用 8-high、12-high 如故 16-high;集合带宽要扩到些许;新的 compression algorithm 出现会不会改换数据流的阵势;inference 和 training 的比例正在快速变化(推理负载越来越重),这对硬件的条款又是另一套。
Richard Ho 把这极少总结成一句话:
「你必须为模子将要去的宗旨想象硬件,而不是为今天的模子。」
这便是 OpenAI 的芯片和 NVIDIA、AMD 的根蒂不同之处——它不是一颗对外售售的通用 GPU,而是高度贴合 OpenAI 自身模子旅途的、简直一双一定制的系统。从这个角度看,OpenAI 作念芯片更像 Google 作念 TPU,而不是像 NVIDIA 作念 H100。
但即便如斯,硬件优化的天花板远莫得到。Richard Ho 反对「晶体管高出变慢,是以芯片红利完毕」这个结论。他的判断是:单颗芯片如真的变慢,但扫数这个词系统层面还远远莫得被优化好。memory hierarchy、networking、data movement——这些大瓶颈都没解。他举的例子很具体:咫尺高速 copper 互联在高带宽下只可赞助约莫 2 米的距离,这对数据中心布局黑白常大的舍弃。
浅显说一句:OpenAI 在作念的事情不是把一颗芯片作念得更快,而是把扫数这个词 AI 诡计系统再行优化一遍。
手机这件事,是这个系统的最终端。
02
「手机不是为 agent 想象的」
回得手机。
Richard Ho 在那场相通上有一句话,今天回头看简直便是 OpenAI 作念手机的全部事理——「手机不是为 agent 想象的」。
「今天的手机交互是 app-based、session-based 的,你掀开一个 app,作念一件事,关掉。但 agent 需要的是持续存在、持续实行、跨任务协同。一个真实的 agent 不会等你掀开它再启动使命,它会在后台一直相识你的景色、颐养你的任务、跟其他 agent 通讯。」
这种交互范式,平直等同于在说:今天的 iOS 和 Android 都不是为它想象的。
这便是为什么 OpenAI 必须我方作念。Richard Ho 的判断是「改日不是 cloud-only,也不是 edge-only,而是两者纠合」——个东说念主高下文、隐秘数据、低延迟交互必须在开采端,复杂推理留在云表。要是一个 agent 思随时拿到用户的「当下景色」,它必须在操作系统层有好意思满权限。

现存手机系统在称心 AI 时间原生用户需求眼前有自然的短板 | 图片着手:io
这件事在 iOS 和 Android 上很难干净地作念——不是时间问题,波音体育是利益问题。Apple 不会把系统级权限皆备敞开给一个第三方 agent,Google 也不会。
亦然从这个角度,昨年 OpenAI 收购 Jony Ive 团队关联的公司(io)的逻辑就了了了。Richard Ho 说,作念端侧个东说念主开采这部单干作「是咫尺最有意义的一块」——因为这是第一次把基础枢纽和耗尽电子开采真实接在沿途。
这其实是 OpenAI 扫数这个词硬件策略里最有思象力的部分,亦然最危境的部分。有思象力是因为它在作念 Apple 当年没作念的事:用 AI agent 把操作系统重写一遍。危境是因为耗尽电子是另一套游戏规则——居品节律、供应链、零卖、品牌——不是从云表工程师团队里能长出来的能力。
但 io 的存在处置了一部分问题。Jony Ive 不是来作念芯片大略操作系统的,他是来作念硬件形态和工业想象的——这原本便是 Apple 这些年从 OpenAI 手里能俄顷保住的终末一块地。
03
不是扫数 AI 公司都在作念合并件事
耗尽电子的难度有多大,看当年两年其他 AI 公司在硬件上的尝试就了了了。
每一家都思用 AI 再行界说某个硬件形态。但每一家走的旅途不一样,收尾也很不一样。
最早的是 Rabbit R1。
2024 岁首的 CES 上,吕骋拿出那台橙色小盒子,喊出「干翻扫数 App」——用 LAM(大动作模子)替代手机里 App 的交互时势,一句话订外卖、打车、订机票。那时激勉的柔柔度堪比「AI 时间的 iPhone 时刻」,开售两周卖出 5 万台。

Rabbit R1 是首批 AI 硬件中为数未几「口碑回转」的居品|图片着手:Rabbit
但首批用户体验出来之后,事情翻得很快。先是被开发者证据是套壳安卓——Rabbit OS 试验上是 AOSP 的修改版,APK 不错平直装到 Pixel 6a 上跑。LAM 被发现依赖 OpenAI 的 API。续航 4 小时,订一次外卖要试十几次。
Rabbit 失败的真实原因不是居品性量,而是旅途——它只作念了硬件壳子,没碰底层。芯片是联发科 Helio P35(初学手机水平),系统是套壳 Android,模子靠第三方 API。这种作念法的天花板很彰着:你作念的事情,一个手机 App 都能作念,而且作念得更好。
Meta 选了一条皆备不同的路。
Meta 的判断是不挑战手机这个形态,让 AI 借眼镜这个依然存在的硬件形态插足日常。Ray-Ban Meta 作念对了三件事:找 EssilorLuxottica(雷一又母公司)作念相助方,让眼镜回来眼镜本人——先锋、轻、酣畅;把 AI 作念成「附加项」,299 好意思元起售;不彊求每个用户都用 AI,先把一副好眼镜卖出去,AI 是 bonus。
收尾是 Ray-Ban Meta 卖出卓越 200 万副,Meta 一家拿下群众智能眼镜阛阓 75% 以上的份额。
但这条路的范畴也了了——Meta 处置的是「AI 怎样插足日常」这个问题,不是「AI 怎样再行界说诡计」这个问题。眼镜仅仅一个加了录像头和麦克风的进口,它不会替代手机,也没盘算推算替代。
阿里千问基本上是 Meta 旅途的中国版块。本年 2 月 MWC 发布、3 月 G1 系列发售(国补得手价 1997 元起)、4 月 S1 上市(国补得手价 3499 元),节律很快。逻辑也表示:千问 App 依然作念到超 3 亿月活、8000 万 DAU,眼镜是把 AI 助手能力从手机延迟到日常佩带形态——支付宝、高德、淘宝、飞猪一整套阿里生态都接进来,用户对眼镜说「点外卖」「打车」「翻译」就能服务。芯片是高通骁龙 AR1,系统在 Android 之上,模子用千问。
千问眼镜本色上是一次生态延迟,不是底层重构。它的上风是阿里生态鼓胀厚,眼镜成为阿里 AI 服务的一个新进口。
把这三条路放在沿途看,再对比 OpenAI——你会发现 OpenAI 是独逐一家在作念「全栈再行界说」的公司:
Rabbit 思绕过 App 但没动操作系统,收尾是空中楼阁;Meta 聘用不挑战手机,让眼镜作念糟塌,作念对了爆款但天花板便是糟塌;千问奴隶 Meta 的形态聘用,把眼镜作念成 AI 服务的延迟进口;而 OpenAI——从芯片、基础枢纽、动力、操作系统、开采一齐买通。
这是另一个量级的事。
04
真实的护城河,不在模子层
那场相通的终末,Richard Ho 还给了一句对改日时势的判断:
「(模子公司)不再是在芯片层赢,而是在系统层赢。」
这句话的意义是,改日的 AI 竞争不仅仅模子能力的竞争,而是整套系统能力的竞争——一样的功耗下能提供些许诡计、能服务些许用户、延迟能压到多低。这种系统级的上风,单靠模子本人是没法替代的。
放在 OpenAI 的位置上看,这是一种绝顶自洽的逻辑:模子团队在 GPT、o 系列、agent 这些方进取往前推,但一朝推到某个体量,模子本人的高出就要被基础枢纽的瓶颈舍弃住。是以 OpenAI 必须从模子公司形成基础枢纽公司——再形成开采公司。
这亦然为什么 Richard Ho 在被问到改日算力限度时,给出的数字是 20GW。把 OpenAI、Oracle、SoftBank 等相助方的规划加起来,改日需要的算力约莫绝顶于十几到二十个核电站的发电量。
这个数字第一次听到的时候我没响应过来。20GW 依然不是数据中心能处置的问题——它是国度电网和动力政策的问题。Richard Ho 我方也说,「当你启动谈这种限度,就必须谈电力,致使是国度安全」。
把这件事和「OpenAI 作念手机」放在沿途看,才能看了了扫数这个词图景:一边是国度级别的动力基础枢纽,一边是用户兜里的一台开采,中间是一整套自研的芯片、系统、操作系统。OpenAI 思作念的,是把这两头连起来。
把扫数的点串起来——模子、基础枢纽、自研芯片、动力、edge device、操作系统——会发现 OpenAI 作念手机不是一个单点有策划,而是这条旅途当然长出来的收尾。
手机仅仅第一个被外界看见的形态。但真实的变化是更下面的那一层:诡计范式正在从 app 为中心,转向 agent 为中心。
一朝默许进口形成 agent,今天的开采、芯片、操作系统,都会被再行界说一次。
这一次再行界说里波音体育官方网站,OpenAI 不再仅仅一家作念模子的公司。
金年会(JinNianHui)体育官网

备案号: