2023 年 3 月 6 日,ChatGPT 刚出来不久,GPT-4 还没发布,我和 Sarah 做了一场关于 ChatGPT 的访谈——Traders’ Talk「大白话系列」的第三期。那时候 ChatGPT 才出来没多久,真正上手用的人还非常少,这场长达三个小时的访谈,后来一直挂在小宇宙 ChatGPT 类目的第一名。我在里面一口气抛出了二十来个判断和预测,全凭直觉和有限的信息,没什么数据。当时那场访谈的完整逐字稿,还留在公众号上。
现在是 2026 年 5 月底,三年过去了,AI 已经长成了当年想象不到的样子。我想做一件事:把当年那二十条逐条拎出来,用今天能查到的最新数据,客观地对一次账。看清楚三年里世界到底变成了什么样,也看清楚三年前那个我,哪些地方看准了,哪些地方看偏了。
为了尽量不偏不向,这次对账我索性交给了 AI 来做:把当年的访谈逐字稿丢进一个 workflow,由它调度 41 个 Opus 4.8 的 agent,先把二十条判断逐条拆开,再各自联网检索最新数据、一条条交叉求证,最后给三年前的王建硕打分。这群 agent 花了大约 20 分钟、烧掉 140 万 token(约等于 35 美元),跑出了下面这份报告。判断都来自它们,不是我。基准日定在 2026 年 5 月。
一、记分牌
裁决符号:✅ 正确 · 🟢 基本正确 · 🟡 部分正确 · ❌ 错误
粗看下来,王建硕当年的大方向大多站住了,真正算硬错的只有一条——把 GPT-4 传成了 100T 参数。但魔鬼藏在细节里:几乎每条「对」的背后,都压着一截当年没说准的尾巴。二十条里没有一条纯粹「仍不确定」,三年足够长,多数事情都有了倾向性答案。下面分组细说。
二、看对了的
这一组的共同点是:王建硕当年判断的方向、机制、甚至时间节奏都押中了,错也只错在「程度」和「绝对化措辞」。
RAG 与检索架构(观点 2、3):2023 年王建硕说:解决知识和幻觉的主流方法不是改模型,而是向量检索把知识灌进去当「小抄」;正确架构是搜索引擎做检索、把结果喂给 LLM。这就是今天所有 AI 产品的事实标准。RAG 成了企业 AI 的默认架构,OpenAI、Google、Anthropic 都把它做成了平台级能力;ChatGPT Search 字面意义上就是「先用 Bing 索引检索、把结果喂给 GPT、再生成带引用的答案」。Google AI Overviews 用 grounding 做到约 20 亿月活,Perplexity 一家纯靠这架构的公司估值冲到约 200 亿美元。在 GPT-4 还没发布、业界默认「靠微调注入知识」的时候,他押的是「不动模型参数、外挂检索」,机制和时间都对了。
LUI 是新大陆(观点 7):2023 年王建硕说:ChatGPT 最伟大之处不是 AIGC,而是开启了 LUI(自然语言用户界面),会像 GUI 当年一样重构人机交互,催生一个比「做大模型」本身大得多的新行业。「新大陆」这部分几乎全中。自然语言成了大众主导的交互层(ChatGPT 九亿周活),并催生了一个独立新产业——agent、coding agent、协议层全部兑现。最具体的那句「比做模型本身大得多」被强力印证:MCP 协议成了 LUI 时代的「操作系统标准」,2025 年被 OpenAI、Google、微软全面采纳,年底转入 Linux 基金会;Claude Code 单一产品就做到约 25 亿美元年化营收。
机器人网络与新寻址(观点 9):2023 年王建硕说:未来约十年会出现「机器人网络」——agent 之间用自然语言自动握手、互相调用,不再需要传统 API;会诞生一套全新的域名寻址系统。这套东西「两三年就能做完」。方向命中得惊人。MCP、A2A(已捐给 Linux 基金会、150 多家组织支持)解决 agent 互调;Agent Network Protocol 直接基于 W3C 的 DID 做「无中心权威的 agent 寻址」,目标是「数十亿 agent 协作网络」——这跟他说的「全新域名系统」高度同构。
中国一定能做出可用大模型(观点 10、20):2023 年王建硕说:中国一定能做出可用的大模型,与顶尖的差距会在约三年内迅速弥合(类比红旗浏览器追 Netscape)。这条的时间线吻合得让人意外。Stanford 2026 AI Index 实测,顶尖中美模型的基准差距从 2023 年 5 月的 17.5–31.6 个百分点,收窄到了 2.7%;而美国的私人 AI 投资是中国的约 23 倍——用小得多的投入实现了弥合。DeepSeek、Qwen、Kimi、GLM 成了全球主流,开源生态甚至领先。
没意识、图灵测试只测表象(观点 13):2023 年王建硕说:ChatGPT 没有意识,是「说者无意、听者有心」的自作多情;图灵测试本就只测「是否让你以为它有」,而非它真有。「测表象」这个核心判断站得很稳,还被一个实验反讽式地坐实了:2025 年 UC San Diego 的图灵测试里,GPT-4.5 在「扮演人设」的提示下被判为人类的比例高达 73%,比真人还高,但靠的纯是表演技巧——这正是「只测是否让你以为它有」的最佳注脚。
其余看对的(观点 6、11、12、16、18、19):不是 AGI 但迈了一大步:两头都站住。Altman 本人在 GPT-5 时代仍说「不是 AGI、缺持续学习」;同时 IMO 金牌、ARC-AGI 从近零冲到 85%,「迈出一大步」无争议。不会失业潮:2026 年 4 月美国失业率仅 4.3%。盲点在「分布」——Stanford 研究显示,被抽掉的恰恰是职业阶梯第一级的 22–25 岁年轻新人,「顺畅吸走」的机制在他们身上失灵了。不会被 AI 垃圾淹没:净福祉方向对,但他严重低估了量级——AI 内容已占新增网页约 52%,「AI slop」成了年度词。创业大年:浪潮拐点抓对,xAI(2023 年 3 月创立)已达 2300 亿估值。但他把「伟大公司」锁死在 2023 当年过窄——真正万亿量级的 OpenAI、Anthropic 都创立更早。1994 浏览器时刻:相对排序坐实,OpenAI 2025 年真推出了 Atlas 浏览器,把比喻变成了字面现实。只是 ChatGPT 扩散比浏览器更猛,比喻偏保守了。prompt 加灌事实降幻觉:方向被证实,GPT-5 断网无检索时幻觉率飙到 47%,反向坐实「事实」是关键变量。只低估了根因在训练激励,而非 prompt。
三、看错了、看偏了的
GPT-4 是 100T 参数(观点 4)——彻底错:2023 年王建硕说:(传闻)GPT-4 是 100T 参数,比 GPT-3 的 175B 大约 600 倍。两个数字都错了。GPT-3 是 175B,2023 年 7 月泄露的最佳估计是 GPT-4 约 1.8T、16 专家的 MoE,仅约 10 倍。100T 和实际差了约 55 倍量级。
LLM 数学(观点 1)——诊断对,封顶结论错:2023 年王建硕说:LLM 数学差是本质,让它自己学会数学既不可能也没必要,正确做法是外挂工具。「诊断加工具路线」全对——根因正是逐 token 生成导致进位不可靠(2025 年机制论文精确证实了「末位常对、中间位错」的直觉);外挂工具的提升也巨大(o4-mini 允许用 Python 时,AIME 2025 达 99.5%)。错在「不可能、没必要」这种封顶式措辞。
价值捕获(观点 8)——赌对一半,核心论断反了:2023 年王建硕说:价值最终会落在应用层,开创基础层的公司(做模型者)结局未必赚钱。钱确实开始往应用层流(Cursor 三年做到 20 亿年化营收)——这半对了。但「做基础层的不赚钱」被英伟达直接证伪:FY2026 净利约 1200 亿美元、市值 5 万亿+,是全市场唯一明确大额盈利者。
版权(观点 14)——登记对,规避侵权错:2023 年王建硕说:AI 生成内容可能规避版权(保护表达不保护思想);生成物可能既不侵权、也无法登记。「无法登记」成了既定法律事实(2025 年美国版权局明确「仅输入提示词不足以主张作者身份」)。但「规避侵权」错得明显:法院反复认定 AI 输出若与原作实质性相似仍构成侵权;Anthropic 因盗版语料以 15 亿美元和解,是美国史上最大版权赔偿。
世界大同(观点 15)——机制对,趋势赌反了:2023 年王建硕说:ChatGPT 把人类观点做「加权平均」,可对抗抖音式信息茧房,给了「世界大同」的可能。机制层对了——2025 年多项研究确凿证实 LLM 把观点压向众数、系统性低估少数派。但社会判断层赌反了:他自己加的「至少现在不是千人千面」,三年内就被推翻——OpenAI 从 2025 年 4 月起把跨对话记忆和个性化做成默认能力,AI 正高速走向千人千面。
局部战争与成本(观点 17)——定性全中,定量证伪:2023 年王建硕说:再做大模型会迅速沦为「局部战争」,成本可知(去掉弯路约 5-10 亿美金封顶),会有很多玩家进入。定性方向对得惊人——大量玩家涌入、迅速商品化、开源追平闭源,全兑现了。但「5-10 亿封顶」这硬数字两端都错:前沿端被严重低估(GPT-5 级 2026 年达 2-5 亿美金训练,叠加千亿级数据中心和 5000 亿的 Stargate);复刻端又被高估(DeepSeek 把边际训练成本压到百万美金级)。
涌现能力(观点 5)——方向对,数字和框定错:2023 年王建硕说:约 60B 参数以上出现原始语料里没有、研究者也无法解释的新能力。方向性直觉成立,但两处表述站不住:其一,不存在统一的「60B 阈值」——思维链的真实门槛约 100B,不同能力在 13B 到 540B 不等的规模上出现;其二,「无法解释」在 2023 年底就被一篇 NeurIPS 杰出论文挑战——很多「突变」是评测指标选择造成的假象,换连续指标后曲线平滑可预测。
四、三年回看,几条规律
逐条对完账,退后一步看,王建硕这二十条判断里藏着几条比任何单条都更值得记下来的规律。一、方向远比数字和程度靠谱。二十条里,凡是判断机制和方向的(RAG、LUI、机器人网络、图灵测试),几乎全中;凡是给了具体数字或封顶措辞的(100T 参数、60B 阈值、5-10 亿成本、数学「不可能」),几乎全错。
二、时间上,他倾向于高估速度、低估程度。凡是说「迅速、两三年做完」的,成熟期普遍更慢;但对能力跃迁的天花板又低估了——数学能从「不可能」到 IMO 金牌,前沿成本能涨到当年想象不到的量级。一句话:短期太乐观,长期太保守。
三、最隐蔽的错,反复出在「分布」上。不是方向错,而是只看总量、忽略分布。「不会失业潮」对,但伤害高度集中在年轻新人;「价值落应用层」对了一半,但没区分算力层和模型层。总量正确,掩盖了分布灾难——这是最该补的一课。
四、把话留有余地的地方,三年后都经得起检验。「传闻」「至少现在」「大幅降低而非消除」「雏形两三年、成熟约十年」——凡是当年带了限定词、分了层次的判断,今天回看都更站得住。反而是脱口而出的绝对句,最容易翻车。预测的诚实,一半在于敢说,另一半在于敢标注自己的不确定。
五、有些问题,三年根本不够。价值最终归谁、涌现是不是真相变、机器到底有没有一丝意识、长上下文会不会吃掉 RAG——这些当年的争论,到 2026 年依然是争论。能区分「已经有答案的」和「还得继续等的」,比急着给每件事下结论更重要。
三年前的王建硕,凭直觉在 GPT-4 还没出来的迷雾里指了二十个方向。今天对完账,最该记住的一句话或许是:看对大方向其实没那么难,难的是承认自己在数字、速度和分布上一次次想当然。这二十条账,与其说是给过去打分,不如说是给未来三年立的几条规矩。下一个三年,2029 年再来对一次。
[王健硕]
人工智能的三年演进:对加密货币市场的影响
当我们回顾2023年至2026年人工智能发展的非凡三年历程时,加密货币市场正处在一个拐点,这两项变革性技术在此交汇。对AI发展轨迹预测的回顾评估,为正在应对这一复杂格局的加密投资者提供了关键见解。
融合催化剂
文章最重要的揭示是,尽管关于AI的方向性预测大多准确,但具体的数值预测却一直偏离目标。这种模式反映了加密市场动态,技术趋势往往被证明具有先见之明,而精确估值仍然难以捉摸。
AI代理网络的出现以及MCP(模型上下文协议)和A2A(代理到代理)通信等协议,与区块链的可组合性原则产生了自然的协同效应。我们正在见证一个新范式的早期阶段,在这个阶段,自主AI代理可能会在区块链网络上运行,通过去中心化基础设施执行复杂任务。这种融合代表着加密行业在未来几年中最重大的机遇之一。
AI栈的代币化
文章强调,AI生态系统中的价值分布在多个层面——从基础设施(英伟达2026财年1200亿美元净利润)到应用(Cursor公司20亿美元的年化收入)。在加密领域,这暗示了以下机遇:
-
AI基础设施代币:为AI模型提供去中心化计算能力的项目可能会看到大量需求,考虑到AI训练成本的指数级增长,目前最先进模型的训练成本已达2-5亿美元。
-
数据市场:RAG(检索增强生成)架构成为标准表明,高质量数据将继续是关键资源。去中心化数据市场可能成为AI栈中的重要组成部分。
-
代理经济层:随着AI代理网络的实现,我们可能会看到代币化的代理交互经济层的出现,为自主系统之间的价值交换创造新的基础原语。
去中心化AI:对中心化的制衡
文章指出,在DeepSeek、Qwen、Kimi和GLM等开源生态系统的推动下,中国正在迅速缩小与美国的AI差距。这种向开放和可访问AI技术发展的趋势,强化了去中心化AI作为主流闭源模型替代方案的案例。
专注于以下领域的加密项目:
– 去中心化计算网络,用于AI训练和推理
– 具有透明治理的开源模型市场
– 具有零知识证明的隐私保护AI
随着市场寻求日益中心化的AI力量的替代方案,这些项目可能捕获显著价值。
代理网络:Web3的新前沿
关于”机器人网络”的预测——代理使用自然语言自动交互——已通过MCP和A2A等协议实现。这一演进与Web3向更复杂交互的发展轨迹相平行:
-
自主代理协议:开发AI代理与区块链协议交互的标准,可能创造全新的经济系统。
-
跨链代理编排:随着AI代理变得越来越复杂,在多个区块链上协调它们的能力可能成为关键的基础设施层。
-
AI驱动的DAO:自主AI代理与去中心化自治组织的结合,可能创造更复杂的治理和决策系统。
投资模式:从AI的发展轨迹中学习
文章的分析为加密投资者揭示了有价值的模式:
-
方向胜于数字:尽管关于模型参数(100万亿vs实际1.8万亿)和训练成本(5亿-10亿美元vs实际2亿-5亿美元)的具体预测是错误的,但方向性的见解被证明是有价值的。在加密领域,这意味着关注基本技术趋势而非精确的价格预测。
-
分配很重要:作者忽视了AI影响的分配方式(集中在年轻专业人士而非广泛分布),这是一个关键教训。在加密领域,不同层级(基础设施、应用、中间件)的价值分配仍然不均,且常常被误解。
-
长期低估:作者低估了AI能力飞跃的上限。同样,专注于短期周期的市场可能持续低估加密的长期潜力。
加密投资者的风险因素
-
基础设施过度投资:正如AI训练成本超出预期,加密基础设施项目可能面临过度投资,尤其是在变现路径不明确的领域。
-
中心化风险:尽管推动去中心化,但AI领域的强大参与者(OpenAI、谷歌、微软)可能对新兴标准施加影响,对去中心化替代方案构成风险。
-
监管套利:随着AI监管日益严格,加密行业可能面临类似的审查,特别是在涉及数据隐私和自主系统的领域。
战略机遇
-
AI原生区块链:开发专门为托管和与AI代理交互而设计的区块链可能捕获显著价值。
-
跨行业协议:作为AI和区块链生态系统之间桥梁的项目,促进互操作性和价值转移。
-
去中心化AI计算:考虑到高级AI模型的巨大计算需求,去中心化计算网络可能成为关键基础设施。
人工智能的三年的演进表明,尽管具体预测往往偏离目标,但底层技术趋势展现出非凡的韧性。对于加密投资者,关键是要关注AI与区块链的根本融合,认识到最有价值的机遇可能不在于复制现有模式,而在于在这两项变革性技术的交汇处创造全新范式。