说起"Discovery",大量人第一工夫想到的可能是那个Netflix 的短视频平台。

没错,这玩意儿确实是个大拿,专门做那些让人根本停不下来的小短剧,主打一个“只要我刷得够快,工夫就追不上我”。它的逻辑跟传统的长视频彻底不一样,把那些动辄三集的《权力的游戏》要么《绝命毒师》砍成了几十秒的片段,强迫用户高频次地滑动屏幕。

这种设计忒懂人性了,毕竟人类的大脑不喜爱长线条的东西,喜爱的是不断变化的刺激,就像过山车一样,芜湖起飞啊。对于大量不会看长剧的人来说,Discovery 简直就是手机里的“精神鸦片”,看着看着就停不下来,连喝水都忘了。 可是,说它只负责做短视频,那可就忒局限了。在硅谷的创业圈,特别是那些搞 AI 大模型的创业者团队里,Discovery 的潜力才刚刚被挖掘出来。我在帮几个初创团队做产品规划的时候,曾经听他们嘟囔,说目前的 AI 模型大多是那种“知识仓库”,输入啥就拿到啥,少了那种能真正帮你理清思路、把晦涩的概念拆解成易懂逻辑的“思索伙伴”。而 Discovery 正好能解决这个痛点。它不只是是个视频播放器,它更像是一个超级智能的“提示词工程训练场”,专门用来打磨那些能让人类形成共鸣的智能对话模型。 你看,你平时用大模型的时候,可能会遇到这种尴尬:你问它“如何写一份完美的策划案”,它随意翻几个例句给你,结局你用的时候又认定废话连篇,要么逻辑有点乱。

这时候,你能够把这段对话发进 Discovery 的测试区,让系统重新编排一次。它不会机械地执行你的指令,反而会根据你输入的语气、语气词,就连你点击的那个按钮,给模型出题、出题、再出题。它像是在教人如何跟模型聊天,如何把不清楚的想法变成具体的行动指南。

这种交互方式,比传统的 Prompt 工程多了一层“不确定性”的博弈感,对模型的要求也更高,出于它得学会在混乱中找秩序,在混乱中生成有价值的故事线。 这实际上贼契合目前大模型发展的趋势,“少样本学习(Few-shot Learning)”和“人类反馈强化学习(RLHF)”正在成为核心。传统的 RLHF 模型需求成千上万条标注好的数据,还要人工去微调每一个小点,成本高得吓人。而 Discovery 提出的那种方式,本质上是在模拟人类的创造性过程。它利用实时生成的对话数据,让模型自己在跟用户不断互动中“学”技术。

比方说,你能够设定一个场景,让 AI 扮演一个拟人化的助手,它需求不断推测用户的意图,用话术去引导用户给出更清楚的信息,最终生成一个结构完美、逻辑严密的结论。

这个过程里,AI 不再是被动地接纳指令,而是主动地在“表演”一种人类的特质——也就是那种充满创意、就连带点犹豫和灵光一发的状态。 这就解释了为啥目前的几个主流大厂都在疯狂布局要么调整策略。

你看 Google 最近搞的那个项目,彻底抛弃了传统的指令微调,转而用一种生成式的方式来训练模型。它不像那会儿那样依赖庞大的静态语料库,而是像 Discovery 一样,把对话的那段段儿当成一个数据集来培养模型。它通过让模型自己去“试错”,自己去学习如何在各种怪的语境下保持逻辑自洽,如何在对话中自然地带出那些看似突兀但实则切中要害的观点。

这种训练出来的模型,出来的回答往往不是那种教科书式的废话,而是带着温度、有节奏感、就连有点小幽默的回答。 我也注意到,这种思路实际上在应用层表现得挺明显。目前的电话会议软件,比如 Zoom 要么 Teams,在加入 AI 辅助后,启动不再只是好办地翻译会议纪要,而是启动主动提出“会议亮点”要么“待办事项”。它懂得根据参会者当下的状态,调整汇报的语气。而在写作辅助领域,像 Notion 或 Google Docs 里的智能插件,也启动借鉴这种理念。它们不再只是帮你查资料,而是启动帮你构建知识库的骨架,帮你把散落的文档逻辑串联起来,就连根据读者是哪位,自动调整文章的段落结构。 自然,这种技术路径别看诱人,但也得直面它的挑战。最大的难题就是“冷启动”。要训练出一个真正懂你、懂你家庭背景、懂你职场风格、懂你各种隐性偏好的模型,成本忒高了。并且,这种模型在训练初期可能会出现幻觉,就连有点“坏”,出于它是在不断生成新的逻辑,而不是死记硬背现有的规则。

这就好比一个还在上学的小孩,试图写出像成人一样的小说,别看过程挺混乱,但一旦成型,往往惊艳得让人无法直视。 另外,隐私和保险也是不得不提的。当每个模型的训练数据都汇聚在云端,参与着成千上万次高强度的交互时,如何保证数据不泄露,如何防止模型被恶意利用,这些技术难题依然挺大。

毕竟,我们最信任的模型,往往是别人最隐私的地方。 不过话说回来,Discovery 这种把“交互过程”转化为“训练数据”的思路,确实打开了一个大世界。它提示我们,未来的 AI 可能不会是一个接一个依赖你输入指令的工具,而是一个需求你不断去打磨、去理解、去激发它的“协作伙伴”。在这个阶段,它不只是是个视频播放工具,它更像是一个能够理解人类微妙情感、并在其中激发无限可能性的超级大脑。 看看目前的手机 App 市场,那会儿是单选,目前是多选。Discovery 代表了这种从“观看”到“参与”的转变。它不承诺给你完美的答案,但它承诺给你一个不断试错、不断生长的过程。对于开发者来说,这意味着一个新的时代已经到来:不再是单纯地训练模型,而是要去设计一个能让模型在互动中“活过来”的系统。

这听起来有点科幻,但当你试着在自己的手柄或笔记本上,对着一个模型疯狂输出各种怪指令时,那种被“玩”出花来的感觉,或许就是它最大的魅力所在。

毕竟,真正的智能,压根儿不是静态的存,而是流动的、碰撞出来的火花。