如果一场对话是从一句「这个问题要是问得不好,那就是 Gemini 3 Pro 的锅;要是问得好,那一定是我 Prompt 写得不错」开场,那接下来不会是一场严肃到打哈欠的论坛。
这次在新加坡,非凡产研 CEO 吴畏,拉了三位风格完全不同的创业者坐在一起。
在模型与应用之间搭中间层高速公路的 CometAPI 创始人李京林,
在深度合成视频里把剪辑师和后期团队打包给 AI 的旷野群星 CEO 刘如山,
以及从智谱 COO 出走、现在在元理智能做数字劳动+企业级 Agent的张帆。
三个人一上来,就把一个问题谈得很穿:AI 时代真正的机会,根本不在大家举着手机追热点的地方。
一、机会在哪里?在所有人嫌弃的地方
如果用一句话概括张帆的观点:现在最稀缺的不是模型,而是有人愿意认真把模型变成生产力。
他给了两个数字,很扎心。
一边是供给侧:OpenAI 一家就已经有万亿级 Token 产出,接下来几年,在模型进步、芯片扩容、成本下降的叠加效应下,Token 产能再乘一千倍并不夸张。
另一边是需求侧:MIT 的研究显示,只有大约 5% 的 POC 真正落地,95% 都停在 Demo、汇报材料和情绪价值。
张帆说,以他在智谱两年多、几亿规模的 B 端服务体量来看,这个数字一点都不冤。
换句话说:模型这个电厂,已经建得够大了;真正缺的是,把电线拉进工厂、商场、流水线、客服中心、财务部的人。
于是他做了一个非常反主流的判断:现在一级、二级市场所有的资源,都在往生产端砸——更大的集群、更强的芯片、更猛的模型——但真正没被认真做的,是需求端:怎么让企业愿意长期买单。
这就是他口中的巨大鸿沟,也是他离开国内头部大模型公司、去做被很多人嫌弃的 To B 数字劳动力的底层原因。
听上去有点逆风操作,但如果你拉长时间轴,会发现每一轮技术革命,真正赚钱的,往往都不是站在镁光灯正中央的那拨人。
二、中间层:帮开发者省心快钱的人,其实在扛大梁
李京林做的,是一个很多人容易忽略,却极其关键的东西:模型聚合中间层。
他形容以前自己做 AI 应用时的痛点,非常具体,也非常真实。
你想接十几个模型试一试,每一家都要申请 API key、跑一遍 KYC、充值、对账;
每一家接口的参数都不一样,文档也各写各的风格;
你甚至还没想清楚最后要用哪个模型,就已经被前期调试磨掉了耐心。
所以 CometAPI 做的事很简单也很直接:统一一套兼容 OpenAI 的接口,把世界上你想得到的模型都接起来,让开发者一键切换测试。
今天想试 Claude,明天想对比 Gemini,后天想看看国产模型在视频、音频上的表现,一行配置就够了。
更现实的是,当你的 GMV 上去了,中间层还能帮你拿到比官方更低的折扣——因为它在模型侧的议价能力,比你一个个小开发者要强得多。
这听着有点像给开发者省心快钱,但真正有意思的是:站在中间层的位置,你能比任何人更早看到泡沫和趋势。
他说,他们的用户从俄罗斯、美国、日本、韩国到东南亚、非洲都有,每一次大模型的大升级,都会清洗掉一批投机型开发者。
有些站群工厂,抢注册各种某某AI.com域名,一页一个 Prompt,一键接 API,靠 SEO 捞一波快钱。
模型一迭代,或者新玩具上线,流量立刻腰斩。
产品本身没沉淀,只有热点和投放。
李京林给应用开发者的提醒挺狠:如果你做的只是对模型的补丁与缝缝补补,那你真正的竞争对手不是别的 App,而是下一版模型本身。
今天你依靠 Workflow 补齐了它不会做的东西,下一代它自己学会了,你就没了。
所以,从中间层的视角看机会,他给了一个关键提示:
真正长久的应用,一定是镶嵌在生产关系里的,像老一代的 SaaS 一样,成为企业日常工作不可替代的一环,而不是一个模型换代就被顺手带走的玩具。
三、深度合成:把两周剪一个视频,变成说一句话,AI 帮你干完
如果说李京林帮开发者接线,那刘如山就是把一条条复杂的视频生产流水线,塞进一个 All-in-one 的产品里。她上来先问了个简单问题:现场有多少人已经在用 AI做视频?几乎全场都举手,她笑着说:那你们都是我们的潜在客户。
她又问,你们觉得做 AI 视频痛苦吗?都在使劲点头。
大家为什么会点头?因为痛苦太真实了。你要做一条像样的视频,大概会经历这样一个流程:画面在这个模型里生成,人物在那个模型里调,配音再找一个模型,音效需要另一个工具,字幕怎么排版,素材上传下载格式反复转,从第一版到能交付,很可能要折腾好几天甚至两周。旷野群星把这一切简化到:说需求——我想要一个公司动员会的一分钟宣传片。系统自动帮你选模型、排 Workflow、生成画面、配配音、加音效、加字幕,做剪辑,最后给你一条可以直接上片场、上投放的商业级视频,如果对细节不满意,每个节点都可以调整,高度可控。从两周变成两个小时,从手工活变成自然语言驱动的 Deep Agent。
更有意思的是,旷野群星不是从 C 端做起,而是从最笨重的 B 端交付开始:先扎进上市公司,帮对方做整套 AI 视频矩阵;再给美国大品牌做广告片,把一条条 TVC和短视频真的交付;研发团队自己去做半年乙方,亲手感受创作者的疼点,然后再回头做产品,吃自家狗粮进行迭代。正因为这样,在技术路线选择上,反而更敢逆共识:当大家一窝蜂做基于GUI 交互的一句话生成视频,他们没有跟。理由很直白:那是玩具,不是为 AI 工作更方便而设计,更不能交付商用级视频。AI 真正要能干活,它需要线性、可控的工作流,要可控可调,就不能是完全黑盒。
所以你会看到,今天行业里刚刚开始流行画布工作流节点编排的时候,他们其实在年初就已经验证完这条路线,并且在实战里滚了一圈。刘如山的逻辑,简单粗暴又真诚:不跟随大众,走自己的路。从真实的痛点出发,提前半年走对方向,你就会发现别人以为是护城河的地方,其实已经变成雷区。
四、Agent、数字劳动与电力范式:AI 真正改变的是谁在付工资
聊到 Agent 和 To B,张帆的视角,就明显带着从模型那一端走出来的冷静。
他把 Agent 的演化分了几代,从最早的单点工具,到有简单规划的 Workflow,再到能自我规划、自我学习的 MemAgent,再往上,是接近 OpenAI 所说的 L1~L5 这种 AGI 能力等级。
他不太满意 Workflow 的原因很清楚:Workflow 能上手很快,但表达力有限,你不可能写一万条 Flow 来覆盖真实世界的复杂任务。
再往上一代把能力交给大模型虽然更自由,但可控性又是个大坑——它假设每个大脑都像牛顿,差别只是经验不同,而现实远比这脏乱差。
元理智能想做的,是再往前迈一步:让每一个具体环境,都拥有一个专属的最优 Agent,把行业 Know-how 和企业偏好,直接写进权重,而不只是塞进上下文。
这就引出了一个更大的命题:AI 的革命到底更像互联网,还是更像电力?
如果像互联网,那就意味着新的连接、新的市场、新的 90 后创业者、新的流量玩法。
但张帆给了一个完全不同的比喻:互联网解决的是信息连接,AI 解决的是生产力。电力发明之后,不是因为电本身赚了多少钱,而是因为电嵌入到了电梯、流水线、地铁、工厂,重新定义了城市形态、分工方式和管理理论。
对应到今天的 AI,他特别强调:真正重要的,不是我们能不能做出更大的模型,而是什么时候能在标普 500 和深证 300 的财报里,看见清晰的 AI 贡献。
这背后还有一个传统 To B 的痛点:软件年代,你卖一个 CRM,客户永远很难算清楚,你到底给他带来多少直接价值;于是愿不愿意付费,完全取决于预算、感情和拍脑袋。
但如果你把 AI 定义为数字劳动力,事情就很不一样了:企业今年全球劳动力支出是 64 万亿美金。
这些钱,本质上都是企业在为人类劳动力买单。
如果你现在告诉他,你现在有 500 个客服,我帮你用 450 个人的钱干完 500 个人的活,还敢对效果兜底,在经济下行周期里,这是极难被拒绝的 proposition。
这就是为什么他强调:未来真正的 To B,不是再卖一堆功能,而是卖一个可以计量的结果。
但结果付费也容易走偏——不是去分客户赚到的那笔钱,那会把你拖进无尽的博弈。
最健康的方式,反而像电一样:你用电炒股票赚了一万,电厂不用分钱;你一个月电费一百,也轮不到电厂替你出。电,只收一个合理的基础费,关键在于——只要它确实有用,你就会持续不断地用下去。
把 AI 当电,而不是当流量工具,这其实是元理智能在试图走的一条路。
五、一人公司与护城河幻觉:别把雷区当护城河
在这场对话里,有一段故事,应该可以写进AI 创业者必修课。
张帆讲了一个朋友的经历。这位朋友想做一个有护城河的 AI 产品,于是画了四层墙:先做一个很强的编辑器,再在编辑器里内置大量 Prompt 模版,然后去买 100 万个 PPT 模版,最后跟最大的版权库谈合作,把版权也握在自己手里。
听上去很像一套细致而严密的战略。结果 Midjourney 一上线,他发现整个逻辑被碾得稀碎:人家根本不需要编辑器,直接用 HTML 切网页表达力更强;Prompt 模版变成由模型自己推理,你是一个中学生,你应该这么解题;图片生成之后,版权问题也被重新定义。
等他好不容易反应过来,想再垒一层墙的时候,新的模型又把整套流程吃掉了。本来以为是护城河的地方,一觉醒来发现只剩下一圈雷区。
所以张帆对一人公司的热潮,其实是持保留意见的:如果你花两个月做出一个月入 200 美金的 App,听起来很爽,但要冷静想一下:可能 95% 的价值都来自模型,只有 5% 来自你。
那别人只需要付出你 5% 的努力,就能复刻一个一模一样的 App,而且可以来一百个。
久而久之,你就会发现一个现实:先发优势如果不能快速变成壁垒,它就只是一段漂亮的增长曲线截图。
他用一个比喻来收尾:今天的大模型,就像一片海。你觉得海水不够深、不够稳,就拼命在原地加高灯塔。但每隔半年,水位就上升一百米,灯塔再高也会被淹。真正该做的,是造一艘能浮起来的船——水涨,你也跟着涨。
对大多数创业者来说,船意味着什么?是你对具体行业的深入洞察,是你掌握的用户关系,是你的运营体系,是你敢于走非共识路线的勇气。这些东西,是模型一时半会儿替不掉的。
六、数字劳动会替代谁?理性一点,也浪漫一点
当吴畏把话题拉回Labor,问元理智能的数字 Labor 会不会替代掉人类的劳动力时,张帆的回答很干脆:一定会。
但他分了两个层次来说。
理性层面,他用的是5000 年前的人类和今天的人类的对比:5000 年前的人,脑容量和我们差不多;但今天一个人能带来的生产力,是几千年前人的数百倍甚至上千倍。
这种提升不是因为每个人都变成了 200 IQ,而是因为:我们发明了分工、组织和工具,把个体智能堆叠成了群体智能。
如果你把整个人类社会看成一个大型的 MoE(专家混合模型):有人只研究算法,有人只做产品,有人专门负责供应链,有人深耕某一个细分行业。每个人都是一个专家节点,整个系统的智慧,远超任何一个单点。
未来的 AI,很可能也是这样:每个个体,会拥有一簇属于自己的 Agent;企业会拥有一整套数字劳动队伍;真正的差异,不是你用了哪个通用大模型,而是你怎么把它嵌进自己的分工系统里。感性层面,他的说法又非常互联网式:
今天大家都喜欢自嘲社畜牛马。如果我们真能把所有真正牛马的工作交给机器,留下那些更适合人的事——创造、判断、共情、叙事,那也许是 AI 时代最值得期待的一点点浪漫。
当然,这不会是一条平坦的路。对个人而言,最糟糕的状态,是既不愿面对岗位会被替代的现实,也没有主动去设计自己的新分工。
最好的状态,是坦诚地问自己一个问题:在未来这套人+Agent+数字劳动的系统里,我适合站在什么位置?我能贡献什么,是模型短时间内做不好的?
七、别急着找风口,先选好自己的坐标系
这场主题叫AI 时代的新机遇,但真正有价值的地方,不在于给你几个马上可以上手的创业点子,而在于帮你换了一套思考坐标系。
从李京林那里,你会意识到:别只盯着应用层的烟花,真正大钱往往藏在最无聊、最基础、最让开发者少掉几根头发的地方。
从刘如山那里,你会看到:真正的产品,不是用几个华丽的模型堆出来的,而是用半年、一年、一轮轮真实交付,帮用户把两周的痛苦压缩到两个小时的过程打磨出来的。
从张帆那里,你会被迫面对一个现实:AI 更像电力而不是互联网。它不是在帮你多弄几个新流量入口,而是在悄悄重写企业的成本结构和利润结构。
如果一定要用一句话来总结这场对话留给我的那种后劲,我会这样说:
在 AI 时代,真正的机遇从来不长在闪光灯打得最亮的地方,它们长在那些被嫌弃、被忽略、被视作太慢太难太 To B的缝隙里。能不能抓住它,不取决于你跑得多快,而取决于你敢不敢,先把自己放在一个不会被海水一次次淹没的位置上。
接下来几年,我们大概还会看到无数新的模型发布、参数上亿上万亿的新闻、一个又一个日入几千刀的一人公司截图刷屏。
但你真正需要反复问自己的,可能只有三个问题:
我是不是只是在给模型打补丁?
我做的东西,是跟着浪头起伏,还是能随着水位一起上升?
在这套人+Agent+数字劳动的新分工体系里,我究竟想成为哪一个节点?
如果你能把这三件事想明白,那么AI 时代的新机遇,可能已经悄悄站到你这边来了。
圆桌精选Q&A
Q1:各位嘉宾能否简要介绍一下自己和自己的公司,以及公司在 AI 领域的定位?
李京林:我们是做 CometAPI 的,专门针对海外市场提供一站式 API 大模型聚合平台。国外的类似产品是 OpenRouter。我们的聚合范围更广,除了语言模型,还包括视频、音频、音乐、Embedding、向量,几乎聚合了世界上所有主流的模型。我们服务全球的 AI 应用开发者,帮助他们更低成本地使用各种模型,包括 Anthropic Claude、GPT,以及中国优秀的国产大模型。我们的业务增长较快,大概一个月翻一倍。
刘如山:我们专注在 AI 视频落地这一块,属于应用层。我们致力于解决 AI 视频创作中的痛点,将所有模型集中起来。用户只需根据提示词,我们会自动推荐合适的模型,省去了用户切换和调试模型的工作,在画布中直接剪辑合成,不需要再去剪映手工操作。我们基于对未来的畅想,认为未来用户观看的视频是单独为他生成的,现阶段的产品无法支持这样的场景,所以我们必须做一个让AI 能工作的产品。Mulan.pro不仅聚合所有主流模型All-in-one,更能以线性的方式直接完成剪辑。6 月我们就已经实现在画布工作流中完成剪辑,自然语言驱动AI全自动搭建工作流,迭代这么久,发现目前我们仍然是世界唯一做到的产品。
张帆:我一直从事基础模型和商业产品的商业化工作,曾是智谱的 COO。元理智能的重点是解决模型到应用之间的巨大鸿沟。我们认为现有的 Agent 模式,从单点解决到 Workflow,再到自我规划(如 MetaGPT)都有局限性。我们希望构建下一代的 Agent,即对每一个环境构造一个自己的最优 Agent,其能力体现在 1 万亿参数的每个权重中。我们希望找到大一统的方式,真正把 AI 从基础智能转化为生产力,融入到物理世界。
Q2:李京林,你为什么选择在应用层和模型层之间做 CometAPI 这样一个中间层?
李京林(CometAPI CEO):这是因为我自己做 AI 时发现了问题,。作为开发者,接入各种模型会面临很多痛点。你需要管理每家的 API key 和账单、与每家沟通合作。最大的痛点是调试时需要阅读和理解每家的文档,它们的接口和参数都不一样。在开发前期,工作量非常大,因为你需要选型。CometAPI 通过提供统一兼容的 OpenAI 接口,解决这些问题,实现一站式、一键式的测试和调用全球主流模型。此外,通过聚合,我们还能提供比官方更高的模型折扣。在 AI 时代,时间窗口很重要,我们能迅速上线最新模型(如 Gemini 3,在官方发布 20 分钟后就上线了),帮助开发者省心快钱。
Q3:张帆,你之前在智谱(国内模型化的领军公司)任职,为何选择离开,转向现在大家都很嫌弃的 2B方向?
张帆:我看到了模型到应用之间存在的巨大鸿沟。今天,所有的资源几乎都投在了生产端:更强的芯片、更大的集群、更强的模型。我们现在有 1 万亿 token 的产量,未来五年可能会多出 1000 倍。但是从需求端来看,MIT 的报告指出,今天的 POC(概念验证)只有 5% 在落地,95% 没有产生价值。大部分应用仍在提供情绪价值,集中在合同审核等边缘业务。如果 AI 不能被引导到核心业务,就无法消耗掉这 1000 倍的 Token。
我们认为,AI 的革命更像电力而不像互联网。互联网创造了连接和新的 Marketplace,但 AI 解决的是生产力问题。电力的革命是靠电嵌入物理世界所产生的。核心逻辑是,AI 必须体现在标普 500、深 300 等公司的财报上,真正带来基本面的提升,这才是扎实的,。我们不应该用模型公司的视角看问题,而是要用企业视角,将 AI 融入到物理世界中,带来更大的变革。传统的 SFT、人工标注数据和搭 Workflow 的方式无法解决这一问题,我们看到强化学习在商业环境中的应用可能带来曙光。
Q4:刘如山,AI 视频合成领域竞争激烈,大厂应用可能会替代或重构你们的工作。你们的差异化竞争力是什么?
刘如山:如果非要谈竞争力,我认为最大的点在于人,以及我们不跟随大众的做法,有自己的路。我作为公司的创始人(包括我在美国的 CEO,我的女儿和技术负责人一乐)都是非常不同、完完全全非共识的状态。
关注成果和效率:我们能将制作一个视频的时间从两周缩短到两个小时,并将普通人的制作水平提升到好莱坞大片的水平。
技术路线的选择:我们一开始就没有妥协选择 GUI路线,因为知道那是阶段性产物,我们认为对 AI 来说,生成过程应该是线性的。不从众很难,但我们挺过来了。
前瞻性的产品设计:我们在 1 月份就确定了画布工作流的路线,4 月出DEMO,6 月公开展示,不断迭代,而大厂直到 11 月份才开始反应过来。很多公司都是在跟风,但对我们来说,接下来技术发展每一步应该怎么走,我们都已经想得非常清晰了。
深入 B 端,解决痛点:我们非常踏实,在研发之前,先花了整整半年以上的时间,亲自做 AI 视频交付工作,服务上市公司和知名的美国公司。通过亲自做交付,我们的研发团队知道了创作者的痛苦点在哪里,然后从痛点出发找到了正确的方向去做。这样的流程在大厂是根本不可能实现的。
Q5:张帆,你提到创业的先发优势要转化成壁垒,模型含量不能太高也不能太低。你对当前市场上的一人公司热潮有什么看法?
张帆:我认为当前市场对一人公司有一些误导。如果一个人花两个月就能做出一个 100 美金的 App,那么这个产品中95% 的价值都是模型给你的。这意味着你只找到了一个点,别人也只需花 5% 的精力就能做出一个一模一样的。你的市场会被快速吃掉。做创业的先发优势必须转化成壁垒,今天的单人公司做 To C 是很难构建壁垒的。
此外,我认为 AI 的革命更像电力而不是互联网。互联网解决了连接效率,创造了新的 Marketplace。而AI 解决的是生产力。电力改变社会,是靠电嵌入物理世界所产生的(如电梯改变城市、流水线改变工作模式),。AI 必须嵌入到标普 500 的基本财报中,才能带来真正的社会变革。如果创业公司做得太靠近模型,模型一升级你就没了;离模型太远又跟时代没关。所以必须拉出一个 Z 轴,让自己的模型含量既不能太高,也不要太低,找到模型主赛道的叠加。
Q6:数字 Labor 会不会替代人类的 Labor?被替代的人类 Labor 何去何从?
张帆:一定会替代,毫无疑问,。
从理性的角度来看,人类在过去 5000 年中脑容量没有太大变化,但生产能力提升了 1000 倍。这种提升不是因为每个人都有了一个 200 的大脑,而是因为带来了分工、工具,从个体智能变成了组织智能。今天的社会就像一个巨型 MoE(混合专家模型)。未来,模型会吞噬掉大量的工作,就像我们今天不会去争论汽车是否会出现一样。
从感性的角度来看,我们应该让真正牛马的工作都让机器干掉。我们应该追求那些更适合人来做的事,让人变得更加聚焦,做更快乐的事。
预测时间点:我认为 AI 真的替我们完成工作,实现大规模替代,可能只需六个月。这个速度可能比大家想得快。
Q7:各位嘉宾认为未来公司主要的商业模式和获利途径会是怎样的?
张帆:我认为从来不是说 To B 不好干,只是软件 To B 不好干。企业总是愿意为能够带来显性价值的产品买单。如果我们将 AI 转变成为一个劳动力市场,它更像广告业。如果你的服务能让客户赚更多钱(比如投入两块赚到七块),市场就不难收费。
关键在于如何把服务变成一个显性可量的结果。我们应该把自己当成电。客户使用电赚了钱,不用跟我们分,但只要他们有用,就会源源不断地消耗。我们应该只收一个最低的电费,把使用成本下压,同时让它得到更好的直接的业务结果。
李京林:在海外市场,商业模式相对成熟,用户很愿意付费。AI 解决的是生产力问题,相当于工业革命提高了生产效率,但生产关系没有变化。我认为未来做 AI 应用很大的一个方向是不可替代性,即那些即使模型不断迭代也难以被淘汰的产品。例如老的 SaaS 产品,它们渗透在我们工作生活的每一个环节,更注重生产力、工作协同、生产关系这一层的环节。AI 模型只会补全你的能力,不能替代你的整个角度。
刘如山:我们的商业模式有以下几种:
C 端充值:提供 20 美元和 50 美元两种充值(针对 C 端用户)。
模版收费:会有很多人上传模版,最终变成收费的模型,满足长尾需求。
API 授权:我们将 API 接口给其他客户,协助他们使用产品,他们用自己的品牌去销售,不会体现是我们家的东西.
企业交付:直接向企业交付产品。
我们自己比较喜欢做模版的生意,因为它更像开源社区,从某种角度来说,更能抵御大厂的竞争。
转载请注明来自海坡下载,本文标题:《张帆seo深圳(95的AI应用都在失败模型越强应用越危险)》
京公网安备11000000000001号
京ICP备11000001号
还没有评论,来说两句吧...