剪映前AI产品负责人创业多模态Agent,做懂上下文的007乙方,成立半月融资数百万美元
“当巨头忙着守,你就有机会去攻”
衡宇 发自 凹非寺
量子位 | 公众号 QbitAI
生数科技前产品副总裁廖谦创业了。
在此之前,他还先后担任过字节剪映与火山引擎前AIGC产品负责人。
8月底从老东家离职后,公司成立仅半个月,就已经拿下了硅谷美元基金HT Investment与BV百度风投的数百万美元投资。
他要做的是一件看起来很“产品人”的事——
打造面向营销场景的多模态Agent,同时将逐步构建新时代AI信息表达系统。
他给公司起名为极致上下文(Apex Context)。
这个名字来自他对下一阶段AI发展的理解:AI应该能深度理解并呼应用户的上下文,让生成的内容更精准、更贴合预期。
从人文一点的角度出发,他说这个名字背后是极致上下文的公司文化,希望它有“更多的Context,更少的Control”。

廖谦学计算机视觉技术出身,一路打拼,创业前最后一份工作的title是“产品副总裁”。
早年,他在鹅厂、字节推动很多项目从0到1,也在生数科技这样的初创AI公司留下拿得出手的漂亮成绩。
问起他对自己的评价,廖谦说从最早期的生成式AI,到如今多模态阶段,自己一路从算法到产品,再到商业化的完整路径都走过;做过国内市场,也做过海外市场;待过大厂,也有0到1的创业经验,“对于‘技术如何变成产品价值’这件事,有比较系统的理解,也有足够的实操经验。”
所以,当做出自己创业这个决定的时候,廖谦没有迟疑。
AI Agent创业,极致上下文要做什么?
今年8月底,廖谦正式成立极致上下文。
公司的首要目标是打造面向营销场景的多模态Agent。
营销是个生产力方向,很垂直,落点也很明确。
把营销场景作为切入的具体路径,无外乎营销场景需求明确、效果可量化、付费意愿强,在他看来,这里最能体现AI的真实价值。

而选择做Agent是因为它面向更广泛的用户群。
一个优秀的Agent可以像专业Agency一样理解雇主(也就是用户)诉求,从创意策划、脚本生成到视频成片,全流程自动完成,用户只需要输入品牌信息和风格需求。
做一个Agent,就像是给用户打造的一个全年无休的“007”乙方。
“Agent使用起来无需学习技能、交互极简,像人与人之间的交流方式。即便只有模糊的想法……甚至不确定自己想要什么,Agent都能理解并生成内容。”廖谦进一步解释道,“而且Agent以用户的结果为中心。我们告诉用户一个明确的价格和可达到的质量标准,让他来判断是否符合预期,从商业模式上来看,这更理想也更友好。”
他把这种模式称为“预期思维”或“结果导向”。
做AI工具,需要让用户学习功能、写提示词;做Agent,则需要Agent反过来理解人。
——好的产品一定会持续降低用户的各种成本,无论是使用成本(不需要学习和反复试错)、理解成本(用户能一眼明白得到什么)还是价格成本(花得明白、物有所值)。
当“为什么做Agent”的原因清晰后,极致上下文的用户主力画像就呼之欲出了, “我们的用户,是那些大概知道自己要什么,但不需要懂怎么做的人”。

廖谦表示,在产品路径上,极致上下文会先聚焦于营销场景下的AI Video Agent,“帮助品牌更好地做视觉化表达,提供从创意、脚本到视频生成、编辑的端到端能力”。
在中长期规划上,则是想搭建一个AI时代的信息表达系统,让任何人都能实现个性化自我表达的平台。
早期谷歌时期是搜索时代,人找信息;过去十年移动互联网是推荐分发时代,信息找人。
现在,大模型让“信息的表达”变得前所未有地容易,AI正在让“表达”这件事重新被定义。生成模型让任何人都能以更自然的方式去表达意图,无论是品牌还是个体,都需要更精准、更个性化的视觉语言。
所以他判断:
下一阶段的核心竞争力,是谁能帮人、帮品牌、帮组织更好地表达自己。
未来,这套系统的能力还可以拓展到教育、生活方式、娱乐等更多领域。
创业的底气从哪里来?
“我一直知道自己迟早会创业,只是一直在等一个值得真正All in的时刻。”
从技术周期上看,今年确实像是个拐点。
语义理解、镜头语言、画面真实度全面提升,Google Veo3和Sora 2等都用实际效果隐隐告诉行业,技术已经进入“可用”的临界点。
接下来就要看谁能把能力转化成真实的产品价值——廖谦眼中最值得All in的时刻,来了。

在过去十年的职业经历中,廖谦几乎完整经历了从算法到产品、从国内到海外、从大厂到创业的完整路径。
他本硕均就读于西安电子科技大学,本科电子信息工程专业,硕士阶段主修计算机视觉。
2015年硕士毕业后,廖谦进入腾讯天美游戏工作室,参与游戏研发;两年后,他转岗至腾讯云,负责AI人脸人体业务,从零起步将这条业务做到国内第一、全球第三。
腾讯工作的6年期间,他第一次体会到算法在应用层爆发的能量——当年风靡朋友圈、上线十几天冲到图片类榜单第一的“她拍”小程序,就由廖谦所在团队来提供人脸融合技术。

2021年,他加入字节跳动火山引擎,从0到1打造了“智能创作云”。廖谦表示,这是当时团队流量最高的产品。
两年后,他又在剪映内部孵化出海项目Pippit。他是当时这个项目的发起人,同时也是平台和商业化的负责人。
Pippit是一个海外商家的AI内容生产与分发平台,目前月活已超过百万。

到了2024年年初,Sora一石激起千层浪,几乎所有的AI从业者都在谈论走在东京霓虹灯下的墨镜女郎。廖谦猛然意识到,新的一轮技术周期开始。
趁着这股东风,他离开大厂,选择加入专注多模态基模的创业团队生数科技,开始主导Vidu的产品、研发、运营和营销工作,带领超百人团队。
在生数工作的一年时间里,他主导了十余次算法与产品迭代。
而这段经历中最被他看重的创新,是在生数行业首创了“参考生视频(Reference to Video)”功能。
参考生功能的意义在于多模态模型开始具备上下文记忆,它能理解不同主体及其特征,还能参考之前的素材和风格,实现内容的连续性和一致性。
就像AI在创作一部长剧,当它生成第十集时,已经理解前九集的风格和逻辑,能保持统一的调性。
(是不是就更能理解他为啥给自己公司起名叫“极致上下文”了?)
“这个时代没有传统意义上的护城河”
“你们公司的护城河会是什么?”
廖谦沉默了片刻,回答说:“这个时代没有传统意义上的护城河。”
他提到一个典型例子,Sora 2。它的发布不仅再一次证明了OpenAI的野心——不满足于做模型公司,要向产品和平台演进,更重要的是它搅乱了原本的竞争格局。
用更直白的话来说,Sora 2直接打到了抖音、TikTok、等巨头的腹地,侵蚀了它们的核心业务,迫使它们在核心业务上花大量资源、精力防守。
但对初创公司来说这是个好消息。
巨头互殴,过程中不得不拿出一部分精力自保,这意味着他们在其他方向上的创新会慢下来,创业公司就拥有了进攻窗口期。
当巨头忙着守,你就有机会去攻。
去定义新的内容形态、新的协作方式,甚至新的信息分发逻辑。
不过廖谦还说了,如果一定要说优势,应该是“我们对用户和场景的理解,以及团队的热爱”。
他想了想,表示最近极致上下文团队的大部分同学干劲满满,早上8点多就到了,大家每天工作几乎超过14个小时。

由于新公司早期业务聚焦AI Video Agent,还是在和视频生成打交道,我们询问了廖谦关于AI视频方面的未来预判。
廖谦判断,在模型层面,“一致性”是绝对可预见的提升方向,而且是接下来重点解决的方向。
因为就连头部梯队的Sora 2一致性也还不够好。“大家喜欢用Sora 2和奥特曼‘合拍’,里面奥特曼的角色一致性保持得比较好,但用户自己的形象大部分都不够好。”
除了画面之外,音色的一致性可能在未来3到6个月内基本被解决;画面美学,构图、光影这些要素也都有待提升。
One More Thing
“前几天和大厂的老同事吃饭,问我创业感受。”
“我的Co-founder的回复特别好——想听真话还是假话?真话就是,工作时长更长了,但反而没有大厂那么累。”
”创业是一种生活方式,这种感觉是焦虑,也是兴奋。”
“你知道自己在为一件值得全力以赴的事努力。”
