这个宝座属于 Surge AI:一家成立五年没有融资、过去两年几乎不发新闻稿、员工仅为对手十分之一的神秘公司,却悄悄实现了超过 10 亿美元的营收。 37 岁的埃德温拥有美国麻省理工学院数学与计算机科学背景,曾在 Facebook、Dropbox、Google 和 Twitter 担任研究员、机器学习工程师等职位,负责开发推荐和搜索算法,并帮助收集训练这些算法所需的数据。 在 Facebook,他曾因等待 6 个月仍无法获得可靠标注数据而感到无奈,而且在他看来,最后获得的数据“完全是垃圾”。正因如此,这段挫败经验成为了日后创办 Surge AI 的动力之一。 他希望打造一套新型的人类数据平台,不只是提高标注效率,更要让 AI“理解”人类语言中的情感与风格。“在理想世界中,一个模型可以接受一个对于月亮的八行诗的提示,并写出一首让人落泪的诗。” 值得一提的是,Surge AI 另一位核心创始成员约瑟夫·李(Jefferson Lee)同样是华人,目前领导数据标签和内容审核产物,涵盖帮助客户评估大语言模型、内容审核,以及训练垃圾邮件和仇恨言论分类器。 与其他高调的硅谷 AI 初创公司相比,Surge AI 几乎不做公开宣传,创始人很少高调出席活动,不在 X 等社交平台上活跃(上次更新时间甚至追溯到 1-2 年前),也极少接受采访。 一位曾与之合作的科技公司高管这样形容他们:“无聊,但无聊得让人安心。他们很擅长把事情做好,我也不用担心 CEO 突然有一天上了新闻头条。” Surge AI 主要从事大语言模型训练所需的数据标注工作,完美踩中生成式 AI 发展的主线,其核心能力在于“通过人类反馈数据实现强化学习”,即所谓的 RLHF。 Surge AI 尤其擅长构建高质量的人类反馈数据,提升模型的安全性、风格一致性与复杂任务应对能力。其客户任务覆盖编程、数学、法律等专业领域。 比如,在协助公司训练代码生成模型时,其标注者不仅要写出正确代码,还要给出逻辑清晰、格式统一、语言风格一致的解释,以确保 AI 产出也能“写得像人”。 Surge AI 的具体工作流程外界知之甚少,但综合公开资料来看,他们会采用多重交叉审核、故意设置无正确答案的题目、跟踪鼠标轨迹、用词分析等手段监控标注质量。 为了确保问题的逻辑性与多样性,Surge AI 建立了由数学或 STEM 背景人员组成的标注团队,并对前期提交结果进行双人交叉审核。同时,通过语义相似度计算机制剔除重复或结构雷同的题目,确保训练数据的广泛覆盖与风格一致性。 专有质量控制技术,用于规避低质量数据对模型训练的长期影响;高学历领域专家团队,可处理包括数学、编程、法律、医学在内的复杂标注任务;快速实验接口,允许研究团队灵活迭代新任务,无需长时间撰写指导文档;红队工具,用于模拟攻击行为并测试现有安全防线;RLHF 专业能力,将团队在多个实验中总结出的经验用于保证数据的一致性与效果。 Surge AI 主要采用全流程交付模式,从数据任务定义、标注者筛选、界面工具提供、质量审查到最终输出,均由 Surge AI 承担,客户可实现“按下按钮即获得结果”。 这种模式使其成为 OpenAI、Anthropic、Meta 等大模型顶级玩家的长期合作方。尽管没有公开估值,但若以 Meta 对 Scale AI 的 290 亿美元估值为参考,Surge AI 的估值基本是同一水平。 另一方面,数据标注公司越来越多,价格竞争加剧。同时,Surge AI 也在今年 5 月卷入了诉讼,被指控“故意”将数据标注员定义为独立合同工,剥夺了他们“享受正式员工福利”的权利。 “人们往往真的低估了这个领域。”埃德温在接受采访时说,“他们认为人类很聪明、普通的博士也很聪明,所以他们招募 10 万个标注员,让他们肆意发挥。但我们发现事实并非如此。” 在“爆款故事+创始人 IP”的硅谷创业游戏里,Surge AI 反其道而行之:不讲融资神话、不追逐新闻头条,靠极致产物实力走出了一条成熟的 AI 基础设施之路。


