智东西(公众号:zhidxcom)
编译 | 陈佳
编辑 | 程茜

智东西3月26日消息,据外媒TechCrunch昨日报道,提供训练后数据和评估工作的印度创企Deccan AI完成2500万美元(约合人民币1.73亿元)A轮融资。Deccan AI成立于2024年10月,在过去一年业务规模实现10倍增长,年化营收已达数千万美元量级。该公司已服务约10家客户,客户名单中包括谷歌DeepMind和云数据平台Snowflake,约80%的收入来自前五大客户。

Deccan AI的核心定位,是填补前沿AI实验室自研能力之外的后训练空白。该公司创始人鲁克什·雷迪(Rukesh Reddy)说,后训练阶段对错误的容忍度接近于零,任何失误都会直接影响模型在生产环境中的表现。这使得后训练这一环节比早期训练阶段更难规模化。

本轮融资全部以股权形式完成,由A91 Partners领投,Susquehanna国际集团和普罗斯风投(Prosus Ventures)跟投。

Deccan AI总部位于旧金山湾区,在印度海得拉巴设有大规模运营团队,目前员工约125人,背后依托超过百万名贡献者组成的任务网络,每月活跃贡献者在5000至10000人之间。

Deccan AI创始人Reddy毕业于印度顶尖院校印度理工学院孟买分校(IIT Bombay),拥有印度管理学院艾哈迈达巴德分校(IIM Ahmedabad)MBA学位,此后在花旗银行、摩根大通和咨询公司Monitor Group从事金融和管理咨询工作超过15年。

帮谷歌DeepMind填补后训练空白,印度AI创企融资2500万美元,ARR超数千万

▲Deccan AI创始人鲁克什·雷迪(Rukesh Reddy)(图源:Deccan AI)

一、后训练需求快速外溢,模型落地能力开始依赖外部服务商

包括OpenAI与Anthropic在内的头部AI实验室仍将基础模型训练牢牢掌握在内部,但围绕模型落地的大量工作正在向外转移。从数据生成、结果评估到强化学习优化,后训练逐渐从附属环节变为决定模型可用性的关键步骤。随着企业推动大模型进入真实业务场景,对稳定性、准确性和可控性的要求显著提高,这一阶段的复杂度与成本同步上升,外部服务商开始承接越来越多任务。

Deccan AI正是在这一趋势中切入市场。该公司提供从代码能力提升、智能体训练到模型调用API等外部工具的一整套服务,使模型能够与真实软件系统交互并完成复杂任务。相比早期以文本处理为主的模型应用,当前行业正在向“世界模型”演进,涉及机器人与视觉系统,对数据质量和评估体系提出更高要求,这也进一步放大了后训练的需求。

该公司与谷歌DeepMind等前沿实验室合作,参与专家反馈生成、评估流程设计以及强化学习环境构建,同时向企业客户提供评估工具Helix和运营自动化平台。Deccan AI的客户还包括云数据平台Snowflake,目前已服务约10家客户,并在同一时间运行数十个项目。

伴随大模型商业化推进,围绕后训练形成的服务市场正在快速扩张。AI数据服务公司Scale AI与其竞争对手Surge AI,以及AI训练服务商Turing、AI人才平台Mercor等公司均在提供数据标注、评估与强化学习相关服务。与传统数据标注不同,这一阶段更依赖高学历专家参与,对数据的专业性与一致性要求更高,同时交付周期往往被压缩至数天之内,速度与质量之间的矛盾成为行业普遍挑战。

二、后训练质量容错率接近为零,速度与精度之间的矛盾加剧

在后训练阶段,数据质量直接决定模型在真实环境中的表现。Deccan AI创始人Reddy说,这一环节对错误的容忍度“接近于零”,任何标注偏差或评估误差都可能在上线后被放大,影响模型稳定性与安全性。这使后训练不再是简单的数据加工,而是需要高度专业知识参与的精细化过程。数据往往必须具备明确的领域属性,例如编程、金融或工程等专业场景。

这种高要求也带来了规模化难题。相比早期以图像识别为代表的标注任务,当前大模型后训练更依赖具备硕士、博士背景的知识型劳动者。Deccan AI的贡献者网络超过100万人,其中约10%拥有高等学位,在实际项目中这一比例会进一步提高。平台每月活跃贡献者在5000至10000人之间,覆盖学生、行业专家与研究人员,但即便如此,高质量数据供给仍然受到限制。

Reddy说,AI实验室往往要求在数天内完成大规模高质量数据交付,这意味着企业需要在极短周期内完成任务拆解、专家匹配与质量控制流程。对服务商而言,既要保证数据准确性,又要满足快速迭代节奏,是运营上的核心挑战。

围绕这一环节的用工模式也持续引发讨论。行业普遍依赖灵活用工来完成数据生产,不同平台的报酬差异较大。Deccan AI能给出的区间为每小时10美元至700美元(约合人民币69元至4834元)不等,顶级贡献者月收入最高可达7000美元(约合人民币4.83万元)。这一分布反映出后训练任务的分层结构,基础标注与高端专家任务在价值与门槛上差异明显。

结语:后训练外包市场成型,AI产业链分工格局初现

Deccan AI的融资是一个信号,说明围绕大模型落地形成的后训练服务市场已经具备独立规模。前沿模型的研发竞争仍在激烈推进,OpenAI、Anthropic、谷歌DeepMind与百度、阿里、DeepSeek等公司都在持续投入核心能力建设,但模型之外的后训练工作正在加速流向专业服务商。

这条产业链的分工逻辑已经清晰:谁来做模型、谁来做数据、谁来做评估,各自的位置正在成型。后训练不再是模型研发的尾声,而是决定模型能否真正落地的关键环节,围绕它形成的专业化分工,将是AI产业下一阶段竞争的重要变量。

来源:TechCrunch