智东西(公众号:zhidxcom)
编译 | 长颈鹿
编辑 | 李水青
智东西5月9日消息,据外媒The Information 5月8日报道,小型AI初创公司Datology AI于昨日完成了4600万美元的A轮融资。该公司正通过整理AI训练数据集来解决数据集偏见和复杂度的问题,从而提升AI模型训练的效率和质量。
Datalogy AI在2024年2月22日完成了1165万美元的种子轮融资,两次融资的时间还不到三个月。
外媒The Information记者斯蒂芬妮·帕拉佐洛(Stephanie Palazzolo)发现市面上关于模型训练数据的具体细节一直是业界的一个未解之谜。为了提高AI模型的训练质量,Datology AI正在帮助研究和开发人员更有效的整理他们的训练数据集。
Datology AI于2023年成立,目前有11名员工。三位联合创始人之前来自不同的独角兽公司,前DeepMind和Meta Platforms AI研究员阿里·莫科斯(Ari Morcos)担任公司的首席执行官;前Twitter工程主管博格丹·加扎(Bogdan Gaza)担任首席技术官;前MosaicML(被Databricks收购)数据研究主管马修·利维特(Matthew Leavitt)担任首席科学官。
DatologyAI通过自动化和算法驱动的方法来整理训练数据,从而减少低准确性和耗费时间的人工决策。该公司通过算法来自动评估AI模型理解特定概念所需的数据量,但不同概念的复杂性决定了所需数据量的不同。
例如,因为“狗”种类很多,所以理解“狗”的概念可能需要更多的数据;而由于“大象”的外形相对一致,所需数据量可能较少。
Datology AI的算法会确保AI模型在训练中接触到足够多的“罕见案例”,这些案例能提高模型的泛化能力和异常处理能力。此外,Datology AI的研究团队采用了一种有序的数据呈现策略,他们依照从简单到复杂的顺序,通过逐步提高训练数据集的质量来训练模型。
记者帕拉佐洛在5月8日向莫斯科询问Datalogy AI短期连续融资的原因,莫斯科回答道:“公司计划利用这些资金进行更多的模型训练实验,以更好的提升模型性能的工作。”
来源:The Information