智东西(公众号:zhidxcom)
编辑 | Panken

智东西9月2日消息,成立短短1年4个月内,清华系AI Infra创企无问芯穹累计已完成近10亿元融资。

今日,无问芯穹(Infinigence AI)宣布完成近5亿元A轮融资。

无问芯穹于2023年5月在上海成立,由清华大学电子工程系教授、系主任汪玉教授发起,汪玉的第一任博士毕业生夏立雪担任联合创始人兼CEO。

该公司以“释放无穹算力,让AGI触手可及”为使命,致力于成为大模型时代首选的“算力运营商”,提供卓越的AGI算力解决方案,以大模型能效优化工具包为核心,向下联动多家国产芯片公司,向上通过智算云服务、智算一体机多种方式服务大模型算法企业,协同算力、算法、生态推动行业大模型的高效落地。

其A轮融资的联合领投方为社保基金中关村自主创新专项基金(君联资本担任管理人)启明创投洪泰基金

跟投方包括联想创投小米软通高科等战略投资方,国开科创上海人工智能产业投资基金(临港科创投担任管理人)徐汇科创投等国资基金,以及顺为资本达晨财智德同资本尚势资本森若玉坤申万宏源正景资本等财务机构。

无问芯穹的过往投资方还包括百度智谱同歌创投等战略股东,以及红杉中国、砺思资本、徐汇资本、北极光创投、真格基金、惠隆创投、经纬创投、无限基金SEE Fund、金沙江创投、星连资本、绿洲资本、南山资本、光源资本、七熹投资等众多知名投资机构。

清华系AI Infra创企融资近10亿,联想小米参投,多家国资出手

无问芯穹本次融资募集的资金将用于加强技术人才吸纳与技术研发,保持软硬协同、多元异构的技术领先优势;深入推动产品商业化发展,保持Infini-AI异构云平台产品与市场间的紧密嵌合;强化生态合作,激活异构集群算力资源,构建支撑“M种模型”和“N种芯片”的AI算力底座”。

“中国算力生态正面临的供需矛盾以及资源分布不均的现状,为我们拉动上下游协力实现多元异构算力的高效整合创造了时代机遇;而我们源于清华电子系的深厚底蕴、十余年的技术积累和丰富的产业经验所形成的产研结合的‘复合型’团队,更成为AI领域的人才‘引力井’,构成了无问芯穹独特的人才竞争力。”无问芯穹联合创始人、CEO夏立雪介绍说。

通过激活多元异构算力和软硬件联合优化,无问芯穹目标让大模型的落地成本降低至1/10000,如同“水电煤”一般,成为行业触手可及、广泛受益的新质生产力,加速AGI的普惠进程。

君联资本总裁李家庆谈道:“无问芯穹拥有一支行业稀缺且具有深厚学术积淀和丰富产业经验的‘复合型’队伍,以行业独有的大规模异构算力软硬联合优化技术,极大地推动了国产异构算力生态发展,构建中国本土化AI基础设施竞争力。”

“启明创投坚信,无问芯穹是一家能够创造行业拐点的企业,将在AI 2.0的时代浪潮中驭浪而行。”启明创投主管合伙人周志峰认为,“无问芯穹是行业少有对AI基础设施的发展脉络和行业格局拥有先见性和敏锐性的企业,在AI 2.0时代基于‘推理加速、多元异构’的核心能力,快速实现了核心技术的价值转化,为芯片硬件、智算中心、大模型和AI应用等产业上下游的每一个环节都提供了多快好省的解决方案,为大模型的降本增效带来更好的效果,在技术、产品和商业模式上都具有独到优势。”

另据洪泰基金执行董事虞扬分享:“在中国,算力异构问题以及不同硬件结构和软件的差异性给用户带来了更多挑战。无问芯穹打造了AI 2.0时代的异构云平台,统一了异构芯片与算法框架之间的接口,并在云端构建了一系列经过软硬件优化的中间件,实现了行业SOTA的性能表现。”

无问芯穹判断大模型的实际可用算力不仅取决于芯片的理论算力,还可通过优化系数放大算力利用效率,通过集群规模放大整体算力规模,由此提出“芯片算力×优化系数(软硬协同)×集群规模(多元异构)=AI模型算力”公式。

清华系AI Infra创企融资近10亿,联想小米参投,多家国资出手

遵循这一公式,无问芯穹将通过软硬件联合优化技术,持续提升芯片算力在大模型任务中的利用率,并通过多元异构算力适配技术,提升集群算力利用率,扩大行业整体算力供给。

在软硬件联合优化方面,FlashDecoding++大幅提升主流硬件和异构硬件的利用率,超越在先SOTA,完成多个主流开源大模型在AMD、华为昇腾、壁仞、寒武纪、燧原、海光、天数智芯、沐曦、摩尔线程、NVIDIA10余种计算卡上的适配,并在部分计算卡上实现了行业第一的推理加速成果,高效满足各行业愈发高涨的大模型推理需求。

基于这一方案取得的优化效果,无问芯穹已与AMD签署战略合作,携手推动商用AI应用的性能提升。

在多元异构算力适配方面,无问芯穹也拥有业界稀缺的异构适配与集群能力,7月发布的大规模异构分布式混合训练系统HETHUB,是业内首次华为昇腾、天数智芯、沐曦、摩尔线程、AMD、NVIDIA6种芯片“4+2”组合间实现了千卡规模的异构算力混合训练,集群算力利用率最高达到97.6%,平均高出基准方案约30%,这意味着,在相同的多元芯片机房条件或者集群条件下,无问芯穹可将训练总时长压缩30%

此外,无问芯穹依托软硬协同、多元异构技术优势,已基于多元芯片算力底座打造出Infini-AI异构云平台。该平台向下兼容多元异构算力芯片,可帮助下游客户轻松屏蔽硬件差异,能够有效整合并扩大国内大模型产业可用算力的规模,现已运营的算力覆盖全国15座城市。

Infini-AI异构云平台还包含一站式AI平台(AIStudio)大模型服务平台(GenStudio)

其中,AIStudio一站式AI平台为机器学习开发者提供高性价比的开发调试、分布式训练与高性能推理工具,覆盖从数据托管、代码开发、模型训练、模型部署的全生命周期。GenStudio大模型服务平台则为大模型应用开发者提供高性能、易上手、安全可靠的多场景大模型服务,全面覆盖了从大模型开发到服务化部署的全流程,有效降低了开发成本和门槛。

自平台上线以来,已有Kimi、LiblibAI、猎聘、生数科技、智谱AI等多个大模型行业头部客户在Infini-AI异构云平台上稳定使用异构算力,并使用无问芯穹提供的大模型开发工具链服务。

无问芯穹在端侧大模型LPU IP领域亦有超前布局,致力打造“端模型+端芯片”闭环能力。该公司相信端侧场景快速增长和应用爆发的必然趋势,AI PC、AI手机将成为未来人机交互的重要接口。