第四范式推软硬件一体化AI集成系统,支持百万级实时并发请求

智东西(公众号:zhidxcom)
文 | 心缘

智东西6月20日报道,今天,人工智能(AI)独角兽企业第四范式在北京发布新一代AI全线产品阵列——软硬件一体化AI集成系统SageOne Appliance,以AI业务场景应用为目标导向,为企业AI转型提供从AI平台到AI核心引擎、硬件基础设施一体的全栈能力支撑。

据介绍,SageOne在硬件方面采用英特尔新一代Cascade Lake AP处理器,结合第四范式自主研发的4PD ATX机器学习加速卡,并搭载无限缓存和Swift高吞吐零拷贝网络。SageOne将带来特征维度的指数级提升,支撑20亿维特征模型实时2万次并发请求,其中99.9%请求在20ms内响应,平均响应延迟5ms。

另外,第四范式还发布自动机器学习平台AutoML2.0和“启航”合作伙伴计划。第四范式表示,AutoML2.0是世界首个交互式AutoML,同时具备自动跨表特征增强能力。

会议期间,第四范式创始人兼CEO戴文渊、第四范式联合创始人兼首席架构师胡时伟接受智东西等媒体的采访。

去年12月,第四范式完成逾1.5亿美元C轮融资,成为“中国五大行”联合投资的第一家创企,估值约12亿美元,并于2019年2月入选CB Insights全球AI百强榜及领军独角兽榜单。

关于上市计划,戴文渊表示,第四范式短期内没有明确上市计划,上市会在第四范式的路线中,不过这只是第四范式发展中的一个步骤,最终板块的选择要符合第四范式未来的发展。

当被问及是否有下沉做芯片的计划,胡时伟认为,从做产品的角度来讲,第四范式紧跟市场发展,希望引领市场需求,会在恰当时期推出符合需求的产品。如今到了从软件符合算力到软件定义算力的阶段,第四范式现在先做到骨架的改变,未来逐渐做到极致。

一、发布SageOne Appliance:软硬件一体化AI集成

无论是追求核心场景的极致效果,还是规模化落地大量AI应用场景,机器数量和TCO都在指数级增长,其成本会阻碍AI快速落地。

传统算力和AI应用负载间存在天然鸿沟,传统算力只是解决在计算、访存、I/O带宽的局部密集问题,而AI应用负载则需要解决全部密集的问题,因此不是运行AI应用的最佳选择。对此,第四范式提出的方法是根据AI系统定义AI算力。

今日,第四范式联合创始人兼首席架构师胡时伟发布第四范式新一代AI全线产品阵列——SageOne Appliance软硬件一体化AI集成系统。

第四范式推软硬件一体化AI集成系统,支持百万级实时并发请求

针对需要高性能、平台级、开发投产的大型企业,第四范式推出SageOne Advanced,包括AI训练引擎AD8200、AI推理引擎AR5200、AI特征存储引擎AR5400。

针对中型企业或者处于拥抱AI初级阶段的企业,第四范式推出SageOne Standard产品,包括AR2200和AR4400两款产品。

针对部门级开发验证,第四范式提供单场景的SageOne WorkStation,包括AR3200和AR2400。

胡时伟表示,这些产品将在发布会结束后陆续向市场供货。

第四范式推软硬件一体化AI集成系统,支持百万级实时并发请求

1、硬件基础设施

第四范式提出软件定义计算的概念,在硬件基础设施层,SageOne Applicance和英特尔实验室合作,针对最新Cascade Lake-AP处理器的全新AVX512指令集、多核心及主频利用率和CLX AP微架构IO总线的利用率进行全面优化。

以第四范式高维算法为基础,SageOne搭载了第四范式自主研发的机器学习加速卡4Paradigm ATX800内置模型训练和特征工程等多种加速能力,支持自动优化训练超参数、高位特征计算过程I/O加速和高维GBDT训练加速等应用,在企业应用场景中表现出高达10倍的训练性能。

SageOne内置第四范式自主研发的高维、分布式网络通讯协议Swift,集成pPRC自研网络通信框架、零拷贝数据交换协议等AI领先通讯技术,结合基于CLX-AP架构的参数服务器集群,展现出业界顶级机器学习性能表现。

此外,SageOne Applicance提供三类AI核心引擎,覆盖训练、推理和存储。

2、SageOne AI平台

SageOne AI平台包括数据管理平台、学习全开发平台、应用运维平台和AI开发、运行时环境。

第四范式推软硬件一体化AI集成系统,支持百万级实时并发请求

该平台可以为企业带来更低技能门槛、更高开发效率、更大规模效应,以构建AI应用。

3、SageOne AI训练引擎

不同于一般的开源学习框架,SageOne AI训练引擎专为高维特征计算而设计,支持万亿级高维机器学习算法。

第四范式推软硬件一体化AI集成系统,支持百万级实时并发请求

该框架能将高维特征计算过程I/O加速最大10倍,在高维稀疏场景模型训练比GPU至少提速5倍,其自研pRPC通信框架比百度bRPC快3-5倍、比谷歌gRPC快5-10倍。

硬件加速方面,采用3个方式。一个是 FPGA加速卡,能成倍提升训练速度;二是打造  服务器集群,三是零拷贝数据交换协议,能成倍提升AI系统效率。

4、SageOne AI推理引擎

SageOne AI推理引擎内置无线缓存技术,可实现极速实时AI推理,支持百万级并发实时请求,能做到99.9%的请求在毫米级响应,还能实现海量时序特征计算、万亿维模型实时推理以及预测结果精准触达。

第四范式推软硬件一体化AI集成系统,支持百万级实时并发请求

4、SageOne AI存储引擎

SageOne AI存储引擎打造了超低延迟AI数据治理架构。

据介绍,其AI特征数据库RTIDB是是业界首个只面向AI进行优化的数据库。相比传统数据库,RTIDB对数据吞吐量和一致性要求更高,能够实现毫秒级海量特征数据供给,以及自动切换存储介质优化TCO还有RAFT一致性灾难备份与恢复功能。

依靠这些技术,SageOne AI存储引擎实现超低延时的在线数据服务。

第四范式推软硬件一体化AI集成系统,支持百万级实时并发请求

下图展示了在不同特征维度下SageOne和开源工具、GPU解决方案的比较,以及SageOne和传统服务器的比较。

第四范式推软硬件一体化AI集成系统,支持百万级实时并发请求

SageOne这一架构带来特征维度的指数级提升,在核心场景的海量实时业务决策中,15SageOne推理引擎节点都够支撑20亿维特征模型实时2万次并发请求,其中99.9%请求在20ms内响应,平均响应延迟5ms。

此外,SageOne带来更高的开发效率、更低的TCO,使得AI应用平均的上线周期从30人一个月最低降低数十人一天。在算力方面,SageOne将AutoML算力消耗降为原来的几十分之一,通过算力和消耗的降低,1年可上线数百个应用场景,助力企业实现AI规模化落地。

二、提出世界首个交互式AutoML技术AutoML 2.0

AI应用规模化的前提是实现低门槛、自动化的AI技术,而第四范式的AutoML产品正是帮助企业AI走向规模化生产流水线的关键性技术。

SageOne内置第四范式自研的AutoML算法,覆盖企业AI应用从数据准备、自动数据标注、自动模型选择、模型一键上线、模型迭代自学习等端到端的全栈流程,助力企业实现低门槛、高效率、大规模构建AI应用。

第四范式推软硬件一体化AI集成系统,支持百万级实时并发请求

第四范式联合创始人兼首席研究科学家陈雨强首次提出了全新特性的AutoML 2.0技术。他介绍道,AutoML 2.0不仅是世界首个交互式AutoML,同时具备自动跨表特征增强能力。

在Kaggle机器学习竞赛中,第四范式AutoML 2.0与数据科学家共同挑战多项竞赛,竞赛结果数据显示全世界平均每7-10位数据科学竞赛选手,只有1位能击败第四范式AutoML 2.0。

而在结构化机器学习问题上第四范式AutoML 2.0比Google Cloud AutoML排名靠前61.2%,在图像分类问题上比它排名靠前64.2%。

基于目前企业AI应用的痛点问题,第四范式未来还将引入隐私保护迁移学习(AutoPTL)、自动半监督机器学习(AutoSSL)、自动正样本和无标签样本学习(AutoPU)、自动知识图谱嵌入(AutoKGE) 等众多自动化技术到产品体系中,进一步提升企业AI应用率和价值。

第四范式推软硬件一体化AI集成系统,支持百万级实时并发请求

此外,第四范式还展示了全面国产化的AI软硬一体机——领航,该产品内置国产化的CPU、BIOS、网卡和操作系统等软硬组件,深度融合第四范式独有企业级先知Sage平台中自研高维机器学习框架、AutoML和实时自学习等突出优势。

据悉,领航可提供不逊于市场其他主流软硬一体机的算力表现,保障企业更安全、可靠的算力应用。

三、发布“启航”计划,建立五大赋能中心

在现场,第四范式还宣布开启“启航”合作伙伴计划,着力打造基于“先知”平台的生态体系建设。

第四范式商务副总裁梁军在“启航”计划启动仪式上表示,推动各领域的企业AI转型,进入到新范式,仅靠第四范式一家公司的力量是不够的,第四范式面向合作伙伴和开发者的开放,将越来越全面和深入,让越来越多的行业和企业能够低门槛地获取AI能力。

第四范式推软硬件一体化AI集成系统,支持百万级实时并发请求

梁军说,第四范式建立起产品赋能、咨询赋能、交付赋能、营销赋能、技术赋能五大赋能中心,正与广大解决方案商、咨询服务商、实施服务商、渠道分销商及开发者开展生态合作,形成一个强强联合、互补共赢的AI合作伙伴生态,共同启航AI蓝海。

四、戴文渊:以“1+N”为产业变革目标导向

第四范式创始人兼CEO戴文渊以“产业变革的新范式”发表主题演讲。

1998年Jim Gray于2005年提出《第四范式》,认为未来科学会进入数据科学阶段,计算机从海量数据中发现规律,形成理论诠释自然现象。

戴文渊表示,第四范式时代有两大特点:科学规律数量井喷,产业全面进入科学时代。

第四范式曾帮助某银行千元以下分期交易提升6倍,过去这家银行的专家总结归纳了数百条营销规则,

此外,第四范式还曾帮助某保险公司使其保险赔案风险审核准确率达96%,在能源行业帮助某石油企业化工品价格预测1-7天的平均准确率达99.33%,在零售领域帮助某零售企业的销售预测准确率提升50%,在医疗领域使得糖尿病预警准确率同专业医生协会相比提升3倍,在媒体领域帮助某国内最大单机游戏媒体点击率提升19倍。

像这样的例子还有很多,在过去4年,第四范式帮助7617个客户在12648个场景借助AI实现智能化升级,其背后原理都是从海量数据寻找规律的能力。

戴文渊提出企业的成功评估体系:每天找到多少个客户新需求?每天能发现多少降低成本新方法?每天能得到多少提升企业运营效率新思路?

戴文渊将企业智能化转型的模式提炼成“1+N”,“1”代表效果,“N”代表规模。

第四范式推软硬件一体化AI集成系统,支持百万级实时并发请求

“1”指的是利用AI达到极致效果,在自己的核心业务上建立绝对优势,包括如何充分发挥数据价值,以及如何从“事后分析”变为“实时决策”等。

“N”指的是降低基础设施成本,提高规模化落地效率,包括如何让Web开发者也能开发AI应用,以及如何解决AI落地过程中数据瓶颈。

全面智能化给企业带来业务价值的聚变。中大型企业往往拥有成成千上万个场景,万分之一场景提升一百倍,对于企业也仅仅是提升1%,但如果将每个场景都提升50%,对于企业而言就提升了50%。

规模化落地前,12个月只能落地1个应用,而规模化应用后,1个月能落地N个应用。

第四范式推软硬件一体化AI集成系统,支持百万级实时并发请求

极致的机器算力同样非常关键。对于“1”,需要考虑如何提供充沛算力,保证核心场景的机制效果;对于“N”,需要如何提供高效算法,降低AI规模化落地的TCO。

第四范式过去专注于提供更好软件平台和方法论,如今正在向更高效、更低成本的硬件努力。

五、企业全面智能化转型的新范式

第四范式联合创始人兼首席架构师胡时伟认为,要实现极致业务效果,需要高维+实时。

要充分发挥数据的价值,需要高维算法和海量特征带来业务效果的提升;而从“事后分析”变为“实时决策”,需要实时AI推理以完成实时决策。

信息爆炸带来数据量激增,过去两年产生人类历史上90%的数据,海量数据需要高VC维。5G时代的AI应用需要毫秒级精准实时决策,互联网时代需要每秒几十KB的速度,移动互联时代需要每秒几十MB的速度,而智能物联需要每秒50GB的速度,决策周期以毫秒计。

新的技术在落地过程中往往因为对落地的认知不足造成障碍,机器产生价值的核心是能够学习,闭环AI应用是先确定AI要解决的问题,制定明确的目标,让机器采集行为数据,然后反馈数据,通过算力和算法进行模型训练,实现模型应用,再将模型放到实时场景作为接口,进行新的一轮行为数据采集。

构建闭环AI应用存在两大挑战:数据和模型。

第四范式推软硬件一体化AI集成系统,支持百万级实时并发请求

在传统BI数据治理中,存在无法满足AI实时性需求、纬度降低和信息量折损、无法做到线上线下一致性、无法为AI提供准确样本等问题。

在AI应用开发周期中,数据准备占据60%人天成本。胡时伟也提出了AI数据治理的4个关键要素,包括数据采集访问双实时、全量原始数据、线上线下一致性、利用回流数据自动标注。

结语:传统企业智能化转型方法论

AI落地潮在持续推进中,从AI应用相对成熟的安防、金融行业,到医疗、能源、制造、媒体等越来越多的细分领域,AI正成为推动传统企业提高未来竞争力和走向变革和升级的关键钥匙。

尽管不同行业对AI的期望有共性,但部分传统企业在对AI的认知、以及人才的配套层面还存在问题。

戴文渊认为,传统企业想要实现智能化转型,首先是意识转变的过程,要聚焦核心场景,确定明确清晰的应用目标,其次在企业组织上也要进行一定的重新整合,才能更好地适配引入AI应用的需求。