智东西(公众号:zhidxcom)
文 | 心缘

智东西8月22日消息,今天英特尔和今日头条举办了主题为“数据赋能,AI正当时”的战略合作发布会。在会上,双方正式宣布联合成立技术创新实验室。

除了介绍双方在大数据和AI方面的全方位合作之外,英特尔和今日头条也分别分享了它们在各自领域的AI、大数据等方面的战略布局。

一、五年跨界合作,成立技术创新联合实验室

英特尔和今日头条在2018年接连完成三件大事,年初建立创新基金,然后是建立创新实验室,并在今天签订战略合作备忘录。

今天,双方正式宣布建立字节跳动-英特尔技术创新实验室。目前实验室刚刚启动,位于今日头条的数据中心。该联合实验室旨在更好的探索前沿技术,将热点和难点技术落地验证,为双方培养更多专业人才,夯实两家在各自行业的地位、影响和引领行业关键技术的发展,并与行业内其他企业分享成功案例。

字节跳动-英特尔技术创新联合实验室从技术、产品、应用和生态建设等多层面发力,主要围绕着将平台架构和技术架构、应用业务架构灵活结合,转化为生产力,从而将最前沿的技术落地到具体的项目和应用当中,加速产品技术创新。


▲英特尔行业解决方案集团中国区总经理梁雅莉

从2013年起,英特尔和今日头条在大数据和AI方面展开全面的合作。从产品选型到应用整合,从技术探索到功能实现,五年之间,他们的合作从数据中心和底层基础架构的硬件发展到软件、平台、开源组织,并拓展到从市场到品牌推广等方面的合作。基于Purley服务器平台的大数据分析、精准广告推送、用户行为分析等技术在今日头条和抖音的很多应用当中都有很好的使用。

如今,今日头条已100%采用英特尔最新一代至强可扩展处理器,并基于英特尔3D XPoint技术打造存储产品和网络。英特尔希望为今日头条提供强力的CPU,而且也能通过SSD的支持和AVX2/AVX-512等指令集和软件层的优化,为今日头条数据分析和AI应用赋能,从而提升客户端的用户体验。此外,双方还启用了CPU定制合作,为客户进一步降低成本。

二、今日头条:AI加码内容创作,建立定制化数据中心

作为一家致力于在全球范围建立内容与创作的平台,近两年来,今日头条产品日活跃用户数量的增长不断加速,促使他们需要改变信息创作的方式,并对基础设施有更高需求。

今日头条技术副总裁杨震原用具体数据加以说明,今日头条拥有海量计算和存储资源,每天数据处理量超过50PB,存量数据超过1500PB,其评论系统每天的评论数大概有1亿条,拥有每秒数十万用户请求,需要数万台服务器来处理这些内容。


▲今日头条技术副总裁杨震原

在产品需求的驱动下,今日头条积累起自己的技术优势,拥有多样的应用场景、海量数据和更完善的训练样本,实现人、数据、算法和内容间的反馈闭环,而且聚集了许多国内外的优秀人才。

今日头条用9个月不到的工期建立了定制化数据中心,该数据中心在实施过程中问到许多英特尔的技术。如今该数据中心已经满载运行。据介绍,数据中心是国内首个大平层预支框架结构的数据中心。


▲今日头条算法架构师曹欢欢

在全球化运营过程中,长距离传输是难点,数据规模也会进一步扩大,新的硬件的变化可能会带动未来计算模式的变化,这些都给今日头条在数据方面带来挑战。

今日头条算法架构师曹欢欢表示,今日头条是一家AI驱动的公司,Nanalyze公布世界十大AI初创公司名单,头条位列榜首。AI技术在头条的产品中得到广泛应用,包括内容推荐算法、自然语言处理、计算机视觉和语音识别。

今日头条算法架构师曹欢欢介绍到,推荐系统本质在于匹配用户、环境和内容。根据用户的个人特征、使用产品时的实际环境特征以及文章本身的主题词、标签、热度、来源等特征,进行个性化内容推送。典型的推荐特征有相关性特征、上下文特征、热度特征和协同特征四种。

今日头条从2014年起不断把最新基于AI的技术运用到产品之中。打造新闻推荐系统,不可或缺的就是基于AI的文本内容自动分析,今日头条通过这一技术实现分类、主题分析、实体词提取等任务。在2016年,头条发布AI撰稿机器人Xiaomingbot,既能批量生产报道又降低了成本,可读性不输人类编辑。此外,今日今日头条还通过AI识别过滤低质UGC内容。

除了使用自然语言处理技术(NLP),今日头条在计算机视觉方面也有很多技术应用,比如自动识别和分析图像内容、自动为用户推荐更好的封面建议、帮用户做视频剪辑等。曹欢欢以抖音上的实时图像切分的应用为例,人在高速运动状态下,头发渲染依然能呈现比较自然的状态。

有的视频会穿插语音广告或不良语音,今日头条运用AI将语音信息提炼成文本信息,即可及时发现有问题的语音并及时作出预警。

三、英特尔:合作赋能数字化转型

在AI时代,英特尔自身也在变革之中。英特尔市场营销集团副总裁兼中国区总经理王锐表示,英特尔的战略是为数据时代的未来奠定技术基础。以英特尔的AI战略为例,在横向上,英特尔提供从云端到核心网络的产品组合,并提供包括5G在内的先进无线连接技术;在纵向上,以端到端的设备为基础,英特尔提供从硬件组合、软件组合以及软硬件一体的全栈式解决方案。

英特尔也通过合作赋能各行各业的数字化转型。它推出AI平台和工具,并投入许多资源培训开发者,在丰富产业链中充当技术基石角色,将企业个体创新延展到产业链合作的创新。


▲英特尔市场营销集团副总裁兼中国区总经理王锐

除了分享英特尔在数据方面的全套解决方案,英特尔也回顾了该公司在半个世纪的发展与创新历程。

英特尔行业解决方案集团中国区总经理梁雅莉表示,英特尔的努力聚焦在以数据为中心的公司。在下一个十年,他们期待英特尔在存储型技术和AI有创新型突破。

结语:AI重新定义内容平台

用户需求驱动技术发展,技术进步促进产品体验升级。在推荐算法出现之前,人类通过书籍、报纸、广播电视和互联网来传播信息,而推荐算法的出现改变了信息分发的权利分配。在2016年之后,算法推送控制内容分发的比例逐渐超过人工推送的内容。

早早跨入以数据驱动的新工业时代,今日头条已经通过AI技术加固其在内容建设方面的布局。要想在数据经济的热潮中脱颖而出,合作共赢不可避免。英特尔和今日头条的战略合作结合了双方的行业优势,为内容行业的AI技术落地提供更大的发展空间。未来,我们可以期待在今日头条产品上看到更多技术创新转化为实际成果的实例。

zhidx