智东西(公众号:zhidxcom)
作者 | ZeR0
编辑 | 漠影

智东西6月30日报道,在本周举行的2023亚马逊云科技中国峰会上,亚马逊云科技全球产品副总裁Matt Wood发表主题演讲,分享了亚马逊云科技与生成式AI相关的想法、服务、产品、理念,以及如何解锁生成式AI的价值,并提供了使用数据开启生成式AI旅程的5条建议。

会后,Matt Wood接受智东西等媒体的采访,谈到亚马逊云科技的目标就是用尽可能简单的方法,帮助客户来构建自己的大型语言模型。面向工程师及开发人员,亚马逊云科技以极其简便的方式提供生成式AI的工具,使工程师和开发人员无需担忧底层基础架构,只需了解一些非常简单的API,选择所需要的模型,就能够输出想要输出的文本或者图像内容。

“亚马逊云科技应该是在所有的供应商中,实现了以最快、最低成本以及最简单易行的方式提供生成式AI模型。”Matt Wood说,亚马逊云科技的与众不同之处在于,要确保提供的生成式AI是普遍可用的,并通过使用定制芯片来以极低成本和尽可能低的延迟来向用户交付服务,同时确保操作或者运维性能的最优化。

他并不认同业界认为亚马逊云科技进入生成式AI赛道偏晚的观点。在他看来,生成式AI目前处于非常初期的阶段,生成式AI的发展就像一场马拉松,比赛刚刚开始,这是一场长期的竞争,还处于非常早期的阶段,要拭目以待,“我相信当我们接近终点的时候,每个人都会期望看到亚马逊云科技能够为客户在生成式AI应用程序构建方面提供最简单、最经济以及最安全的服务。”

一、单一模型不能包办一切,亚马逊云科技从4层解锁生成式AI的价值

Matt Wood将生成式AI的典型场景归为四类:

1、创意输出,如写作、设计、编码、建模等。

2、功能增强型场景,如搜索、总结、排序等。

3、全新交互式的体验,比如说让生手或者是一个专家和应用程序进行交互,使其能够产生新的知识和想法,以及通过和聊天机器人的互动探索一些数据,带来非常开放的知识。

4、决策支持,或在人工监督下自动执行复杂任务的应用程序。

随后,他分享了亚马逊云科技如何解锁生成式AI的价值:

亚马逊云科技Matt Wood:生成式AI就像马拉松,比赛才刚刚开始

(1)提供对一流基础模型的访问:亚马逊云科技不认为一个单一模型可以包办一切,希望用户能够访问多种不同的模型,然后根据自己的需求和数据来定制自己的模型。在新服务Amazon Bedrock上,用户可以通过亚马逊云科技托管服务,通过API访问来自AI21 Labs、Anthropic、Stability AI和亚马逊的基础模型,可降低使用基础模型构建和扩展生成式AI应用程序的门槛。

Matt Wood谈道,亚马逊云科技不会把Amazon Bedrock做成类似应用市场那样的模型市场,相反会选择那些最有趣的、最有用的模型,而且确保它们是低时延的、具有广泛可用的运维性能,最终在Amazon Bedrock上可能会有几十个拳头模型产品。

亚马逊云科技Matt Wood:生成式AI就像马拉松,比赛才刚刚开始

此外,他特别提到使用Amazon Bedrock能大大降低生成式AI输出错误信息的概率,因为用户可以使用自定义数据。亚马逊云科技非常注重负责任地运行这些AI模型,以确保它给出的答案和解决方案不会对用户产生伤害。

(2)提供安全私密的环境去定制模型:Amazon Titan是一系列不同的模型的库,可实现文本归纳总结、搜索结果嵌入、有害内容删减等,让用户非常安全、隐私地对这些模型做优化和微调。

亚马逊云科技Matt Wood:生成式AI就像马拉松,比赛才刚刚开始

3)通过定制芯片提供低成本和低延迟访问:亚马逊云科技自研定制芯片,包括推理芯片Inferentia和训练芯片Trainium,实现低成本、低延迟访问。

(4)提升使用体验:Amazon CodeWhisperer是亚马逊云科技基于机器学习为开发人员提供的一个代码生成的服务,支持Java、JavaScript、Python等15种不同的编程语言,提供50多种不同的安全检查,个人用户可免费使用。在测试中,与未使用CodeWhisperer的参与者相比,使用CodeWhisperer的参与者完成任务的速度平均快57%,成功率高27%。

Matt Wood建议用户可以考虑使用亚马逊云科技提供的Amazon Bedrock,能以非常快速和简便的方式来构建自己的预训练模型。此外,亚马逊云科技的很多客户都在使用Amazon SageMaker来进行大语言模型的训练。通过Amazon SageMaker JumpStart,用户可以选择他想要的基础模型,然后进行重训练,使用这样的自建模型来使其能与客户需求高度匹配。

Falcon开源模型也可以和Amazon SageMaker一起使用。亚马逊云科技和Hugging Face有长期且深入的合作伙伴关系,现在已经有上百个机器学习模型,其中包括大型语言模型,可供用户选择使用和在亚马逊云科技上进行部署。

二、数据是生成式AI的起点,三个云原生数据战略解析

“数据对于生成式AI而言是所有一切的起点。”Matt Wood说,亚马逊云科技在这方面的做法是云原生数据战略,主要有三件事需考虑:

战略一:全面提供适合任何用例的工具集,满足现在和未来所需。亚马逊云科技推出15种专门构建的云上托管数据库服务,为各类用户的应用场景提供契合的数据服务,其分析服务已全面实现Serverless化,包括交互式查询服务、大数据处理服务、实时分析服务、数据仓库服务、数据集成服务、商业智能服务、运营分析服务等。

亚马逊云科技Matt Wood:生成式AI就像马拉松,比赛才刚刚开始

战略二:轻松集成,连接所有数据。所有的工具要非常好的整合起来,能够在整个系统内方便自由移动连接所有的数据。亚马逊云科技提出了Zero-ETL的愿景,致力于实现无缝的数据转换和调用,而用户不用编写任何的代码。最近,亚马逊云科技推出了Aurora新服务,Aurora可以与Amazon Redshift进行Zero-ETL集成,允许使用Amazon Redshift对来自Aurora的PB级事务数据进行近实时分析和机器学习 (ML)。事务数据在被写入Aurora后的几秒钟内,即可用在Amazon Redshift中,因此用户不必构建和维护复杂的数据管道来执行提取、转换和加载(ETL)操作。

战略三:构建端到端的数据治理。通过数据治理,加速并保障数据流通。亚马逊云科技去年推出的一项全新的数据管理服务Amazon DataZone,可以让客户更快、更轻松地对存储在亚马逊云科技、客户本地和第三方来源的数据进行编目、发现、共享和治理。借助Amazon DataZone,管理员和数据资产管理者可以使用精细的控制工具管理和治理数据访问权限,确保数据访问发生在正确的权限和正确的情境之下。

三、使用数据开始生成式AI的5条建议

Matt Wood还提出了使用数据开始生成式AI的5条建议:

第一,基于现有的数据战略去做构建。投入很多的时间和精力构建自己的数据战略和数据湖,把所有数据存储进去设置相关的治理框架,在生成式AI时代,这是一个巨大的先发优势,能够去利用现有一些投资跟生成式AI的模型结合,在此基础上来实现一些全新应用,去将优势进一步放大,让生成式AI的能力放大。

第二,在组织内更广泛、更安全地做生成式AI的实验。亚马逊云科技希望在组织内部设置相关的安全护栏,同时在构建团队方面能够给更高的自由度。

第三,为需求场景定制化模型。

第四,亚马逊云科技非常乐意跟大家合作,来探讨在生成式AI方面的机会。

最后,选择场景,即刻启程,构建未来。Matt Wood鼓励大家在理解技术以及了解框架治理之后,找到自己想要攻克的用例,大力推进。

结语:预测明年达到技术能力S曲线的顶点

亚马逊云科技在为客户提供广泛的机器学习能力方面有着悠久的历史,过去10年间提供了从底层芯片到Amazon SageMaker机器学习服务和开箱即用的AI服务的每一个级别的机器学习能力。

Matt Wood说,亚马逊的各个部门,包括零售部门、硬件设备部门、Alexa广告、云服务等等方面,都对于生成式AI的发展感到非常兴奋,他们也在制定工作计划,来提升各种能力,为在这个领域取得成功而努力。

“技术能力往往遵循S曲线。你永远不知道你在S曲线上的位置,除非你向后看。”他谈道,“我们相信明年回头看时,我们看到我们已经达到了S曲线的顶点,达到了快速爆发式发展的点,有很多的发明和应用。”