智东西(公众号:zhidxcom)
作者 | 程茜
编辑 | 心缘
智东西8月9日报道,本周三、四,在北京举行的Google I/O Connect China(2024谷歌开发者大会)上,谷歌来自全球不同领域的技术专家阐释了谷歌的最新开发者工具和技术。
谷歌大中华区总裁陈俊延谈道,中国是全球最大的开发者市场之一,过去一年,中国25个开发者团队,开发了31款游戏和应用,在全球不同地区获得50个Google Play年度最佳奖项。
此外,谷歌开发者中文网站上推出了谷歌AI页面,开发者可以获取相关技术更新与资讯,中文专题页面的Codelab、Chrome、Web专题页面均已上线。
一、Gemini三大模型可满足不同开发需求,小米SU7应用基于Flutter开发
Google Developer X和开发者关系副总裁兼总经理Jeanine Banks带来了AI工具和技术更新的分享。
AI正在从根本上重塑软件开发,让每一位开发者提升开发效率,谷歌提供了三种不同规格的Gemini模型,包括Gemini Nano、Gemini 1.5 Flash、Gemini 1.5 Pro。
其中Gemini Nano可以直接在设备端运行,能实现快速响应和保护数据隐私;Gemini 1.5 Flash是谷歌目前最快最经济的模型,适合处理高容量任务,为开发者提供了100万个Tokens的超长上下文窗口;Gemini 1.5 Pro的回答质量更高,适合处理复杂任务,谷歌已经面向使用Gemini 1.5 Pro的所有开发者开放了200万个Tokens的上下文窗口。
更大的上下文窗口可以提升模型性能,还有助于开发者发掘新的应用场景,也会消耗大量的计算资源,基于此,谷歌近日为Gemini 1.5 Flash、Gemini 1.5 Pro推出了上下文缓存功能,开发者可以将提示中不变的内容进行缓存,后续可以即时调用。
做出海应用的开发者可以使用AI Studio免费使用这些模型,省去训练和维护模型的时间。
Gemma系列模型可以满足开发者希望根据具体应用场景对AI进行微调的需求,Jeanine称,Gemma和Gemini系列模型一脉相承,共享底层技术和工具。
谷歌已经正式发布Gemma 2模型,新增了参数规模达到90亿和270亿的两种模型。270亿参数规模的模型针对英伟达GPU进行了优化,可以在Google Cloud的单个英伟达GPU、Vertex AI的单个GPU上高效运行。
Jeanine称,Gemma 2的性能表现超越了参数规模比它大两倍的模型。
Gemini已经集成到Android Studio、Chrome DevTools等诸多开发工具中,可以获取应用设置、性能数据、日志和源代码等信息,帮助开发者编写、调试和测试代码、生成文档等。
谷歌开源的应用开发框架Flutter升级到3.24和Dart 3.5版本,改进了在macOS上对Platform View和Webview的支持。新的API早期预览版Flutter GPU直接内置在Flutter SDK中,可以允许开发者使用Dart代码访问GPU,提升图形的渲染能力。
Jeanine称,中国的Flutter开发活跃度位列全球前三。
谷歌正在构建User Scene的软件包,可以将不同行业标准的3D模型直接导入Flutter项目中。
小米电动汽车SU7的配置应用就是基于Flutter打造,小米汽车的应用程序提供了一整套功能,可以实现远程车辆控制、接收车辆状态的实时更新等。小米汽车智能座舱手机APP客户端高级研发工程师陈作斌谈道,他们预估使用Flutter比使用原生框架的效率要高60%。
此外,Android Studio Project IDX的早期预览版已经推出,完全运行在浏览器中,开发者可以快速搭建起运行Android Studio的工作区,开始编写、构建和测试原生Android应用。本地Android Studio和云端IDX工作区都可以满足开发者开发需求。
在安全性方面, Firebase AI Monitoring可以实时监控开发者使用大语言模型构建的功能,在生产环境下的性能和行为,目前这一产品处于非公开预览阶段。谷歌还推出了Checks AI Safety,可以用于评估监控和监督AI模型和代理的合规性。
三、Gemini Nano已内置Chrome桌面客户端,多项UI设计工具已发布
设备端的AI模型为云端模型提供了补充,让开发者能以更低的成本、更少的容量限制、更强的数据隐私保护来交付解决方案,无论基于哪个模型构建响应AI功能,WebGPU和Web Assembly都是端侧Web AI的基石。
WebGPU已经支持16位浮点数值,Web Assembly集成了Memory 64和JavaScript Promise,基于此,开发者构建的模型可以在全球绝大多数设备上高效运行。
谷歌Chrome开发技术推广部主管Paul Kinlan谈道,视频弹幕平台BiliBili结合使用了Web Assembly和MediaPipe的图像识别技术,成功实现了弹幕不遮挡画面人物的功能,使得会话时长增加30%,点击率增长19%。
从Chrome 126浏览器版本开始,Gemini Nano会直接内置到Chrome桌面客户端中。其中“帮我写”这个功能就可以帮助海外用户撰写商品评价、客户反馈等。为了实现这个功能,谷歌对Gemini模型最高效版本进行了微调。
谷歌还在开发Prompt API,开发者可以通过这一工具使用自然语言,向Chrome中的Gemini Nano发送指令,全程不会有数据离开本地设备。
强大的AI功能离不开优质UI,谷歌也推出了新功能帮助开发者打造应用。
谷歌发布Speculation Rules API,可以通过在后台预读取、预渲染页面,提升站内的浏览速度。面向单页应用,谷歌推出了View Transitions API,可以实现更加顺畅的导航。
在调试和优化应用方面,Chrome Devtools能够在网站发生错误时发出警告和提示,同时Chrome Devtools Insight可以快速分析问题所在,并且根据代码提供合理的解决方案。
三、Gemini Nano没网也可运行,Compose简化跨设备应用构建流程
谷歌安卓开发技术推广部主管史婧羽谈道,使用Gemini Nano实现的AI功能不需要网络就可以在设备上完成所有操作。
Gemini Nano通过AICore系统服务实现,为了应对管理打包和分发大语言模型的复杂难题,AICore可以负责管理设备上的基础模型,开发者能直接使用。
Gemini Nano和AICore现已登陆谷歌Pixel 8和三星Galaxy S24系列。
未来几个月,谷歌将进一步开放Gemini Nano的使用权限。
今年,谷歌将支持跨平台代码复用技术Kotlin Multiplatform用于业务端,使得开发者可以在Web、服务器和桌面平台间共享代码。谷歌在DataStore、ViewModel、Room等多个Jetpack库添加了Kotlin Multiplatform支持。
写作工具Compose增加了共享元素过渡等功能,可以帮开发者处理过渡中大小变化、文字动画等,同时原生支持了预测返回手势。谷歌打造了一系列新Compose API,帮助开发者构建符合设计规范的自适应布局。
谷歌联合小米、OPPO、三星等手机玩家,将这些品牌的设备实验室接入由FireBase支持的Android Device Streaming测试平台,开发者可以在真机设备上直接验证自适应应用,包括折叠屏手机和平板电脑。
谷歌同样助力和简化了困难的开发任务,例如Android Studio中的Crashlytics功能,不仅可以在源代码中快速定位错误,还能基于Gemini的分析能力提供修复建议。
开发者可以在内置AI隐私设置中,选择分享或不分享哪些数据。
四、拆解谷歌云端新平台五大特征,Vertex AI一站搞定模型训练、调优和部署
Google Cloud首席布道师Richard Seroter介绍了谷歌打造的云端新平台的五个特征。
首先是实力超群,优势独享。云端新平台能带来全新构建方式、自动化、多功能、深度集成等。Vertex AI可以一站搞定模型训练、调优和部署。
Gemini 1.5 Pro可以支持超200万个Tokens的上下文窗口,相当于2小时视频、20小时音频、1500页文档和6万行代码。Vertex AI在处理谷歌中国一段25万个Tokens的讲座视频时,Gemini 1.5 Pro可以同时识别视频中的声音和画面,并能自动翻译。
其次是自成体系,灵活拓展。Google Cloud可以配置服务生产集默认值,及对开源接口的支持。Vertex AI中提供了150多种模型,包括谷歌自家、Anthropic、Meta等发布的模型。
第三是破除壁垒,便捷跨云。云端新平台可以为开发者量身打造解决方案,满足其在本地JKE集群部署或者其他云平台部署的需求,让用户在不同云平台之间迁移和管理资源。如BigQuery Omni允许用户在多个主流云平台上运行BigQuery而无需迁移数据;AloyDB Omni提供了无限制的数据库部署环境。
第四是化繁为简,轻松构建。Google Cloud平台通过自动化和智能默认设置,简化了云基础设施的搭建和管理过程。现在开发者可以在45分钟内搭建起生产级的云基础设施,实现多方面功能。
最后是AI助力,智能随心。Gemini for Google Cloud深度融入云体验,包括IDE插件提供代码生成、补全、解释和测试生成等功能;Gemini in Databases将AI智能融入SQL生成、数据库操作等任务。
结语:谷歌用AI新工具,助力中国开发者出海
谷歌此次重磅发布了新的开发工具,可以为开发者提供更强大的功能和更便捷的界面,帮助开发者基于大模型能力更快速地构建、测试和部署应用程序。
从Gemini API的强大数据处理能力到谷歌AI Studio的集成开发环境,再到AI技术的跨平台应用,谷歌正不断帮助开发者拓宽应用构建的边界,这或许会加速国内开发者更快构建应用,让产品在全球市场更具竞争力。