库克称苹果今年引入生成式AI;文心一言数字分身功能内测;商汤大模型体系日日新4.0发布丨AIGC大事日报

1、百度文心一言内测数字分身功能

2、商汤发布日日新SenseNova 4.0

3、谷歌Bard、搜索引擎新增文生图功能

4、谷歌Gemini Pro扩展至中文等46种语言

5、谷歌地图引入生成式AI功能

6、亚马逊推出对话式AI购物助手Rufus

7、库克:苹果将在今年晚些时候推出生成式AI功能

8、阿里发布手机操作智能体框架Mobile-Agent

9、巨人网络游戏大模型GiantGPT完成备案

10、网安局通报AI生成造谣文章案

11、万事达推出欺诈检测AI大模型

12、AI基础设施创企Astera Labs计划3月IPO

13、研究表明AI可以从婴儿视角学习语言

1、百度文心一言内测数字分身功能

据百度微信公众号发文,文心一言APP正在内测数字分身新功能,今日起,iOS和安卓用户可升级新版本免费试用。基于该功能,用户只需一张照片、录制三句语音,即可创建专属数字分身,并且支持个性化定义名称、声音、MBTI性格等,用户可选择是否公开自己的数字分身。

2、商汤发布日日新SenseNova 4.0

据商汤科技微信公众号发文,今日,商汤大模型体系日日新SenseNova 4.0发布,其知识覆盖面、推理能力、长文本理解力、代码生成能力等得到提升。其中,日日新·商量大语言模型-通用版本(SenseChat V4)支持128K语境窗口长度,综合整体评测成绩水平比肩GPT-4,相较GPT-3.5已经实现全⾯超越。商汤还推出了支持不同模态工具调用的日日新·商量大语言模型Function call & Assistants API版本,降低开发者使用大模型的门槛。

API申请网址:

https://platform.sensenova.cn/

3、谷歌Bard、搜索引擎新增文生图功能

今日,谷歌宣布在聊天机器人Bard中推出由Imagen 2模型支持的文生图功能。同时,谷歌推出新的文生图工具ImageFX,支持用户使用简单的文本提示创建图像,并提供新的提示修改建议。此外谷歌搜索和机器学习平台Vertex AI也将提供Imagen 2驱动的图像生成功能。

4、谷歌Gemini Pro扩展至中文等46种语言

今日,谷歌宣布聊天机器人Bard中的Gemini Pro模型将扩展至46种语言和238个国家/地区,其中包括简体/繁体中文。

5、谷歌地图引入生成式AI功能

今日,谷歌宣布在谷歌地图中引入生成式AI功能,利用大模型分析地图上超过2.5亿个地点的详细信息及超过3亿贡献者的社区意见,为用户提供寻找的内容或目的地建议,该功能本周起在美国推出。

6、亚马逊推出对话式AI购物助手Rufus

今日,亚马逊于官网发布对话式AI购物助手Rufus,目前向一小部分客户推出测试版,未来几周将扩展至更多美国用户。Rufus经过亚马逊的产品目录、用户评论、社区回答和网络信息的训练,可以回答用户关于购物需求和产品的问题,提供购买建议等。

7、库克:苹果将在今年晚些时候推出生成式AI功能

今日,苹果CEO库克在财报电话会议上称,公司正在开发生成式AI软件功能,这些功能将在“今年晚些时候”向客户提供,“我认为苹果在生成式AI和AI方面存在着巨大的机会,但我不想谈更多细节。”

8、阿里发布手机操作智能体框架Mobile-Agent

1月30日,来自阿里和北京交通大学的团队在arXiv上发表论文,提出了用于操作手机的智能体框架Mobile-Agent。据介绍,这是一个纯视觉解决方案,不需要XML(可拓展标记语言)和系统元数据,其操作范围不受限制,可进行多应用操作,配备多种视觉感知工具用于操作定位,且无需训练,即插即用。目前,Mobile-Agent已经学会了阿里巴巴、谷歌地图、TikTok等10个APP的操作,可以完成一些跨应用任务。

GitHub主页:

https://github.com/X-PLUG/MobilAgent

论文地址:

https://arxiv.org/abs/2401.16158

9、巨人网络游戏大模型GiantGPT完成备案

据游戏公司巨人网络微信公众号发文,巨人网络正式完成游戏AI大模型GiantGPT的备案,成为游戏行业首家对外确认实现了此成果的企业,相关备案结果今日在上海正式公布。即日起,巨人网络AI大模型GiantGPT的有关服务可以正式开展业务。据介绍,GiantGPT是专注于游戏业务的垂类大模型,结合巨人网络自有数据与互联网公共数据训练,并针对角色演绎、情景推理与长期记忆等基础能力进行优化。

10、网安局通报AI生成造谣文章案

2月1日,公安部网安局通报了一起利用AI发表造谣文章赚取佣金案件。网民王某在某APP上参加发布作品赚取佣金活动,因写作水平有限,便依托某款手机软件的AI题词功能写文章。王某在系统中输入带有“杀人、失踪”等敏感字眼的提示词,附以时间地点,就能自动生成博取眼球的文章。其利用AI编造的文字不仅骇人听闻,而且很多地方还“明确”了事件发生的时间、地点,误导读者以为这些事就发生在本地,信息被大量网民点赞、留言、转发,严重干扰社会秩序。目前,齐齐哈尔公安机关对王某处以罚款,同时责令删除相关谣言。

11、万事达推出欺诈检测AI大模型

据CNBC今日报道,支付巨头万事达称其已经建立了自研的生成式AI大模型Decision Intelligence Pro,以帮助银行实时评估其网络上的可疑​​交易,确定它们是否合法,从而检测并根除欺诈交易。据称,该模型基于Transformer从头开始构建,利用万事达生态系统中的数据进行训练,重点在于使AI理解“商家之间的关系”,而不是关注单词和文本。万事达网络和情报业务部门总裁Ajay Bhalla称,该模型进行欺诈检测的过程仅需50毫秒,可以帮助金融机构将欺诈检测率平均提高20%,在某些情况下最高能提高300%。

12、AI基础设施创企Astera Labs计划3月IPO

据外媒The Information今日报道,知情人士称,英特尔支持的美国云计算与AI基础设施创企Astera Labs一直在与潜在的投资者会面,计划在3月由摩根士丹利和摩根大通牵头进行IPO(首次公开募股),最早可能在本月公开招股书。据透露,Astera Labs今年预计产生2.5亿至3亿美元收入。该公司从2023年实现盈利,截至10月有200多名员工。2022年,Astera Labs的估值为31.5亿美元。根据与其类似的上市公司Credo Technology的估值,其现在的估值可能达40亿美元。

13、研究表明AI可以从婴儿视角学习语言

今日,来自纽约大学的团队在《科学》(Science)杂志发表论文,展示如何让AI模型从一个婴儿的角度去学习。研究团队在头戴摄像头视频上训练了一个神经网络CVCL,该网络捕获了来自澳大利亚的婴儿Sam从6个月到25个月大所看见的片段,他每周佩戴摄像机2小时,约占其清醒时间的1%左右。研究团队根据Sam的视频建立了SAYCam-S数据集,从中选取了61个小时的录像,包括60万张视频帧和3.75万段经过转写的录音,记录了大约25万个单词实例以及对应的图像。研究发现,即使数据有限,AI模型也能从数十个到数百个示例中获取单词到视觉之间的映射,而且能够将零样本泛化到新的视觉数据集,并实现多模态对齐。

论文地址:

https://www.science.org/doi/10.1126/science.adi1374