库克称苹果今年引入生成式AI；文心一言数字分身功能内测；商汤大模型体系日日新4.0发布丨AIGC大事日报

1、百度文心一言内测数字分身功能

2、商汤发布日日新SenseNova 4.0

3、谷歌Bard、搜索引擎新增文生图功能

4、谷歌Gemini Pro扩展至中文等46种语言

5、谷歌地图引入生成式AI功能

6、亚马逊推出对话式AI购物助手Rufus

7、库克：苹果将在今年晚些时候推出生成式AI功能

8、阿里发布手机操作智能体框架Mobile-Agent

9、巨人网络游戏大模型GiantGPT完成备案

10、网安局通报AI生成造谣文章案

11、万事达推出欺诈检测AI大模型

12、AI基础设施创企Astera Labs计划3月IPO

13、研究表明AI可以从婴儿视角学习语言

1、百度文心一言内测数字分身功能

据百度微信公众号发文，文心一言APP正在内测数字分身新功能，今日起，iOS和安卓用户可升级新版本免费试用。基于该功能，用户只需一张照片、录制三句语音，即可创建专属数字分身，并且支持个性化定义名称、声音、MBTI性格等，用户可选择是否公开自己的数字分身。

2、商汤发布日日新SenseNova 4.0

据商汤科技微信公众号发文，今日，商汤大模型体系日日新SenseNova 4.0发布，其知识覆盖面、推理能力、长文本理解力、代码生成能力等得到提升。其中，日日新·商量大语言模型-通用版本（SenseChat V4）支持128K语境窗口长度，综合整体评测成绩水平比肩GPT-4，相较GPT-3.5已经实现全⾯超越。商汤还推出了支持不同模态工具调用的日日新·商量大语言模型Function call & Assistants API版本，降低开发者使用大模型的门槛。

API申请网址：

https://platform.sensenova.cn/

3、谷歌Bard、搜索引擎新增文生图功能

今日，谷歌宣布在聊天机器人Bard中推出由Imagen 2模型支持的文生图功能。同时，谷歌推出新的文生图工具ImageFX，支持用户使用简单的文本提示创建图像，并提供新的提示修改建议。此外谷歌搜索和机器学习平台Vertex AI也将提供Imagen 2驱动的图像生成功能。

4、谷歌Gemini Pro扩展至中文等46种语言

今日，谷歌宣布聊天机器人Bard中的Gemini Pro模型将扩展至46种语言和238个国家/地区，其中包括简体/繁体中文。

5、谷歌地图引入生成式AI功能

今日，谷歌宣布在谷歌地图中引入生成式AI功能，利用大模型分析地图上超过2.5亿个地点的详细信息及超过3亿贡献者的社区意见，为用户提供寻找的内容或目的地建议，该功能本周起在美国推出。

6、亚马逊推出对话式AI购物助手Rufus

今日，亚马逊于官网发布对话式AI购物助手Rufus，目前向一小部分客户推出测试版，未来几周将扩展至更多美国用户。Rufus经过亚马逊的产品目录、用户评论、社区回答和网络信息的训练，可以回答用户关于购物需求和产品的问题，提供购买建议等。

7、库克：苹果将在今年晚些时候推出生成式AI功能

今日，苹果CEO库克在财报电话会议上称，公司正在开发生成式AI软件功能，这些功能将在“今年晚些时候”向客户提供，“我认为苹果在生成式AI和AI方面存在着巨大的机会，但我不想谈更多细节。”

8、阿里发布手机操作智能体框架Mobile-Agent

1月30日，来自阿里和北京交通大学的团队在arXiv上发表论文，提出了用于操作手机的智能体框架Mobile-Agent。据介绍，这是一个纯视觉解决方案，不需要XML（可拓展标记语言）和系统元数据，其操作范围不受限制，可进行多应用操作，配备多种视觉感知工具用于操作定位，且无需训练，即插即用。目前，Mobile-Agent已经学会了阿里巴巴、谷歌地图、TikTok等10个APP的操作，可以完成一些跨应用任务。

GitHub主页：

https://github.com/X-PLUG/MobilAgent

论文地址：

https://arxiv.org/abs/2401.16158

9、巨人网络游戏大模型GiantGPT完成备案

据游戏公司巨人网络微信公众号发文，巨人网络正式完成游戏AI大模型GiantGPT的备案，成为游戏行业首家对外确认实现了此成果的企业，相关备案结果今日在上海正式公布。即日起，巨人网络AI大模型GiantGPT的有关服务可以正式开展业务。据介绍，GiantGPT是专注于游戏业务的垂类大模型，结合巨人网络自有数据与互联网公共数据训练，并针对角色演绎、情景推理与长期记忆等基础能力进行优化。

10、网安局通报AI生成造谣文章案

2月1日，公安部网安局通报了一起利用AI发表造谣文章赚取佣金案件。网民王某在某APP上参加发布作品赚取佣金活动，因写作水平有限，便依托某款手机软件的AI题词功能写文章。王某在系统中输入带有“杀人、失踪”等敏感字眼的提示词，附以时间地点，就能自动生成博取眼球的文章。其利用AI编造的文字不仅骇人听闻，而且很多地方还“明确”了事件发生的时间、地点，误导读者以为这些事就发生在本地，信息被大量网民点赞、留言、转发，严重干扰社会秩序。目前，齐齐哈尔公安机关对王某处以罚款，同时责令删除相关谣言。

11、万事达推出欺诈检测AI大模型

据CNBC今日报道，支付巨头万事达称其已经建立了自研的生成式AI大模型Decision Intelligence Pro，以帮助银行实时评估其网络上的可疑交易，确定它们是否合法，从而检测并根除欺诈交易。据称，该模型基于Transformer从头开始构建，利用万事达生态系统中的数据进行训练，重点在于使AI理解“商家之间的关系”，而不是关注单词和文本。万事达网络和情报业务部门总裁Ajay Bhalla称，该模型进行欺诈检测的过程仅需50毫秒，可以帮助金融机构将欺诈检测率平均提高20%，在某些情况下最高能提高300%。

12、AI基础设施创企Astera Labs计划3月IPO

据外媒The Information今日报道，知情人士称，英特尔支持的美国云计算与AI基础设施创企Astera Labs一直在与潜在的投资者会面，计划在3月由摩根士丹利和摩根大通牵头进行IPO（首次公开募股），最早可能在本月公开招股书。据透露，Astera Labs今年预计产生2.5亿至3亿美元收入。该公司从2023年实现盈利，截至10月有200多名员工。2022年，Astera Labs的估值为31.5亿美元。根据与其类似的上市公司Credo Technology的估值，其现在的估值可能达40亿美元。

13、研究表明AI可以从婴儿视角学习语言

今日，来自纽约大学的团队在《科学》（Science）杂志发表论文，展示如何让AI模型从一个婴儿的角度去学习。研究团队在头戴摄像头视频上训练了一个神经网络CVCL，该网络捕获了来自澳大利亚的婴儿Sam从6个月到25个月大所看见的片段，他每周佩戴摄像机2小时，约占其清醒时间的1%左右。研究团队根据Sam的视频建立了SAYCam-S数据集，从中选取了61个小时的录像，包括60万张视频帧和3.75万段经过转写的录音，记录了大约25万个单词实例以及对应的图像。研究发现，即使数据有限，AI模型也能从数十个到数百个示例中获取单词到视觉之间的映射，而且能够将零样本泛化到新的视觉数据集，并实现多模态对齐。

论文地址：

https://www.science.org/doi/10.1126/science.adi1374

相关推荐