ChatGPT入选Nature年度十大科学人物;全国首例AI声音侵权案公开审理;谷歌推出文生图模型Imagen 2丨AIGC大事日报

1、全国首例“AI声音侵权案”公开审理

2、谷歌Gemini Pro推出API

3、谷歌推出文生图模型Imagen 2

4、谷歌云将为Mistral AI提供基础设施

5、OpenAI首席科学家入选Nature年度十大科学人物

6、OpenAI将使用新闻数据训练ChatGPT

7、ChatGPT Plus重新开放订阅

8、ChatGPT网页版出现严重中断

9、百度文心一言插件商城上线

10、传阿里云首席商业官蔡英华离职

11、阿里电商AI布局曝光 淘天设立4个AI团队

12、智谱AI推出中文大模型对齐评测基准AlignBench

13、工信部:今年我国生成式AI市场规模14.4万亿元

14、Stability AI发布图像转3D对象模型

15、Instagram推出AI图像背景编辑工具

16、Mozilla推出零代码网站创建工具Solo

17、实时生图工具KREA AI全面开放

18、南洋理工发布视频升维框架Upscale-A-Video

19、AI创企Delphina获李飞飞等750万美元融资

20、AI创企Glean洽谈2亿美元新融资

1、全国首例“AI声音侵权案”公开审理

据北京互联网法院微信公众号发文,12月12日,北京互联网法院首次组成五人合议庭,依法公开审理全国首例“AI声音侵权案”。该案中,原告殷某某意外发现,自己的声音被AI化后,在一款名为“魔音工坊”的APP上以“魔小璇”的名义对外出售。因此,殷某某以被告行为侵害其声音权为由,将“魔音工坊”的运营主体北京小问智能科技有限公司、微软(中国)有限公司等五被告起诉到北京互联网法院。目前,该案仍在进一步审理中。

2、谷歌Gemini Pro推出API

昨日晚间,谷歌宣布大模型Gemini Pro现已推出API(应用程序接口),目前支持32k上下文窗口,在一定限制内可免费使用,具有函数调用、嵌入、语义检索和自定义知识基础以及聊天功能,支持全球180多个国家和地区、38种语言,支持文本、图像输入和文本输出,提供SDK(软件开发工具包)。用户现在可在在线免费开发者工具Google AI Studio、云托管AI平台Vertex AI上使用该模型。定价方面,免费版本支持每分钟最多60个请求,但输入输出数据将被用于改善谷歌的模型。之后将推出付费计划,每千字符输入定价0.00025美元(约合人民币0.0018元),每张图像输入定价0.0025美元(约合人民币0.018元),每千字符输出定价0.0005美元(约合人民币0.0036元)。

3、谷歌推出文生图模型Imagen 2

昨日晚间,谷歌宣布在Vertex AI托管平台中推出新的文生图模型Imagen 2、医疗保健行业模型MedLM,还全面推出面向开发者的代码工具Duet AI。Imagen 2支持自然语言生成高分辨率的逼真图像、生成Logo以及视觉对话。Imagen 2还推出了文本渲染支持,可以在图像上生成准确的文字,此前只有OpenAI的DALL-E 3支持该功能。Imagen 2支持英语、中文、印地语、日语、韩语、葡萄牙语、西班牙语7种语言,包含内置安全预防措施,集成数字水印服务。

4、谷歌云将为Mistral AI提供基础设施

据路透社报道,当地时间周三,谷歌云与法国创企Mistral AI宣布达成合作,Mistral AI将在谷歌云的AI基础设施上测试、构建和分发其大型语言模型。

5、OpenAI首席科学家入选Nature年度十大科学人物

当地时间12月13日,国际顶刊《自然》(Nature)公布2023年度最具影响力科学家10人名单,其中OpenAI首席科学家伊利亚·苏特斯科夫(Ilya Sutskever)作为“AI梦想家”入选,因为他在ChatGPT的开发中发挥了核心作用,同时关心AI的安全和未来。此外,ChatGPT作为非人类首次入选,旨在承认它在模仿人类语言的AI在科学发展和进步中所发挥的作用。

6、OpenAI将使用新闻数据训练ChatGPT

昨日晚间,OpenAI宣布与Politico、Business Insider母公司Axel Springer出版社达成合作,将使用其全球新闻内容,包括付费内容来训练ChatGPT。ChatGPT对用户的回答将包括来源和完整文章的链接,以提高透明度和提供更多信息。

7、ChatGPT Plus重新开放订阅

今日凌晨,OpenAI CEO阿尔特曼在社交平台X上宣布,ChatGPT Plus订阅已重新启动,“我们找到了更多GPU”。此前,他于11月15日宣布暂停新订阅,因为ChatGPT使用量激增,超出公司的承受能力。

8、ChatGPT网页版出现严重中断

据OpenAI官网显示,太平洋时间12月13日17:32至18:10(北京时间今天9:32至10:10),ChatGPT网页版出现严重中断(Major outage),该问题已在当地时间19:15(北京时间11:15)解决。在这之前,OpenAI刚刚于今日凌晨1:10宣布重新开放ChatGPT Plus订阅。

9、百度文心一言插件商城上线

据百度AI微信公众号昨日发文,文心一言插件商城正式上线,商城集合众多高质量插件,覆盖办公提效、多模态内容理解生成、专业信息查询等许多实用场景,用户只需通过简单指令,即可实现PPT生成、音视频提取、思维导图制作等多场景多模态下的需求,实现“指令即服务”的便捷体验。开发者也可以根据需求,自己亲自设计插件。

开发者社区:

aistudio.baidu.com/cooperate/yiyan

10、传阿里云首席商业官蔡英华离职

据36氪报道,阿里云首席商业官蔡英华(花名:华琰)已于昨日正式卸任,从阿里云离职。据悉,蔡英华是阿里云近两年推进政企业务的关键人物。他在2022年3月空降阿里云,出任阿里集团资深副总裁(M7级),此前曾任华为EBG中国区总裁。蔡英华离职的大背景,是今年开始的阿里集团大变革背景下,阿里云进入频繁的业务调整时期,代表着阿里云依靠做集成、总包来获取高增长的模式告一段落。

11、阿里电商AI布局曝光 淘天设立4个AI团队

据晚点昨日报道,阿里最核心的两大电商业务——淘天集团和国际数字商业集团都围绕AI建立了完整的队伍。其中,淘天集团将约20个AI团队整合为4个,分别负责阿里妈妈、C端消费者、B端商家,以及行业特色应用。淘天集团内诸如1688等相对独立的子业务,也开始大力招募自己的AI团队,以支持前台业务发展。淘天集团如今已经训练出了自己的大模型产品“图灵”,但知情人士称,该大模型产品不会对外发布,对内主要应用于两个业务,一是搜索、广告、推荐,二是逛逛的内容化。此外,淘天集团还在筹建新的大模型研究团队,计划以技术名义形成一个大团队,与集团内几个应用场景探索的 AI 业务团队,共用底层显卡、算法工程。

阿里国际商业集团的脚步则稍快一些。今年4月,跨境业务行业负责人张凯夫带队成立AI Business,目前该业务团队已有超过100人,模型训练人员在1/3左右,其他人员负责模型推理应用和基建以及具体产品的开发运营。算法团队主攻三个方向:多语言的电商大模型训练,对话模型和下游任务,图像生成能力。AI Business的AI服务已应用在阿里国际内部的AliExpress(速卖通)、Trendyol、Daraz等业务,主要包括商品信息本地化、图像设计、客服机器人、客服翻译等场景。11月,基于自研模型,AI Business团队正式对外发布具备翻译、营销、本地化内容、设计等一系列功能的AI产品“Aidge”,除了支持阿里国际各业务,还将接口开放给了独立软件服务商(ISV)和SaaS服务商,以供他们在此基础上开发出更符合商家需求的产品。

12、智谱AI推出中文大模型对齐评测基准AlignBench

据GLM大模型微信公众号发文,12月12日,智谱AI推出了第一个针对中文大模型,能够在多维度上细致评测模型和人类意图对齐水平的评测基准AlignBench。AlignBench构建了综合全面的分类体系,分为8个大类。为了自动化和可复现性,AlignBench使用评分模型(GPT-4,CritiqueLLM)为每个模型的回答打1-10的综合分数,代表其回答质量。智谱AI使用gpt-4-0613和CritiqueLLM分别作为评分模型对17个中文大模型进行了评测,结果显示,中文大模型相比于GPT-4,在逻辑推理能力上差距较大,在中文相关能力(尤其是中文理解类)能取得相近甚至更好的表现,顶尖开源模型对齐表现接近闭源模型,已处于同一梯队。

论文地址:arxiv.org/abs/2311.18743

项目地址:llmbench.ai/align

13、工信部:今年我国生成式AI市场规模14.4万亿元

据央视《新闻直播间》今日报道,记者从工业和信息化部赛迪研究院获悉,今年我国AI企业新增368家,生成式AI的企业采用率已达15%,其中在制造业、零售业、电信行业、医疗健康等四大行业,采用率分别为5%、13%、10%和7%,生成式AI市场规模约为14.4万亿元。专家预测,到2035年生成式AI有望为全球贡献近90万亿元经济价值,其中我国将突破30万亿元,占比超过四成。

14、Stability AI发布图像转3D对象模型

今日,Stability AI推出从单张图像生成3D对象的模型Stable Zero123。该模型基于Stable Diffusion 1.5建立,面向非商业和研究用途开源模型权重,与上一代Zero123-XL相比,训练效率提升了40倍。

开源地址:

huggingface.co/stabilityai/stable-zero123

15、Instagram推出AI图像背景编辑工具

今日凌晨,Meta生成式AI副总裁Ahmad Al-Dahle于社交平台Threads宣布,Instagram现已推出AI图像背景编辑工具,可通过自然语言为图像一键生成并更换背景。

16、Mozilla推出零代码网站创建工具Solo

昨日,火狐浏览器开发商Mozilla昨日宣布推出Solo,一个面向个体企业家的AI网站构建器,用户可通过自然语言、无需代码创建自己的网站。Solo针对SEO(搜索引擎优化)进行了优化,以增加来自谷歌的搜索流量,可以从现有社交媒体中采样文本和评论并展示最佳内容,同时支持移动端。

Solo官网地址:soloist.ai

17、实时生图工具KREA AI全面开放

昨日,此前一直处于内测阶段的实时生图工具KREA AI,即日起开启公测,免费向所有人开放。KREA AI主要提供实时生成和编辑图像、图像分辨率增强、将Logo转换成视觉错觉、创建一些类似中世纪螺旋AI图像等功能。

18、南洋理工发布视频升维框架Upscale-A-Video

12月12日,南洋理工大学发布了一种用于视频分辨率升维的、文本引导的潜在扩散框架Upscale-A-Video。该框架通过两个关键机制确保时序一致性:在局部,它将时序层集成到U-Net和VAE-Decoder中,以保持短序列的一致性;在全局,无需训练,它引入了流引导的递归潜传播模块,通过在整个序列中传播和融合潜信息来增强视频的整体稳定性。

项目主页:

shangchenzhou.com/projects/upscale-a-video

GitHub仓库:

github.com/sczhou/Upscale-A-Video

19、AI创企Delphina获李飞飞等750万美元融资

据彭博社昨日报道,硅谷AI创企Delphina近日获得750万美元(约合人民币5352万元)融资,由Radical Ventures、斯坦福大学教授李飞飞和Costanoa Ventures等参投。Delphina由两名Uber前数据和工程经理创立,专注于通过Copilot来加速预测AI模型的构建和部署。

20、AI创企Glean洽谈2亿美元新融资

据外媒The Information今日报道,由谷歌前搜索工程师创立的AI创企Glean正在洽谈至少2亿美元(约合人民币14.3亿元)融资,投前估值达到20亿美元。新投资将是Glean的估值达到去年5月的2倍。截至本季度,该公司的年度经常性收入增值3000万美元(约合人民币2.14亿元),是去年的3倍。