微软清华提出媲美Transformer的新架构;北京海淀已发布主模型35个;中国AI软件市场十年首现负增长

1、微软清华提出RetNet 性能媲美Transformer

2、DeepMind新研究:提高医学预测AI系统的准确性

3、Colossal-AI开源650亿参数大模型预训练方案

4、华为盘古大模型矿山领域首次商用

5、谷歌Bard将引入Google Maps等插件

6、OpenAI出走创业者公司融资已超20亿美元

7、百度网盘推出基于AI的高级图搜功能

8、ChatGPT在创造性思维上能媲美前1%的人类

9、2022年中国AI软件市场规模十年来首现负增长

10、昆仑万维收获最高1500万元大模型订单

11、上海:积极培育提供大模型技术支持服务的企业

12、北京海淀:企业及机构已发布主模型35个

13、浪潮信息董事长王恩东辞职

14、印度软件巨头签署20亿美元AI协议

15、美国证交会主席:AI对金融市场稳定带来风险

16、Stability AI CEO:AI会使印度程序员更快消失

17、FlashAttention进化 比标准Attention快5-9倍

18、Wix将提供AI自动生成网站服务

19、传壁仞科技寻求2023年在香港IPO

20、百度在海外推出AI社交APP“SynClub”

21、工信部:2023大数据产业发展示范申报工作启动

22、宾大沃顿教授发布大模型挑选指南

23、中国移动发布“九天”AI大模型开放合作生态

24、黑客开发出协助网络犯罪的AI聊天机器人

25、网易云音乐内测上线“私人DJ”智能推荐歌曲

26、玄武云推出首款AIGC产品

1、微软清华提出RetNet 性能媲美Transformer

据机器之心报道,来自微软研究院、清华大学的研究人员7月17日发表一篇论文,提出retentive网络(RetNet)。RetNet同时实现了低成本推理、高效长序列建模、媲美Transformer的性能和并行模型训练,打破了“不可能三角”。

实验结果表明,对于7B模型和8k序列长度,RetNet的解码速度是带键值缓存的Transformers的8.4倍,内存节省70%。在训练过程中,RetNet也能够比标准Transformer节省25-50%的内存,实现7倍的加速,并在高度优化的FlashAttention方面具有优势。RetNet的推理延迟对批大小不敏感,从而实现了巨大的吞吐量。

不少研究者惊呼“好得不可思议”,甚至有人将其比作“M1芯片”登场时的变革意义。也有研究者提出疑问:这么优秀的表现是否意味着RetNet要在某些方面有所权衡,以及它能否扩展到视觉领域。

论文链接:https://arxiv.org/pdf/2307.08621.pdf

2、DeepMind新研究:提高医学预测AI系统的准确性

Google DeepMind与Google Research今日在国际学术期刊Nature Medicine上发表一篇联合论文。该论文提出了一种AI系统CoDoC(互补性驱动的延迟到临床工作流程),它可以在假设的医疗环境中确定预测性AI工具的相对准确性,以及系统何时应该听从人类临床医生的意见。

CoDoC探讨了如何在假设的医疗环境中利用人类与AI的合作来提供最佳结果。研究人员用多个真实世界的数据集对CoDoC进行了全面测试,结果表明,将人类最好的专业知识与预测性AI相结合,比单独使用任何一种都更准确。

在一个示例场景中,与常用的临床工作流程相比,CoDoC不仅将英国乳房x线摄影数据集的假阳性减少了25%,还能够将临床医生需要阅读的病例数量减少2/3。研究团队已在GitHub上开源了CoDoC的代码。

论文地址:https://www.nature.com/articles/s41591-023-02437-x%20

代码地址:https://github.com/deepmind/codoc

3、Colossal-AI开源650亿参数大模型预训练方案

AI创企潞晨科技今日宣布,Colossal-AI作为全球最大、最活跃的大模型开发工具和社区,以LLaMA大模型为例,率先提供开箱即用的650亿参数预训练方案,相比业界其他主流选择,仅需32张A100/A800 GPU即可将预训练速度提高38%,并且不限制商业用途,有助于为大模型企业节省大量成本。

自开源发布以来,面向大模型时代的通用深度学习系统Colossal-AI已多次在GitHub Trending上排名第一,获得超过3万颗GitHub Stars。100多家公司参与了Colossal-AI生态系统的建设。Colossal-AI背后的潞晨科技在今年5月获得数亿元A轮融资,至此成立18个月内已迅速连续完成三轮融资。

代码地址:https://github.com/hpcaitech/ColossalAI

4、华为盘古大模型矿山领域首次商用

据第一财经报道,今日,华为联合山东能源集团举行发布会,宣布华为盘古大模型在矿山领域实现首次商用。

盘古矿山大模型已经在山东能源集团旗下的山东李楼煤业有限公司和山东新巨龙能源有限责任公司的煤矿中投入使用。该模型采用中心云和边缘云两级架构,在保证数据安全的同时具备少量样本需求,通用性好,支持规模复制等特点。

日前,山东能源集团、云鼎科技、华为在前期试点验证AI大模型赋能工业生产领域的基础上,正在开发和实施首批场景应用,涵盖采煤、掘进、主运、辅运、提升、安监、防冲、洗选、焦化9个专业的21个场景应用。

5、谷歌Bard将引入Google Maps等插件

据外媒9to5报道,谷歌可能将为旗下聊天机器人Bard添加多款插件服务,首批扩展插件包括:Google Flights、Google Hotels、Google Maps、Instacart、Kayak、OpenTable、Redfin、YouTube、Zillow。目前这些插件还未正式上线,用户无法安装和体验相关功能。

6、OpenAI出走创业者公司融资已超20亿美元

据量子位7月17日报道,据The Belamy统计,目前已有超过30位OpenAI高管/工程师/研究员等离职创业,而Chief AI Officer计算总融资超20亿美元(约143亿人民币)。一个新的OpenAI黑帮(OpenAI Mafia)已逐渐成型。

7、百度网盘推出基于AI的高级图搜功能

品玩7月17日讯,百度网盘日前宣布推出基于AI的高级图搜功能,据称可使用“带有形容词的名词”进行更精确的搜索,也可以通过“地名”、“物体名称”、“图片中包含的文字”,查找到需要的图片。百度网盘还支持OCR识图和以图搜图功能,可以自动关联百度百科信息和全网信息,扩展信息检索维度。

8、ChatGPT在创造性思维上能媲美前1%的人类

财联社7月18日电,据美国蒙大拿大学的一项最新研究,在创造性思维测试方面,AI聊天机器人ChatGPT可以与排名前1%的人类思想家相匹配。研究人员对ChatGPT使用了托伦斯创造性思维测试,这是一种最常用的创造力测试方法,并记录了ChatGPT给出的8份答案。然后还提交了由24名蒙大拿大学学生组成的对照组的答案。

9、2022年中国AI软件市场规模十年来首现负增长

据IDC中国公众号今日发文,IDC近日发布了《中国人工智能软件2022年市场份额》报告,2022年人工智能软件市场规模为307.3亿元,同比下降6.9%,整体市场近十年来首次出现下滑。

2022年计算机视觉市场规模达123.0亿元,同比缩减19.1%,前五名是商汤科技、海康威视、创新奇智、旷视科技、云从科技、智慧眼科技。

在语音语义AI市场,科大讯飞仍旧位于榜首,但百度智能云、阿里云在不断缩小与科大讯飞的距离,中长尾的厂商以分散的应用场景或者解决方案占据了59%的市场份额。

2022年机器学习开发平台市场规模达35.4亿元, 同比下降4.9%,该市场呈现出明显的头部厂商规模化效应,前4名厂商(第四范式、华为云、九章云极、创新奇智)占据68.9%的市场份额。

如果将整体AI市场参与者分成几类群体,可以看到:老牌上市企业如海康威视、科大讯飞在下滑的市场中仍能实现小幅增长;成长型创企如创新奇智、第四范式可以做到高速增长;大型云厂商实现明显增长;其他大部分厂商则均为负增长。

幸运的是,OpenAI ChatGPT及大模型热潮又推动AI重回焦点,尽管在今年内未必能实现大规模商业化营收,但其普及的广度、推广的速度、渗透的深度,有望带动AI产业快速穿越本次下行周期,重回高增长时代。

10、昆仑万维收获最高1500万元大模型订单

根据昆仑万维公告,昆仑万维与北京蜜莱坞网络科技有限公司(简称:蜜莱坞科技)就蜜莱坞科技向公司购买AI技术服务事项达成协议。蜜莱坞科技拟向公司购买的技术服务项目包括AGI Sky-Chat SaaS API服务及AIGC SkyPaint API服务,服务内容包括AI文本生成能力,AI图像生成能力,服务目的为支持蜜莱坞科技在定制大模型方向的技术落地,期限一年,总金额不超过人民币1500万元。

11、上海:积极培育提供大模型技术支持服务的企业

今日,上海市人民政府办公厅印发《关于促进本市生产性互联网服务平台高质量发展的若干意见》。《若干意见》提到加快新技术整合应用,积极培育为生产性互联网服务平台提供垂直细分领域“大模型”技术支持服务的企业。

12、北京海淀:企业及机构已发布主模型35个

据北京日报消息,在北京市政府新闻办7月17日召开的“北京市贯彻落实党的二十大精神”系列主题新闻发布会上,海淀区常务副区长林剑华介绍,海淀区内已集聚约50家大模型企业、高校院所和科研机构,共发布主模型35个,在全国率先形成AI大模型集聚区。

13、浪潮信息董事长王恩东辞职

7月17日,浪潮信息发布关于董事长辞职的公告:浪潮信息董事会于近日收到董事长、中国工程院院士王恩东的书面辞职报告。为了减少兼职,王恩东申请辞去第九届董事会董事、董事长职务及董事会下属战略与可持续发展委员会主任委员职务,辞职后将不再担任浪潮信息的任何职务。

浪潮信息认为王恩东的辞职不会对公司董事会的正常运作以及公司正常经营造成重大不利影响。

根据浪潮信息第九届董事会第二次会议决议公告,浪潮信息2022年度股东大会选举彭震为第九届董事会非独立董事,现选举彭震为董事长(彭震原任的副董事长职务同时终止)。本次选举后,浪潮信息第九届董事会战略与可持续发展委员会名单调整为:主任委员彭震,其他委员张宏、王培志。

14、印度软件巨头签署20亿美元AI协议

据IT之家报道,印度第二大软件服务出口商印孚瑟斯(Infosys)周一表示,已与现有客户签署一项协议,提供人工智能(AI)和自动化服务,为期五年,客户支出估计为20亿美元(约合143.4亿元人民币)。一份交易所文件显示,该协议包含人工智能和自动化相关的开发、现代化和维护服务,但没有透露客户名字。

印孚瑟斯采取这一举措之前,其竞争对手塔塔咨询服务公司表示,计划培训25000名工程师,让他们获得微Azure Open AI的认证。其他竞争对手如Wipro计划在未来三年内向人工智能投资10亿美元(约合71.7亿元人民币)。

15、美国证交会主席:AI对金融市场稳定带来风险

财联社7月18日电,美国证券交易委员会(SEC)主席根斯勒表示,对那些AI模型的集中化现象感到忧心忡忡;SEC监督管理将受益于进一步采用AI技术;AI具备让投资更有效率的潜力。根斯勒警告称,AI对金融市场稳定带来风险;监管部门必须针对AI技术设计好对策;SEC工作人员正考虑是否需要针对AI技术出台新规。

16、Stability AI CEO:AI会使印度程序员更快消失

据科创板日报消息,Stability AI首席执行官Emad Mostaque日前表示,由于人工智能技术的进步,现在可以用更少的人来开发软件,大多数印度程序员将失业,他补充说,生成式人工智能对技术工作的影响因国家而异,例如法国的程序员可能比印度的程序员受到更多的保护,“在印度,三级以下的外包程序员将在未来一两年内消失,而在法国,你永远不会解雇开发人员。”

17、FlashAttention进化 比标准Attention快5-9倍

斯坦福大学提出的新型Attention算法FlashAttention再进化。研究团队宣布推出完全从头开始重写的FlashAttention-2,使用了英伟达的CUTLASS 3.x及其核心库CuTe的原语(primitive)。FlashAttention-2的速度是FlashAttention的2倍、标准Attention的5-9倍,在A100上训练GPT类语言模型速度高达225 TFLOPs/s。

代码地址:https://github.com/Dao-AILab/flash-attention

报告地址:https://tridao.me/publications/flash2/flash2.pdf

18、Wix将提供AI自动生成网站服务

据The Verge今日报道,基于模板的网站建设平台Wix宣布,很快用户将可以通过在框中输入描述并回答一些后续问题来创建整个网站,从设计到文本和图像,所有内容都会自动生成,速度很快。

Wix表示,其新的AI网站生成器(AI Site Generator)功能超越了模板,使用AI和算法创建“独特”网站。该公司使用ChatGPT和自己的工具的组合来完成这一切。ChatGPT将处理文本创建,公司自己的AI模型将完成其余工作。如果Wix的新AI网站生成器运行得足够好,它可以让网站建设变得更加容易。

19、传壁仞科技寻求2023年在香港IPO

据新浪财经报道,市场消息:AI芯片公司壁仞科技据悉寻求2023年在香港IPO。

壁仞科技创立于2019年,团队由国内外芯片和云计算领域核心专业人员、研发人员组成,聚焦GPU、DSA(专用加速器)和计算机体系结构等领域。

20、百度在海外推出AI社交APP“SynClub”

Tech星球独家获悉,百度在海外对AI产品进行布局,目前已在中国香港、日本等地推出了名为“SynClub”的AI社交产品。

据悉,该产品采用了百度最新AI技术,用户可认识专属于自己的AI朋友。SynClub通过信息量巨大且兼备娱乐和温暖的AI朋友陪伴,可以让用户的聊天不再平淡,话题包括个人生活、感受以及用户可能从未与他人分享过的事情。

21、工信部:2023大数据产业发展示范申报工作启动

根据工信部官网,工信部办公厅今日发布了关于组织开展2023年大数据产业发展示范申报工作的通知。本次申报围绕4大领域13个方向,遴选一批大数据产业发展示范项目,通过树立一批创新能力突出、应用效果良好、示范作用明显的大数据领域标杆,推进大数据产业高质量发展。申报主体为从事或服务于大数据采集、存储、加工、分析、应用、安全、要素流通等相关业务的企业及企业联合体、科研院所。申报主体于2023年8月15日前,登录“大数据产业发展示范申报系统”完成信息填报。

申报地址:
https://www.bdcases.org.cn

22、宾大沃顿教授发布大模型挑选指南

宾夕法尼亚大学沃顿商学院教授Ethan Mollick在7月15日分享了一篇大模型挑选指南。这份指南旨在帮助如何选择正确的大模型工具来做事,总结了大型语言模型的现状,并在不同的任务中附上了不同大模型的表现对比,教读者在六个使用场景(写作、制图、提出想法、做视频、处理文件和数据、获取信息&学习知识)下挑选大模型。

23、中国移动发布“九天”AI大模型开放合作生态

近日,中国移动在2023世界人工智能大会“大模型与深度行业智能”创新论坛上正式发布中国移动“九天”人工智能大模型开放合作生态。目前已有36家合作伙伴加入到“九天”人工智能大模型开放合作生态,包括9家高校和新型研发机构、17家人工智能基础软硬件骨干企业、1家三甲医疗机构、5家中央企业、4家行业和标准化组织。

24、黑客开发出协助网络犯罪的AI聊天机器人

据IT之家7月17日报道,安全分析公司SlashNext表示,有黑客日前开发出了一款名为WormGPT的AI工具,黑客声称“该AI工具没有任何限制,专为协助网络犯罪分子而设计,可以自由生成一系列恶意代码,或创建网络钓鱼攻击”。

据悉,WormGPT最早在今年3月首次出现,并在6月推出了正式版本。其创建使用了2021年推出的一种名为GPT-J开源大型语言模型。该模型经过对恶意软件创建相关数据的训练,最终形成了WormGPT。

黑客以每月60欧元或每年550欧元的价格销售该AI工具的使用权限,在售卖页写道:“该AI工具旨在提供ChatGPT的替代方案,便于用户执行各种与黑帽相关的活动,让任何人都可以在家中舒适地进行恶意活动。”

25、网易云音乐内测上线“私人DJ”智能推荐歌曲

据36氪7月17日报道,网易云音乐已内测上线“私人DJ”功能,该功能基于歌曲推荐算法的创新升级,实现了推荐歌曲的智能讲解服务。“私人DJ”将被打造成用户探索音乐世界的智能助手,它在传统音乐栏目的基础上,升级了个性化能力,在基于用户偏好个性化推荐歌曲的同时,也为用户讲解音乐,讲解内容包括推荐理由、歌曲解读、音乐百科等内容。

26、玄武云推出首款AIGC产品

据格隆汇报道,国内智慧CRM服务供应商玄武云近日对外表示,公司已发布首款AIGC应用产品“业务员智慧助手”。据悉,该应用将赋能SFA(销售能力自动化)产品模块,旨在提升业务员工作全流程智慧化,助力快消企业进一步降本增效,完善营销增长策略制定。

据玄武云AI实验室总监丁明介绍,当前,大多数快消企业都面临着业务员能力参差不齐、终端陈列质量不佳、终端费用浪费等问题。针对客户面临的上述业务困局,玄武云“业务员智慧助手”可利用AIGC五大生成功能,为快消终端的业务员提供工作全流程的智慧化辅助和建议。