智东西(公众号:zhidxcom)
作者 | ZeR0
编辑 | 漠影
智东西7月10日报道,在7月7日举行的2023世界人工智能大会“AI生成与垂直大语言模型的无限魅力”主题论坛期间,国内中立云计算服务商UCloud优刻得晒出AIGC算力底座及解决方案全景图,达观数据正式发布了国产的自研“曹植“大语言模型,并宣布“曹植”大模型对外公测。
会后,优刻得董事长兼CEO季昕华、达观数据董事长陈运文接受媒体采访,进一步分享了对国内大模型产业发展现状的观察与思考。
季昕华分享了一组统计数据:国内有130家公司做大模型,通用的有78家,垂直的有52家。他认为通用类的特点是广而不深,垂直类对数据和产品要求更高,能解决输出的不可控问题,所以未来会是通用加垂直一起来解决问题。达观数据与优刻得正探索将“曹植”大模型与优刻得私有云结合,在垂直领域进行私有化部署。
他认为目前大模型发展面临的核心问题在于,第一是否有足够的数据,第二是否有足够的算力,第三非常关键的是算法,第四是能不能实现线上的闭环。
陈运文谈道,客户不会关心后台是用通用模型还是垂直模型,而会关注能不能解决问题,写出的报告中事实、数据、观点是否井井有条甚至比专业的更好,做翻译能否做到信雅达等。“曹植”大模型采用组合的技术,把多种不同尺寸的大模型、小模型组合在一起,扬长避短。
一、达观“曹植”大模型正式对外公测,专注于长文本、多语言、垂直化发展
达观数据董事长陈运文认为,模型未来是一个组合的方式,大模型未来在企业的落地形态一定是大模型和多个企业垂直小规模的组合,真正的机会在垂直行业市场落地。
他谈道:“大模型未来的发展关键要与垂直行业相结合。只是做一个泛泛的通用的大模型,那这样的产品同质化会非常严重。通用大模型回复的内容看上去好像滴水不漏,但是它的价值并没那么高。未来大模型真正得以运用,还是需要和每一个垂直行业深度的结合,去解决每一个行业里面的真正的痛点才行。”
据介绍,“曹植”大模型是国内首个垂直行业专用的自主可控的GPT大语言模型,具有长文本、垂直化和多语言特色。
▲“曹植“大模型的各类应用
过去,传统文案创作往往受限于篇幅和表达的局限性。而“曹植”大模型通过其自动化长文本写作能力,能够轻松应对白皮书、技术报告、品牌故事等长文本撰写的需求。
达观基于多年垂直行业数据和场景的积累,在长文本的处理方面深耕多年。
其研发的“曹植”大模型尤其擅长长文档的写作、审核、润色、翻译等任务,可准确完成多类型、复杂结构的长文本写作,自动起草多种类型的文档,未来还将实现多模态内容生成,如长文档中的表格、图表、图片等。
▲“曹植”大模型的长文本写作应用
此外,”曹植”大模型拥有其杰出的多语言能力,使得用户在不同语言环境下都能得到高质量的翻译服务,包括能处理撰写英文论文、法语商业邮件,或者翻译一篇日文新闻等任务。
其中最大特色是在翻译的同时可以实现版面还原,无需更改格式,能对原文的标题、段落等内容实现1:1版式还原,提供实时的翻译体验,广泛应用于多语言文档密集处理场景。
达观通过并联多种模型和知识图谱,使”曹植”大模型拥有多种语言长文本的自动化写作和翻译等功能,可针对不同行业、领域的文案需求进行深度优化和个性化定制。无论是金融、政务还是工业,”曹植”大模型都能提供精准、有效的文案创作解决方案。
▲“曹植”大模型的长文本翻译能力融入了达观多年积累的版面解析技术
曹植也针对不同行业开发特定应用和训练专属数据库,使用海量训练数据进行”曹植”大模型的预训练,生成具备基础语言能力和垂直应用能力的模型;支持个性化定制,本地服务器私有化部署,独家提供监督精调服务,以加强垂直领域专用任务的能力;坚持训练数据与算法模型自主可控,与国产GPU合作伙伴开展长期合作,不断优化高质量硬件设备,以适应市场需求和技术发展,让大模型赋能百业。
陈运文在接受采访时说,达观服务的很多大型企业的文档、报告、资料原来全是靠人来写,在很多领域里,人写报告既辛苦又很难保证没有错误,现在有了AI技术,这些专业的落地应用商业化市场前景非常广,而且迫切性很强。
“我们相信未来很多商业的报告都是人和AI相结合的,人只要写一些主要观念和大纲就行,剩下的所有内容填充,都是AI系统来帮你完成。”他谈道,“我觉得能大幅度的提升AI写作效率,也让人有更多的时间来完成深刻的思考工作。”
二、晒出优刻得AIGC算力底座,内部四大场景用上大模型
具有10年云计算技术积累和全面工程能力的优刻得,全面拥抱了这次AIGC科技热潮。
在“AI生成与垂直大语言模型的无限魅力”主题论坛上,优刻得董事长兼CEO季昕华以“中立安全云计算助力大模型发展”为主题发表演讲,介绍了优刻得在AIGC领域的技术产品、工程能力和生态建设等发展情况。
由AIGC引爆的热潮里,国内大模型已百花齐放,竞速神通,但也面临算力、数据、模型稳定性、工程能力及安全等多方面的挑战。
针对AIGC发展的问题,优刻得在WAIC期间展示了AIGC解决方案全景图,通过深厚的技术积累和全面的系统工程能力,推出涵盖了数据中心、计算平台、管理平台、网络服务、应用服务、生态接口的一系列产品和解决方案。
▲优刻得AIGC解决方案全景图
开放、安全、定制的AIGC解决方案让客户既能利旧已有服务器资源,又可以便捷享受公有云的弹性扩容,实现IT层面的降本增效,并可通过数据中心托管专区,为用户提供完全物理隔离的独享机柜、服务器、网络、存储资源,结合完整的安全方案和专家服务,确保了用户的大模型平稳运行。
季昕华也展示了优刻得公司内部系统的“AI化”,短短几个月就基于公司内部使用场景,推出了“识问”智能助手平台,UCoder代码助手平台,AI绘画助手平台、大模型安全管理平台等,对AIGC应用侧的快速响应和研发。
在接受媒体采访时,他透露说优刻得内部要求每个工种都要在各自的岗位上用大模型,并总结了优刻得内部应用大模型的四种场景:
一是通过大模型镜像市场,让内部员工能通过一个账号来使用国内国外的各种大模型。
二是所有的提问都会被记录,同时通过优刻得自己的安全大模型检测,防止企业的私密数据被泄露。
三是把对话的数据囤下来,作为以后训练大模型的语料库,如果以后有人问同样的问题,直接就从数据库里提取出来了。
四是优刻得针对内部员工进行大模型的培训,写代码以及绘画等都通过大模型模式来实现,以提高效率。
三、中立安全云计算助力大模型发展,AIGC解决方案四大优势解析
优刻得在国家“东数西算”乌兰察布算力枢纽节点,自建了低成本、高附加值的数据中心,相较上海、北京等同等质量的数据中心,成本下降40%。
数据中心内,优刻得提供多款GPU算力资源选择,可为大模型的AI训练、推理、数据处理等多场景打造灵活、可扩展的算力服务,充分满足高电算力集群的高电需求。
同时,优刻得通过IB和RoCE的高性能网络,打造互联的高性能计算集群,实现多节点间无损通信,满足用户多节点并行计算的场景需求。
优刻得的AIGC金翼专区,分为“训练区、存储区、推理区和管理区”。
在训练区,主要以A800/H800进行集群专区建设,集群规模最大可达2048卡规模,并通过高带宽、低延迟的设计提升整体训练效率。
在存储区,根据高读写带宽的场景特点,采用冷热分离的存储系统设计,并支持POSIX、K8S CSI挂载方式,不仅能满足训练需求,同时保障成本可控。
在推理区,通过内网打通同可用区公有云GPU资源池,具备多种类推理GPU资源,弹性可伸缩的满足多场景推理需求。
在管理区,提供日志、调度、IPMI管控、自动化装机和公网访问等能力,协助用户进行更为便捷的远程管理。
在AIGC应用服务方面,为了满足客户对大模型的需求,优刻得以MaaS模式,推出“算法模型镜像市场”,上线Alpaca-LoRA7B、ChatGLM-6B、T5-Base、T5-3B、MiniGPT-4、Stable Diffusion、Milvus向量数据库等7款开源模型和工具,覆盖知识推理、问答、图文生成及绘画设计等AI应用领域。
优刻得通过“大模型+大算力”的方式,提供一键部署和开箱即用能力,为用户快速搭建大语言模型的微调或者推理环境。
私有化是垂直大模型的发展方向,针对政府、金融、教育、制造、基金等客户大模型场景,优刻得AIGC私有化算力中心和全栈私有云平台,从大模型训练推理多样化场景出发,为客户推荐机型提供预装部分工具的镜像,并提供推理GPU算力/网络资源。
同时,结合优刻得一云多芯且自主可控的私有云平台,优刻得提供虚拟化、存储、网络及MaaS模型的私有化交付解决方案,支持各种开源大模型,可覆盖知识推理、问答、图文生成及绘画设计等AI应用领域,从而在用户本地或自己数据中心内部署针对特定场景的大模型服务,既可以为内部提供AI训练/推理服务,也可选择性对外提供AI推理服务。
▲优刻得AIGC私有化方案架构图
作为中立云计算企业,优刻得AIGC解决方案具有独特的优势:
一是中立,优刻得作为中立第三方,与大模型企业没有竞争,不触碰用户的隐私数据。
二是安全可靠,优刻得具有内资背景,系列安全防护产品及数据保护机制,确保大模型训练稳定可靠运行,并支持私有化部署。
三是技术沉淀,优刻得具有超10年云计算技术沉淀,已经超5万家企业级消费用户验证,更好的为大模型提供稳定的高性能算力服务。
四是工程能力,优刻得能够从数据中心、底层架构做到算力平台、模型库等,具有一站式系统工程服务能力。
季昕华强调说,优刻得既有能力又有意愿来帮助合作伙伴推广大模型。优刻得服务了很多大模型企业,了解大模型训练过程中的诉求和痛点,也愿意帮助大模型企业与潜在客户进行对接。
结语:大模型与应用场景是关键,呼吁加大对国产GPU的支持
谈及对大模型热潮的思考,陈运文认为,“百模大战”后,接下来是需要能够让这些模型的能力在千行百业落地应用,能够渗透进去、赋能行业,在各行各业工作当中发挥生产,这需要有算力、有模型、有技术、有产品,需要全产业链共同努力,才能把落地应用做起来。
季昕华同样认为将大模型和应用场景结合非常关键。他预计随着参与大模型训练的企业越来越多,大模型训练的数量、数据和参数都越来越大,推理要求也变得更高,未来GPU的需求会越来越大。据他透露,目前优刻得客户训练的GPU和推理的GPU数量的比例大概是3:7。
他呼吁加大对国产GPU的支持,鼓励更多数据共享支持,让企业能够用到数据,并希望更多应用场景能够开放出来,让国内大模型公司能有地方用起来。用起来有三个好处:一个是能形成反馈,二是能产生更多的经济价值,三是帮助各行各业提高效率。