智东西(公众号:zhidxcom)
作者 | 三北
编辑 | 漠影

2024年,狂飙大半年的百模大战,打到了视频领域。疯狂进化的模型、暴力堆砌的算力,展现出变革的巨大能量。但同时,海量难以开发利用的视频数据,成为新的“瓶颈”。

“数据时代,大模型是核心工具,场景化应用是价值变现的关键。”大华股份研发中心副总裁周文凯告诉智东西,“当下数据要素很火,但视频类数据生产、流通、交易仍有很多亟待解决的问题,这与视频数据的隐私性、敏感性、安全性有很大的关系。”

作为AIoT领域龙头企业,大华股份在视频领域有长达十几年的深耕,周文凯认为基于场景化的业务理解来提取视频数据的结构化信息,并与业务应用进行深度的融合才能发挥更大价值。

作为以视频为核心的数据产业代表企业,大华股份是如何打造未来范本的?通过对话周文凯,本文试图从大华股份在千行百业的场景实战经验中,寻找这些问题的答案。

一、数据为王,以视频为核心的数据产业尤为重要

据知名行研机构IDC预测,到2025年,全球数据总量将超过180ZB,其中中国数据总量将跃居全球首位。伴随这一趋势,数据交易市场的规模预计将达到2200亿元以上,若进一步考虑其驱动的计算、存储、AI技术及软件等基础设施的全面发展,整体市场规模更是有望突破2万亿元大关。

这将展现出什么样的广阔发展前景呢?周文凯向智东西透露,目前产生的所有数据类型中,‌以视图为核心的非结构化数据占据数据总量的90%以上,围绕着视频的数据采集、流转、分析、计算和应用等每个环节都隐藏着巨大的价值。但打开视频数据产业链,我们看到还面临着很多挑战:如何在复杂的感知场景和泛杂的物联协议中,实现数据的精准采集和海量设备的跨网互联,在视频数据分析和加工服务中,当前对于视频等非结构化数据的挖掘程度还很低,视频类数据需要依赖行业智能算法和应用的进一步挖掘,当前中国人工智能渗透率还不足10%,只有通过将视频内容结构化后与业务结合才能发挥更大价值,而场景化应用是数据产业价值变现的核心关键。

“我国视频数据要素市场已构建起清晰的三级架构:上游聚焦于数据采集与治理的一级市场,中游专注于数据加工与分析的二级市场,以及下游面向数据应用评估的三级市场。这一专业化分工体系不仅促进了视频数据产业链的精细化发展,还显著加速了视频数据向产业化迈进的步伐。”周文凯说

总的来看,海量数据资源和三级视频数据要素市场,都是数据产业的肥沃土壤。

二、发挥视频要素“乘数效应”,要迈过四道坎

今年1月4日,国家数据局等17部门近日联合印发《“数据要素×”三年行动计划(2024—2026年)》(简称:行动计划),提出选取工业制造、现代农业、商贸流通、交通运输、金融服务等12个行业和领域,推动发挥数据要素乘数效应,释放数据要素价值。

周文凯告诉智东西,行动方案提及的12个行业所涉及的数据,90%以上是视图为核心的非结构化数据。而发挥这些视频要素“乘数效应”,至少要迈过四道坎。

具体来说,这些视频数据包括用户生成数据、专业制作数据、公共资源产生数据、社交媒体分享数据等多种类型。相比于结构化的文本数据来说,这些视频数据在存储、处理、理解和计算四大方面都更加复杂。

1、存储量大。视图数据有别于结构化的文本数据,大量的视图数据要做大量的存储。这就对有效的存储空间利用提出更高要求,包括需要较强的编解码技术,以及有效的存储能力。

2、数据处理复杂。视频数据种类丰富,编码方式繁多,需要支持不同的分辨率、帧率、编码方式、格式的数据的处理,这就要求数据处理方积累这些不同数据的处理能力。

3、视频理解难度大。视频数据内容复杂多样,要去理解场景化的内容,最好是将小模型和大模型结合起来,去做数据的解析,从而挖掘出视频数据中有价值的信息。这里补充说下,除了训练模型所需的原始数据,视频数据真正产生的交易价值,还是在于视频结构化后挖掘产生的数据价值,因此视频理解好不好,很大程度上决定了视频价值的大小。

4、计算量大。视频数据的计算量非常大,大模型加剧了这一情况。这就需要厂商在准确率和效率之间找一个平衡。视频解析模型的参数量要适度,无法像文本大模型动辄有千亿参数,不然计算量就太大了。

上述特征,也决定了视频数据定价、交易和流通难度更大。

周文凯表示,视频数据不像结构化的文本数据一样流通便利,而是规模巨大,且大多数机器不可读。如果要交易的话,巨量视频数据怎么上传和下载,对网络带宽、安全保护、结构化成本的要求都较高;基于成本和价值定价标准如何定,都是要解决的问题。

对此,周文凯认为,视频数据要素价值的开发,可以参考地产行业采取所有权、使用权、经营权“三权分立”。视频数据使用者向数据所有者付费,视频数据运营者推动视频价值得到最大限度的安全挖掘,从而能够盘活视频数据要素市场。

而从技术角度来说,让视频数据可交易使用,还有赖于AI对数据的理解。比如大华股份在视频编解码、大数据平台、数据治理、视觉大模型、安全合规等多方面都有深入积淀,比如如何实现视频数据与文本数据的异构数据融合计算等,以此降低视频数据开发利用的难度和成本。

三、数据价值变现,场景化应用落地是关键

在数字化时代,‌数据被视为新型生产要素,数据的价值不仅仅在于其本身,‌更在于如何有效地利用这些数据,场景化应用落地是实现数据价值变现的关键。大华股份自2017年起就开始构建大的物联数智平台,2019年形成完整的平台体系架构,2021年发布Dahua Think #战略,推出“一体系、两平台”,即“物联数智中台体系”和“城市平台2.0、企业平台3.0”,助力各行各业挖掘视频数据价值。

2023年,大华股份全新升级Dahua Think #2.0战略,并全新升级的物联数智平台2.0,该平台全面融合物联感知、算网融合、视觉大模型、数据智能等技术,完善软件工程化能力,赋能千行百业客户的应用。

在城市方面,大华围绕城市高效治理、运行自治、安全体系升级、生态协同治理拓展了各领域,覆盖了超过200个城市场景。比如在交通治理场景,周文凯谈道,过去的小模型往往只能识别一些局部场景,如某个关口排队要多久等;在应用了大模型之后,某地整个城市交通态势变得可被全面掌控,交通调配决策变得更科学。

在企业方面,大华则以助力企业构建大安全体系、数智生产力、提升经营决断力,为企业提供数字化管理工具,帮助企业解决业务痛点。比如能源领域,周文凯称一些客户的需求比较强烈,他们亟需通过视频去做安全生产和降本提效;另外智能驾驶领域的客户需求也非常强烈,他们需要基于视频和雷达联合起来去做智能驾驶。

当然这些应用的升级离不开大模型能力的加载,很多大模型并不适合直接拿来用,而是需要结合场景去发挥价值。“无论是生成式模型还是解析式模型,这些大模型都是基础模型(Foundation Model),本质上是比小模型加强了理解和认知能力。当认知产生的时候,人们在上面构建出面向各个场景的能力,这才是大模型价值的本质。”

周文凯谈道,大华做的大模型,是以视觉为核心,融合了多模态的能力,具备准确性和泛化性跃升、图文提示定义新功能、突破视觉认知能力、全场景自主解析、大小模型与算力协同五大方面特征,目前已落地多个行业领域。

除了大模型外,这背后也离不开大华股份围绕视图在编解码、治理、分析、网络、存储等方面所做的一系列优化。

比如在数据分析方面,大华自建了超千台服务器规模的数据中心,专门模拟大数据各种场景需求,支持大华在数据存储、数据治理、数据分析等多方面去做全流程试验,从而保证技术领先性和稳定性。

数据安全方面,大华积累了众多安全相关技术,在其一站式的数据智能引擎上提供了面向数据传输流转的很多安全管控措施,如实现项目隔离、数据隔离,权限隔离、访问隔离、安全审计等。

结语:视频数据沃土,场景化数据要素价值凸显

当下正值数据要素加速落地千行百业,深挖场景化数据价值变得尤为重要。

从大华股份的实践中,我们了解到国产玩家正在克服视频数据在存储、处理、理解、计算、定价、流通等环节面临的挑战,将视频数据处理能与多样化场景应用深度融合。这其中既包含了企业十几年的行业经验和数据处理能力积淀,更凝聚了跨越多个业务周期的宝贵行业知识与专业洞察(know-how)。

数据为王时代,在堆算力、炼模型的同时,如何让海量的视频数据要素发挥乘数效应,成为我国数字产业实现领跑世界的一大关键。