2024年6月19-20日,为拨开数据智能时代迷雾,把握数据智能时代脉搏,大数据技术标准推进委员会以“来这里,抓住数据智能时代”为主题,在北京召开为期两天的“2024数据智能大会”。
在大会主论坛上,中国信通院云计算与大数据研究所所长何宝宏发布了《2024数据智能十大关键词》。
以下为演讲实录
大家好,我是中国信通院云计算与大数据研究所何宝宏,今天很荣幸,由我来为大家发布2024数据智能十大关键词。
智能技术本质上是对数据价值进行深度挖掘和应用的一种方式,近年来数据与智能技术不断融合,“数据智能”的概念应运而生。今年,基于中国信通院长期对产业的研究与观察,充分结合行业一线专家的观点意见,我们首次提出数据智能十大关键词,希望能够预示新兴的数据智能产业当前发展的热点方向。
总结来看,数据技术可以分为数据汇聚、数据存储&计算、数据管理、数据开发&应用、数据安全五大部分,智能技术分为数据准备、模型训练&推理、模型开发&应用三大部分。今年的十大关键词分布情况如图所示。下面我将一一为大家介绍。
关键词一:高质量数据供给,数据智能实践的重要基础
当前,人工智能正在引发新一轮产业变革,成为激活数据要素价值、发挥数据要素乘数效应的重要引擎,人工智能的突破得益于高质量数据,因此,各界正加快推动高质量数据集的建设与供给。
首先,企业作为产业运行的主体,在数据供给方面承担了重要作用。其中,数据要素型企业拥有大量数据,是数据市场的主要供给方,需要在安全合规的基础上实现数据整合贯通与流通赋能。数商具备专业技术能力,是数据市场的服务方,需要持续创新数据技术并挖掘数据应用,不断开拓新的业务模式以适应市场变化。此外,提高数据质量的一大关键还在于技术创新与模式优化,针对性的技术能够更有效的识别、提升数据供给的质量,比如通过应用合成数据、自动化智能化的数据标注建设高质量数据集,并通过建立数据质量全流程评估标准来满足大模型对高质量数据的需求。
关键词二:面向人工智能的数据治理,提升人工智能效果的关键
通用人工智能的发展,使得数据与算法的边界更加模糊,数据嵌入到了模型的生成中,数据质量与安全直接影响模型结果,通过对人工智能所需数据进行治理,可以有效的提升人工智能应用效果与研发效率,提升安全与隐私保护水位。然而面向人工智能的数据治理刚刚开始,面临诸多挑战,需要关注四个方面的问题,一是方法论的缺失,二是数据质量的评价和提升;三是数据安全与隐私保护;四是数据伦理。
近期,中国信通院依托大数据技术标准推进委员,联合近百家单位,共同编制了业界首本《面向人工智能的数据治理实践指南》,指南认为人工智能数据治理是在人工智能应用中管理和控制数据的过程与实践,用以确保数据的质量、可靠性、安全性与合规性,数据能够被准确地用于训练和部署AI模型,同时保护数据的隐私和安全。指南创新性地提出了一套治理框架,将人工智能工作划分为从数据收集到模型推理九个阶段,提炼出每个阶段所需要的数据类型,并针对业界关注的数据质量、数据安全与隐私、数据伦理等问题提出针对性的解决方案,明确了治理技术。
未来,我们将继续加强人工智能与数据治理的研究工作,充分发挥人工智能与数据治理二者的乘数效应。推动标准体系进一步完善、促进产学研用充分融合。
关键词三:数据资源估值与入表,助力数据价值显性化
自2023年8月以来,随着《企业数据资源相关会计处理暂行规定》《数据资产评估指导意见》等相关政策发布,国家积极引导企业开展数据资源估值与入表工作,促进企业准确把握数据价值脉络流向,提高数据赋能程度,充分参与数据要素市场建设。
数据资源估值重在感知和量化数据价值,数据资源入表关键在于精准核算数据相关的财务信息。在实践中,按照“先有价值,再有交易”、“先有业务,再算财务”的思路,数据资源估值是入表的基础,为入表前的历史成本归集、预期收益分析等确认条件提供重要依据。
2024年是数据资源估值和入表的“起步年”,以央国企为代表的机构逐步探索构建数据资源估值体系,并同步开展数据资源入表试点工作。据统计,今年第一季度已经有20余家上市公司披露了数据资源入表情况。
中国信通院云大所积极开展数据资源估值与入表相关研究工作。一是组织编制了《数据资源估值实践指南》,提出企业数据资源估值路径,指导数据资源入表实践。二是牵头在国际电信联盟ITU立项了“多媒体数据资产价值评估框架”国际标准,计划于今年底发布,这是国际上首个数据估值的标准,为全球贡献中国方案。三是与运营商、能源企业合作,明确了数据资产化路径,落地了国内首个央企数据资源估值案例,指导其他企业探索数据资产化。
关键词四:数据智能平台,支撑上层数据与模型开发,推动Data+AI深度融合
数据智能时代,数据管理和模型训练愈发密切,数据平台和智能平台的分离严重影响了企业数智化的进程,如何通过一个平台提供数据存算和模型训练与部署能力成为业界关注的核心。
数据智能平台在数据平台的基础上提供了AI模型开发全链路能力,同时在AI的赋能下,平台整体的管理能力、安全能力和资源利用效率得到提升,推动Data+AI进一步融合。当前,Databricks、Snowflake、阿里云、华为云等国内外大数据厂商均推出具备数据存储、计算、开发能力的Data+AI解决方案,具备多模数据统一存储、数据编排和缓存加速、海量资源统一管理、多模态计算引擎、统一安全管理、统一模型管理等能力,为上层数据开发及模型训练提供支撑。
为加快凝聚产业共识,推动数据智能平台的高质量发展,中国信通院联合国内头部厂商,共同编制《数据智能平台技术要求》标准,目前阿里云、华为云已经完成首批数据智能平台测试。
关键词五:检索增强生成(RAG),数据检索助力企业大模型高质量落地
自大模型技术热潮兴起以来,如何推进大模型在各行业、各业务场景落地是各方普遍关注的问题。落地成本高,可控性、精确性差是大模型在B端落地普遍存在的痛点,而检索增强生成,也就是RAG技术为此提供了很好的解决方案。
RAG是一种通过数据检索来改进模型内容生成效果的技术方案,通过引入来自外挂向量数据库、知识图谱或网络的数据,对原有问题进行补充增强后再输入给大模型,有效缓解大模型的幻觉问题,提高知识更新速度,增强内容生成的多样性和可追溯性。现阶段RAG技术已融入最常见的大模型应用架构,大大降低企业在大模型训练、微调方面的资源投入,为企业大模型落地提供了更加稳定、可控、低成本的思路。
与此同时,随着数据检索技术不断突破,向量、图等多模态数据也被纳入可检索范围,进一步提升了RAG的性能和适用场景。总体来说,RAG技术仍有较大的发展空间,国内外各大厂纷纷布局相关产品,中国信通院云大所也响应各方诉求,牵头编制了《检索增强生成(RAG)技术要求》标准,腾讯云、中电信人工智能等企业参与了首批测试。
关键词六:“大模型+”,大模型快速落地,催生数据智能应用新范式
大模型作为人工智能领域的一次重大飞跃,正以前所未有的速度推动着数据智能应用模式的快速变革。数据层面,大模型可以准确理解用户数据分析需求,将自然语言转化为可执行的数据查询语句和分析任务,降低数据使用门槛。知识层面,大模型可以高效完成知识的归纳、加工、解读,并通过外挂知识库为用户提供更加精准、高效的知识检索服务,极大的提升了知识管理和利用的效率。创意层面,大模型技术正推动辅助设计向智能生成的阶段演进,大模型所具备的文字、图片、代码、音视频生成能力为设计与研发带来无限可能。决策层面,大模型驱动的智能体能够模仿人类的决策过程,通过与环境的感知交互来规划决策并执行,很大程度上提高了决策的效率和自动化程度。为进一步推动大模型赋能的数智应用实践落地,中国信通院已推出“大模型+数智应用”系列评估测试,覆盖商务智能、知识图谱、智能问答、知识中台、营销平台、RAG等方向。
关键词七:营销数智化,企业数据智能价值释放的头号场景
企业营销能力是企业盈利的根本保障,是企业赖以生存的基本能力,对企业构建品牌效益、培养客户忠诚度也发挥着至关重要的作用。在数据智能浪潮的推动下,数智技术对营销的赋能效益显著,据中国信通院产业调研显示,营销场景对企业数智能力建设收益的平均贡献率占比超35%,成为数智化应用场景中占比最高的板块,营销数智化正逐步成为企业核心竞争力。
数智化技术为营销带来了诸多革新和突破。一是赋能决策:精准客群定位、敏捷预测等技术的应用,让企业能够更精准地把握市场脉搏,更高效精确地做出业务决策。二是增强体验:通过用户画像实现精细化的用户体验管理,利用大模型技术定制化生成用户感兴趣的内容,在营销的同时兼顾用户体验。三是驱动创新:从社交媒体运营到视频运营,再到内容运营和直播运营,营销数智化已经是推动业务创新的重要动力。中国信通院自2021年起开始了营销数智化相关工作,构建了《企业数字营销能力成熟度模型》《数字营销解决方案能力要求》《大模型驱动的数字营销平台》等多项标准。从参与评估测试的数十家企业来看,电信行业、金融行业营销数智化程度较高,发挥着引领作用。
关键词八:数据安全风险评估,场景化数据安全风险评估备受关注
随着数据要素市场化发展的持续深入,尤其是在数据驱动的智能化场景应用逐步落地过程中,数据安全也正面临着更加严峻的挑战。新技术的应用在带来新机遇的同时也将引入新的风险。数据安全风险的识别、评估与应对是数据处理者面临的最紧迫问题,也是我国监管部门、产业多方高度重视与关注的焦点问题。国家在标准化工作、实践指引等方面做出了相应探索,众多行业领域发布了数据安全风险评估的管理要求与实施指导。中国信通院联合企业共同探索了数据安全风险评估在通用范畴、金融及交通等重点行业领域的落地实践,以及在大模型等新兴场景中的开展思路。与企业共同将理论与实践相结合,根据自身业务特点和场景特征,量身定制评估方案,全面分析潜在威胁,开展评估和处置。未来,为应对更加复杂多变的数据安全挑战,我们计划持续开展企业数据安全风险评估落地实践,特别是针对新的智能化场景应用,共同探索数据安全风险治理的提升之道。
关键词九:数据安全运营,智能化时代到来,为数据安全运营带来挑战与机遇
随着数据安全监管要求逐渐落地,数据安全技术及服务供给不断释放,企业数据安全治理动力明显攀升。数据安全运营成为数据安全工作的热点方向和重要抓手。数据安全运营工作通过不断适配业务环境和风险管理需求,持续优化安全策略措施,保障整个数据安全治理体系有效运转。企业可从运营对象、管控流程两个方向切入,建设并优化企业数据安全运营体系。
随着智能化时代的到来,数据安全运营也迎来了新的机遇与挑战。一方面,AI技术赋能数据安全运营智能化。通过人工智能等技术,对数据安全运营工作进行智能分析、预测和响应,不仅能够提高运营的效率和准确性,还能帮助企业构建更加完善的安全防御体系。另一方面,AI技术的引入可能给企业带来新的数据安全风险,也可能引发合规管理、责任划分等新问题。
中国信通院在数据安全运营方向积极探索,已编写数据安全运营管理平台技术标准,并开展相关产品测试,可作为企业数据安全运营管理平台建设和选型参考。后续,我们将继续开展企业数据安全运营质效评价研究,以及数据安全产品智能化转型研究。
关键词十:数智素养,推进数字人才发展,赋能企业数智化转型
随着国家大力推进数字经济、数字中国的决策部署,各行各业对数字人才的需求也愈发迫切,据《产业数字人才研究与发展报告》指出,当前数字人才总体缺口约为2500-3000万。2024年人社部、中组部、中央网信办、工信部等部委联合发布《加快数字人才培养支撑数字经济发展行动方案》,明确要求扎实开展数字人才育、引、留、用等专项行动,增加数字人才有效供给。
在持续推进,企业数智化转型的过程中,企业人才的综合数智素养成为转型成效的重要影响因素。数智素养是指在数字环境中获取、理解、评估和应用信息的能力,以及运用数据智能技术解决问题的能力。它包括数字信息素养、数据素养、AI素养和技术素养等核心要素,体现了个体在数据智能时代的适应能力和竞争力。
为统筹推进数智人才发展相关工作,中国信通院联合大数据技术标准推进委员会成立WG18数智人才工作组,并将发布一套数智人才能力模型、一套培训课程规范、一套培训产业图谱。希望未来可以联合业内更多企业和组织,共同推进数智人才规范化发展,为数字经济和企业数智化转型提供更好的人才支撑。
以上就是2024数据智能领域的十大关键词。最后,对其总结可以发现它们涵盖了数据与智能技术的方方面面,表明了数据智能产业的时下热点和发展方向。于此同时,为进一步助力企业数据智能化转型实践,中国信通院自2022年启动企业数智化能力成熟度模型(EDMM)系列工作,形成企业数智化能力基本框架。围绕这些热点方向中国信通院云大所也纷纷部署启动了各项工作,这些工作离不开业界专家和企业的广泛支持,欢迎大家持续参与、关注。
好的,今天我的发布环节就到此结束,未来中国信通院云大所将持续跟踪、研究数据智能领域各类政策、技术、产业动态,并及时与业界同步,进一步推动产业发展。谢谢大家!
( 来源:中国信通院 )