数据编织技术:“一张网”联通跨系统数据

◎本报记者 张佳星

数据是数字时代的基础性资源和战略性资源,也是数字经济的关键生产要素。今年发布的《全国数据资源调查报告(2023年)》指出,我国数据资源管理和利用整体处于起步阶段,数据资源“产—存—算”规模优势基本形成,数据“供—流—用”各环节主体逐渐丰富,海量数据和丰富场景优势潜力亟需释放。

如何进一步挖掘数据资源价值,释放海量数据潜力?数据编织技术提供了一种解决方案。11月27日,在数智技术社区DataFun与浙江大应科技有限公司(以下简称“大应科技”)联合主办的数据编织价值评估研讨会上,行业专家齐聚一堂,探讨数据编织技术的发展前景。

利用数据编织技术,可以编织一张虚拟的数据网,它能够将企业内部分散在不同系统和平台上的数据连接起来,形成一个统一的数据生态系统。这张网不是点对点的连接,而是基于网络架构的虚拟连接,使数据可以在网上迅速流动,并统一对外提供服务。

“企业对数据资产进行价值挖掘时,如果依托传统的数据解决方案,首先需要建设‘数据仓库’。”大应科技技术副总裁余俊说,然而,“数据仓库”建设投入大、周期长,会导致数据价值收益不确定。因此,对一些传统企业来说,数据利用门槛较高。

此外,随着数据规模扩大,传统模式也难以满足数据资源挖掘的要求。“在数据规模不太大情况下,‘数据仓库’可以方便地满足业务需求。但随着企业数字化程度日益提升,其数据规模会越来越大,数据要支持的业务场景不断扩展,数据需求形式多样、要求繁杂。在这种情况下,企业对于数据资源利用的技术体系将有更复杂要求。”余俊说。

降低企业的数据利用门槛,是企业数据与业务深度融合,更好地以数据赋能日常经营的关键。业内人士认为,数据编织技术作为一种新的数据管理和集成方法,可将数据生态系统的复杂组件整合到一起,提供完整的数据管理方案。

余俊说,数据编织技术对数据库、数据池等数据基础设施要求不高。这是因为该技术的核心理念是通过优化跨源异构数据的发现与访问,将可信数据以灵活且可理解的方式交付给所有相关数据消费者,实现自助服务、高效协作和敏捷数据交付。

此外,与传统数据中台体系相比,数据编织技术无需将数据移动到集中位置,而是依靠强大的数据虚拟化技术及数据治理策略实现统一的数据管理。通过创建逻辑数据层,数据编织技术可将分散在不同系统中的数据汇聚在一个“逻辑点”上,为数据使用者提供一个统一、抽象、封装的逻辑数据视图。用户可通过这个视图查询和操作存储在异构数据源中的数据,把多个异构数据源当成一个同构数据源使用,无需在意数据位置、数据类型和数据格式。

“这样使用数据就免去了事前搬运、事中运维、事后治理的麻烦,数据编织技术有望为企业利用数据资源带来巨大便利。”大应科技副总裁刘靓说,众多企业已经开始积极探索数据编织的应用场景和落地路径。不过,由于该技术缺乏清晰可参考的实践方法论与价值评估标准,落地之路面临许多挑战。

研讨会上,《数据编织价值评估指南》发布。它为企业提供了一套全面、系统的数据编织价值评估框架,有望为数智化业务创新提供标准化支撑。

据介绍,该指南在深度解析数据编织价值主张、实现机制、数据价值评估方法与量化指标的同时,还通过多个实际案例,阐述了数据编织技术在不同行业、不同场景下的最佳实践。结合指南,企业可以清晰了解数据编织在提升数据响应速度、降低存算成本和管理成本方面的实际效果。

业内专家认为,随着企业数字化转型深入推进,数据编织正逐渐展现出巨大潜力和价值。国际信息技术研究和分析公司Gartner发布的《2024年中国数据、分析和人工智能技术成熟度曲线》认为,数据编织在数据、分析和人工智能成熟度曲线中处于创新驱动的快速上升期,是一种具有前瞻性的技术。该报告预测,数据编织技术在未来2—5年内将实现广泛应用。

来源:科技日报