6 大数据应用
为了加强数据管理,提升数据质量,东方航空在普元公司的帮助下建立起了统一的数据资产管理平台,通过元数据管理、数据标准梳理和建设、数据质量管理、数据地图建设,使数据支撑能力和行业竞争力得以显著提升。
6.1 全景数据资产地图
东方航空原来的数据地图基本只有技术人员才能看懂,但业务人员更关心和自身业务相关的事务,关心的是业务数据的分布。为此,东方航空在企业数据模型的基础上,建立了企业数据模型与信息系统数据项之间的映射关系,梳理了企业信息系统中的数据分布状况和数据质量状况,分析了数据加工关系和数据流转的全流程,形成了企业数据地图,为企业内部数据交换、数据安全、主数据管理、数据应用、数据质量提升提供了基础,形成了企业内部“数据导航仪”,并用业务人员能理解的方式展现各种数据。东方航空借鉴达美航空公司的经验,分析了航空领域模型中近2000个实体,逐个核对了1249张业务系统表数据,梳理出了包括数据主题域、数据实体和业务系统在内的三层结构的数据地图,包括航班、票务等13个主题域,并针对每个主题域给出了多达227个业务实体目录及定义,以及每个业务实体对应的数据库表与业务系统。图1-10为东方航空的数据资产地图。
图1-10 东方航空的数据资产地图
6.2 全自动的元数据管理
元数据管理是大数据治理平台的核心部分,东方航空利用普元公司产品中的全自动采集和大数据地图的自动展现等功能,集中管理了包括技术、业务、操作在内的全企业的元数据,并分析出了海量元数据之间的关系,可视化的方式展现出东方航空数据资产全貌和数据之间的流向。图1-11为元数据管理架构。
图1-11 元数据管理架构
6.3 全流程的数据标准管理
借鉴国内外同行业的经验,东方航空快速形成了具有自身特色的数据标准流程,并通过自动化的管理流程,保证了东方航空数据标准应用的效率和效果。在标准落地时,东方航空通过元数据的核心技术手段来检查数据标准的落地情况,从而能够在数据生命周期中的多个阶段(如计划、规范定义、开发上线等),检查系统数据模型的合规性,以确保东方航空数据标准的落地。图1-12为东方航空数据标准管理流程。
图1-12 东方航空数据标准管理流程
6.4 智能化的数据质量管理
为了实现数据质量的统一闭环管理,东方航空数据质量管理覆盖了数据质量定义、监控、问题分析、整改和评估等多个环节,并建立了数据质量考核机制,对数据质量进行统一汇总、分析并自动形成数据质量问题报告,实现了度量规则的灵活管理,提供了数据质量规则引擎和模板化的配置,以及复杂的度量规则和检核方法生成机制,支持以智能化的检核方法高效地对海量数据进行质量检查,以PDCA[2]管理模型思路实现了数据质量的有效提升。图1-13为数据质量管理方法。
图1-13 数据质量管理方法