明略科技以数据与知识双驱动助力数字政府建设

2020年6月17日,“2020 数字政府建设大会”以网络大会形式成功举办。明略科技集团技术副总裁黄代恒出席大会并做“数据与知识双驱动,助力数字政府建设”主题演讲。

本次“2020 数字政府建设大会”旨在进一步贯彻落实党的十九届四中全会精神,总结和交流政府数字化转型路径和先进经验,加快促进大数据、物联网云计算人工智能、区块链等新一代信息技术的深入应用,全面提升政府治理现代化水平。

明略科技在数据中台方面,积累了处理海量多源异构数据的技术,沉淀了从汇聚到共享服务的全栈工具和行业Know-how。在数字城市领域,参与了包括长沙、贵阳、深圳坪山等政府城市级别的数据中台建设,同时也是腾讯WeCity未来城市数据中台建设的战略合作伙伴之一。同时,明略科技让数据说话,打造营商环境改善和政务服务优化应用,基于政务数据中台,通过构建知识图谱,利用画像、行为分析、智能推荐等技术,帮助政府对区域产业以及企业发展态势进行分析,在法人、自然人政务服务方面提升有效触达和精准率。

在演讲中,黄代恒分享了明略科技“数据与知识双驱动”的数字城市建设经验,核心观点如下:

数字城市建设需要“数据”和“知识”的双轮驱动;

数据融合共享的目的是支撑智能应用,需要场景的牵引;

“数据在线”是“知识应用”的必要不充分条件;

“知识” 的特点是形式多样,难感知、难提取、难固化;

数字城市建设的重心和难点由汇聚到应用,由数据到知识,是一个长期过程。一方面需要横向拉通(技术、平台、引擎、数据)与纵向深入结合,一方面需要领域知识与技术服务融合。

以下是他的演讲摘要:

近年来,国家层面对数据重要性的认知不断强化,相关政策持续演进。很多城市地方政府的大数据局、“政数局”等“新型的城市数据机构”都在积极开展数字城市建设。他们的主要业务目标一般包含:

第一级,基础工作,完成采集融合数据,实现资源积累;

第二级,开放共享,跨部门的支撑数字政务的应用;

第三级,综合的跨域的精准感知城市运行状态;科学分析支撑决策;

第四级,快速高效支撑数据智能应用。

针对上述需求,平台层面的解决之道是将数据“打破组织部门墙”重新关联汇聚,将城市运行全要素全周期信息统一标准、统一口径、全生命周期、全价值链一体化拉通,构建政府数字化转型必需的数字资产生态体系,形成智能化组织、管控和运营。

数字城市建设需要“数据”和“知识”的双轮驱动。

数据方面,城市大数据的数据资源来源丰富多样,广泛存在于经济、社会各个领域和部门,是政务、行业、企业等各类数据的总和。同时,城市大数据的异构特征显著,数据类型丰富、数量大、速度增长快、处理速度和实时性要求高,且具有跨部门、跨行业流动的特征。

一般来讲,城市数据流动路径分为:汇、管、用、评四步:

第一,汇,是数据汇聚,包括不同的级别的数据,还有内部和外部的数据;

第二、管,是汇聚之后进行数据治理、管控;

第三、用,是在可控的情况下进行数据的共享开放和分析应用;

第四、评,是对数据质量、使用效果的评价。

其中,城市数据服务关键步骤包括:

第一、平台搭建,构建城市数据平台,具备数据汇聚、加工、治理和应用的基础能力,快速释放数据价值;

第二、标准制定,建立完善标准,规范供需管理、数据汇聚、数据加工治理、数据共享服务等流程;

第三、汇集数据,梳理数据资源目录,适应不同形式、结构、频度,分阶段汇聚数据进入数据平台;

第四、提供服务,依据业务部门需求,加工治理数据、设计数据主题并分层实现,挂接服务在合法合规的前提下实现共享。

目前,城市数据建设中存在一些常见的问题包括:

一、数据融合协作的内驱力不足。

数据孤岛的背后首先有个人隐私保护和网络安全的考虑,除了数据访问权限控制,还涉及到“数据即监管”以及组织的重构等深层问题。

二、“服务管理”需求导向不够。

目前,城市的政务应用大部分是服务于业务流程,真正服务市民的需求和城市综合管理者的城市运行决策的数据应用仍不充分,这意味着城市的数据汇聚和共享的价值还没有真正传递给“终端用户”。

在这种情况下,以应用为牵引来去拉动需求,是以上两个问题一个比较现实的解决方案。每个城市需要因地制宜地选择合适的“牵引点”,比如,有的城市强调管理、政用,这样的城市就以城市运行态势的综合管理为“牵引点”;有的地方重视民用、市民服务,就可以以一网通办为“牵引点”;有的地方是以商用为主,那就以促进当地的产业经济发展为牵引,来深入的分析产业的状态,促进经济发展。

以上是“数据”如何驱动数字城市建设的部分,那么“知识”是如何驱动数字城市建设的?需要研究讨论城市运行管理与服务过程中有哪些形态的知识。

首先,当我们在观察一个城市、园区或者企业的运行状态时,我们都可以把它们分解成各种各样的运行管理指标, 一般的城市运行管理指标包含制造能力、消费情况、进出口情况、投融资情况、科研等,我们要考虑不同的城市有不同的侧重点,应该做相应的调整。同样的,城市的政务服务、交通运行、气象环境、产业的运行效能的分析,分析视角也在不断迭代。

以产业的运行效能分析为例,以前一般的城市管理仅仅分析GDP、纳税贡献这样的宏观指标,但是现在很多城区管理效率指标趋向精细化,按照坪效来算,或者按照政策扶持的使用率来计算等,进行综合的分析,这实际上是新时代城市管理思路和理念的体现,不简简单单的是一个数据指标,背后隐含的是城市管理者的专家知识。

在指标分析基础上,可以一定程度上用数据来替代人来做城市管理态势的判断和流程的自动处理。

以交管领域的态势判断为例。

对超大型城市,为每个街区建立基础画像。

根据历史数据设定调整规则。因为城市每天的交通情况不一定都是均匀的,会有一些“特殊情况”。比如我们会根据历史数据对49尾号进行调整。我们所在的城市分了5个阶段制定限行措施,由于中国的车主一般不太愿意用4的号码,所以本身车尾号4的车主会少一些,那么车尾号4限号的那一天,这座城市的拥堵情况实际上会比其它时候严重一些。因此针对这种“特殊情况”,我们要调整规则,以避免车尾号4限号的那一天发生严重的拥堵情况。

增加一些特殊的预警规则。比如“趋势增长预警规则”,当拥堵指数连续3天比率增长(比如说第一天2%,第二天4%,第三天6%),即使拥堵指数没有到我们设定的指标红线,但是它一直在增长,那么系统也应该预警,要事前预警,而不能等拥堵指数到了指标红线再预警。

城市运行管理与服务过程中的第三类知识是主题模型和统计加工的方法。

不同的城市最常见的人口库和法人库等等,包含公民的教育科研信息、信用记录等等,将知识融合进主题模型和数据统计加工的方法中去,会使我们每个城市的数据建设和建库的时候,规则更统一,建设效率更高,避免走很多弯路,数据模型积累是城市管理经验和管理知识的一种固化和下沉。

城市运行管理与服务过程中的第四类知识,文本中的规则要素。在城市运行的过程中有大量的文档,比如“干部评价”。干部评价的文档就是我们每年要进行干部的考核,这里涉及大量的文字描述。可以使用NLP自然语言处理技术对所有干部评价的历史数据进行分析,把干部评价中的文本要素提取出来,比如性格、专业技能(如经济管理)、重大项目经验(如参与奥运会的筹办工作)等等,我们就能对这期的领导班子的构成进行分析,根据岗位需求和领导者的能力更高效地实现“人岗匹配”。

另外一个例子是,每个城市的预算的使用都会有一些规定,比如PPP项目预算,不能超过本市GDP的0.5%。这些文本中的关键要素和规定指标其实都可以提取出来,如果项目预算数据和城市预算数据整个打通,当您在申报一个新的审批项目时,可以看到审批的总金额是否达到预警线,甚至告诉你离预警线只差20%。这些都是非常重要的藏在文档中的知识,可以通过智能技术将这些大量地非结构化数据转化成“知识”,来辅助决策。

最后一个领域,我们要介绍的是知识图谱技术在数字城市建设中的应用。例如最近科技抗疫中频繁使用的健康码。健康码实际上是一个“索引”或者抓手,更重要的是健康码背后的“健康档案”,市民的“健康档案”是城市知识图谱的重要组成部分。这些档案记录了你有没有去过高风险区域,最近体温是否正常等等。除了自然人,法人机构、土地建筑等等也有自己的代码,这些代码构成了城市主体的唯一表识标准。当每一个实体(自然人、法人机构、土地建筑等)都有唯一的代码,且这些代码互相打通,我们就可以建立城市中的人、事、地、物、组织的关系网络,利用知识图谱技术实现对密切接触人员的动态跟踪。

除了城市健康码之外,知识图谱在精准帮扶中也起到了重要作用,通过知识图谱可以分析帮扶对象两三度关联人群的属性和行为进行分析,将帮扶政策落实给真正需要的人。

综上所述,我们可以将数字城市平台建设中的工作分为两部分,一部分是弱行业属性的,也就是数据的加工治理,另一部分就是被我们称为知识的部分,它是强行业属性的,涉及到如何抽象数据模型的问题。比如,在金融领域,判断合规问题,是否符合管理流程;在交通领域,判断某个地方人群密集度、交通拥挤程度,在数据分析基础上进行交通预警,等等,解决这些强行业属性的问题使用的数据引擎、工具、可复用组件和流程,形成行业知识库,也叫做行业知识的落地。

为解决人机交互过程中现存的痛点,在组织智能的架构下打通感知与认知,实现人机协同,明略科技提出“HAO”智能理论,融合人类智能、人工智能和组织智能。 其中“组织智能”是非常集中的“知识”体现。

目前,我们看到的挑战是,在实现数据和知识双重驱动的过程中,知识的形式比较多样,并且,相比数据来说,知识更加难感知、难提取、难固化。但是,长远来看,数字城市建设的重心和难点会从数据的汇聚转到数据的应用,从解决数据的问题到解决行业知识的问题。这是一个长期的过程,一方面需要横向拉通(技术、平台、引擎、数据)与纵向深入结合,一方面需要领域知识与技术服务融合。从数据的单驱动逐渐转换到数据知识的双驱动,不断地提高现代化城市的治理水平和智能化程度。

(0)
上一篇 2020年6月19日 10:51
下一篇 2020年6月19日 10:59