何祺 陈美
关键词:
政府数据开放平台;
链接分析法;
影响力;
可视化;
安全评估分级分类;
平台合作互动
DOI:10.3969 / j.issn.1008-0821.2024.07.008
〔中图分类号〕D63-39 〔文献标识码〕A 〔文章编号〕1008-0821 (2024) 07-0084-12
政府数据开放平台是政府向公众开放数据的主要途径之一, 代表了政府的透明度和开放承诺。我国对数据开放高度重视, 将政府数据开放平台的建设作为数字经济时代的重要工作和更好地管理数据资源、提供公共服务, 并推动城市的可持续发展和智慧化转型的重要举措。2022 年, 国务院发布的《关于加强数字政府建设的指导意见》[1] 提出, 要构建统一规范、互联互通、安全可控的国家公共数据开放平台。在数据成为我国改革发展的关键方向之时, 根据《中国地方政府数据开放报告——省域指数》数据显示[2] , 截至2022 年10 月, 我国已有21 个省份上线了政府数据开放平台。可以说, 我国在数据开放平台建设方面已具备一定基础, 具备政策支持和发展潜力。对政府数据开放平台进行更加精细的数据分析和运用, 定能助推我国数字治理能力的不断提升。
目前, 我国数据开放虽然取得长足发展, 但对促进数字经济、激发社会创新的作用还不突出。相关领域的学者指出公共数据实用性不高, 存在“形式开放倾向”、监督约束机制较弱、数据容量低、服务种类较少等问题[3-4] , 说明我国政府开放数据平台还有较大的改进空间。各省政府数据开放平台的地位如何? 在哪些方面还需怎样改进? 如何助推政府数据开放平台数字化改革进一步提质增效? 针对以上几项问题, 本文对此开展研究。
1 研究背景
1.1 链接分析及其应用
链接分析法主要通过搜索引擎或专业工具, 对网页中的链接数量、网页数量、访问量等数据进行收集分析, 从而发现其内在规律, 常用Google、站长工具、百度、Alltheweb、Moz Link Explorer 等工具获取相关数据。链接分析法反映了网页之间的“参与” “推荐” 和“引用” 关系, 是评价平台影响力的重要方法, 并逐渐在经济学、管理学、情报学等学科领域进行应用[5-8] 。
此外, 作为网络信息资源挖掘的工具之一, 社会网络分析(Social Network Analysis, SNA)也逐渐受到学界重视[9-11] 。由于SNA 可以提供丰富的理论基础和定量方法, 很多研究借助SNA 的思路与工具, 与链接分析法结合应用[12-14] , 以便进一步探索网络中信息资源的组织方式和联系形式。本文将借助SNA 中的连通性分析、中心性分析、派系分析以及边缘—结构分析, 对各省政府数据开放平台之间的链接关系进行深入探索, 以展现各平台之间的联系。
1.2 政府数据开放平台相关研究
从现有研究来看, 国内外学者对政府数据开放平台的研究视角多样。初期对政府数据开放平台的研究主要聚焦于规范标准、技术特征、平台设计等方面[15-18] 。相比国外, 国内政府数据开放平台存在规模较小、完备性不足、结构不完整等问题, 平台建设有待进一步完善[19] 。随着研究的进一步深入, 学界的探讨方向开始向平台功能、评估标准、建设上存在的不足等方面逐渐转移。部分学者开始关注政府数据开放平台的评估指标[20-24] , 希望据此来推动开放数据的实践;
同时, 也有学者指出政府数据开放平台存在数据权属、政策环境等阻碍问题[25-26] 。此外, 用户群体也逐渐受到关注, 研究者会以用户访问量为影响因子作为评价平台影响力的因素之一。例如, 有文献提出通过增强用户活跃度、提升公众参与度来提升数据开放能力[27-31] 。同时,有学者对国内外以及不同省份的政府数据开放平台开展对比研究, 提出改善建议, 从而增大平台影响力。通过对比不同省份的政府数据开放平台, 可以识别出最佳实践和成功经验。这些经验可以被其他省份或国家(地区)借鉴, 以改进本省政府数据开放平台, 提高数据的质量、可用性和平台影响力。
综上, 本文通过采用SNA 分析法, 作为链接分析法的延续和补充, 深入挖掘省级政府数据开放平台之间的关系, 探讨不同省份数据开放平台的影响力, 并对平台的改进和完善提出合理建议。
2 数据收集及研究设计
2.1 数据来源
省级政府数据开放平台建设是中央和地方电子政务发展中的重要环节。作为具有战略地位的平台,省级政府通常在政策制定和实施方面具有更大的影响力。同时, 研究省级政府数据开放平台之间的关系可能会提供更多关于政策影响的洞察, 并且省级政府数据开放平台的数量相对适宜, 在实际操作层面具备可获性。因此, 考虑到省级政府开放数据平台的战略地位、战略洞察及其数据的可获性, 本研究将我国省级政府数据开放平台作为研究对象, 对平台的链接指标进行比较分析。为了提高结果的准确性, 本文借鉴《中国地方政府数据开放报告——省域指数》[2] 上发布的政府数据开放平台, 在排除无法登录以及缺失数据较多的省级平台后, 最终选择17 个省份的官方数据开放平台作为研究样本,具体省份及相关链接等信息如表1 所示。
2.2 研究设计及评价指标
首先, 借鉴以往文献并结合研究目的, 本文选取4 个一级指标和14 个二级指标对17 个省级政府数据开放平台进行对比, 并基于各省自身政府数据开放平台与其他省份数据开放平台的友情链接形成的网络进行分析。
在评价指标方面, 本文拟采用平台规模、平台链接数量特征、平台影响力特征和社会网络影响力4 个一级指标和各指标下属细分的总网页数、总链接数、总链影响因子和网络密度等14 个二级指标为评价指标。相关指标数值越大, 平台内容和结构的完备性、系统性、影响力和凝聚力越强。如表2所示。
2.3 数据采集
本研究于2023 年6 月底对17 个省级政府数据开放平台进行数据收集。由于我国省级政府平台基本上都以中文为主要语言, 因而选择搜索引擎的标准之一是收录中文网页的数量大, 而且数据库更新及时、覆盖面广。在前述提到的常用工具中, 百度的数据覆盖度相对较低, 结果可信度较低, Alltheweb已被收购停止运营, MozLink Explorer 的数据更新速度较慢。因此, 笔者借鉴已有文献, 选用稳定性较强的Google 搜索引擎和站长工具(https:/ / tool.chinaz.com/ )来获取17 个政府数据开放平台的链接数据[19,41] 。结合Google 搜索范式, 以福建省政府数据开放平台为例, 确定了检索式数据汇总[17] , 如表3 所示。
3 各省政府数据开放平台外部特征分析
外部特征即各省政府数据开放平台间链接存在的形式。譬如:
为估算平台之间的关联性和紧密性,链接的关联网页会出现在平台专门设立的友情链接中;
为解释或扩展网页内容, 相关链接会出现在平台数据集的内容中;
为方便用户进行搜索查询, 平台页面也可能会连接到该平台自身的其他网页等。链接的外部特征会因为平台中设置网页的目的不同而产生差异, 反映各省政府数据开放平台链接的表征, 形成对平台的宏观认识。
需要说明的是, 安徽、甘肃、河北的政府数据开放平台的总网页数(X1)、内链数(X3)、外链数(X4)等数据均检索不到, 缺失数据过多, 故不进行分析, 但后续进行社会网络分析时仍列入研究范围。此外, 辽宁、宁夏、陕西和青海的反链数量无法检索, 故不统计该4 个省份的反链数据。
3.1 平台网页信息统计分析
如图1 和表4 所示, 不同省份政府数据开放平台总网页数、总链数、内链数、外链数和反链数各项指标存在数量级倍的差异, 说明平台在规模、完备性、影响力等方面存在显著不同。具体分析如下:
如图1(a)所示, 湖北省政府数据开放平台在17 个省级政府数据开放平台中总网页数最多, 意味着平台规模最大, 浙江省、广西壮族自治区和山东省的政府数据开放平台的规模位居其后。
如图1(b)所示, 辽宁省政府数据开放平台的总链数量超过百亿级, 总体影响力和辐射力最大。
如图1(c)所示, 四川省内链数超过8 万条, 说明该平台结构的关联性和完备性最高, 广西壮族自治区内链数虽然远不及四川省, 但也超过万条, 平台结构上相对其他省份政府数据开放平台更为完善。
如图1(d)所示, 辽宁省政府数据开放平台搜索得出的与该平台存在关联的链接网页数在各省数据开放的官方平台中最高。从外部链接数与总链接数的关系可以看出辽宁省政府数据开放平台的影响力与网络辐射力最强。
如图1(e)所示, 广东省反向链总数数倍于其他省份政府数据开放平台。说明广东省政府数据开放平台的拥护度更高、平台美誉度更好。
3.2 政府数据开放平台引用分析
各省政府数据开放平台的引用来源各有特色,本文基于各省政府数据开放平台的友情链接数据进行探讨。此外, 由于本节不具体到平台内部结构和规模, 仅分析各省政府数据开放平台间的相互关系,因此, 为了展现各平台之间链接的全面性, 本文在后续涉及相关内容时, 研究样本除了基于《中国地方政府数据开放报告——省域指数(2022 年度)》[2]中提到的17 个数据开放平台, 还新增了部分平台链接中涉及的北京市、上海市以及天津市数据开放平台。
如图2 和表5 所示, 一是在数据开放平台的引用数量分布中, 有11 个平台的入链网络域名来自贵州, 有两个平台入链网络域名来自广西, 除此之外, 其他省份平台的入链网络域名在数值上表现相似。外链网络域名引用数量排名中居首位的省份是浙江, 广东位居其次, 北京、上海、贵州位居第三,且引用数量相同。二是各省数据开放平台在使用方面呈现一定的规律, 如外链网络域名引用数量较多的省份, 更多会选择贵州省、山东省和浙江省作为外链来源。而外链网络域名引用数量较少的省份仅会选择贵州省作为外链来源, 说明我国数据开放平台可能存在以“学习” 模式为主的建设模式, 同时也在一定程度上反映了贵州作为数据产业发展最活跃的地区之一, 也是数据产业的领军省份, 技术、观念等经验较为前沿, 在政府数据开放方面占据领先地位和优势, 其数据质量和内容受到其他省份的认可和重视, 因此被多数同类平台借鉴。需要注意的是, “学习模式” 下政府数据平台的发展建设可能会引起创新能力不足、平台建设模式与本省数据不匹配等问题, 在建设平台的过程中需要引起重视。
4 各省政府数据开放平台影响力分析
SNA 反映各省数据开放平台之间的关系和互动模式, 以及这些关系所形成的网络结构和特征。通过这种分析方法, 可以更好地了解平台的运作规律,并形成对平台之间的微观认识。
由于数据开放平台的关系属性, 对其进行社会网络分析研究时二值最矩阵会更加适用。因此, 本文将各平台间的互链情况转化为0-1 矩阵。如表6所示, 数字表示行平台是否链接到列平台, 0 为不存在引用链接, 1 为存在引用链接, 整体网络为非对称矩阵。
4.1 网络连通性分析
连通性是指在网络中任意两个节点之间都存在一条路径, 使得这两个节点能够相互通信、交换数据。网络连通性是网络中节点之间连接的重要特性,直接影响着网络的可靠性、稳定性和可用性。对连通性进行评估在数据开放平台网络中具有重要意义,不仅能够影响信息交流、政策制定、协同创新等方面, 而且是评估平台影响力和政府间合作质量的重要参考指标。一个高连通性的网络意味着各省政府能够更加方便、快捷地分享政府数据、经验和最佳实践, 推动政府间的协同合作。本文分别通过网络密度和可达性来反映数据开放平台的连通性, 利用Ucinet6.0 为工具进行计算, 如表7 所示。
网络密度描述了节点连接的紧密程度, 反映了网络的凝聚力。网络中各节点的链接越多, 则网络密度越大, 越接近1。各省数据开放平台网络密度为0.1082,标准差为0.3106。从整体来看, 各省数据开放平台之间链接较少, 且链接数量分布存在一定的差异。
网络可达性考察了信息和资源的传递能力, 即网络中各个节点的互相链接能力。本文以平均直径对该指标进行测度。经计算, 各省数据开放平台整体网互链平均路径为1.803, 基于小世界理论可认为, 我国各省数据开放平台从任意一个节点到下一个节点平均需经过1.8 个其他站点, 即任意平台节点需要经过约1~2 个节点即可到达该网中所有平台节点。
4.2 点度中心性
4.2.1 点出度、点入度比较
在有向网络中, 节点有可能与其他节点有单向连接, 而这些单向连接的数量就是该节点的出度。“出度” 即向其他节点的边的数量, 用来表现平台关注其他对象的程度, 点出中心度高的平台在这个网络中会积极与其他平台取得关联。当节点有可能被其他节点单向连接时, 这些单向连接的数量就是该节点的入度。“入度” 即向该节点的边的数量,用来表现平台的被关注程度, 点入中心度高的平台是其他平台都希望与其进行关联的对象。
如表8 所示, 整体网中出度大于入度的省份主要有:
贵州、山东、天津、海南和广西。出度高的数据开放平台, 在网络中能通过其他对象获得更为丰富的信息。说明这些省份的政府数据开放平台在网络中具有较强的交际互动性, 积极性高。入度大于出度的省份主要有:
广东、浙江、江西、陕西、北京、四川和湖北。入度高的数据开放平台有可能会引导该网络互动交流时的内容、视角等。说明这些省份的政府数据开放平台在该网络中具有很高的声望, 体现了平台的吸引力。
4.2.2 中心性分析
出度和入度共同构成节点的度。度反映了该节点与其他节点的联系程度, 是该节点影响力大小的体现, 即节点的度的数值越大, 将会具有更多的连接关系。将政府数据开放平台形成网络作为无向网,对于拥有N 个节点的无向网络, 节点i的点度中心性是i 与其他N-1 个j 节点的直接联系总数, 如式(1) 所示[42] 。该数值越大, 对应节点越大, 即该节点占据的中心性越高, 网络参与度越高, 节点越重要。
如图3 所示, 政府数据开放平台网络中的热点区域为贵州, 其次是浙江和上海。这些地区在网络中有较多的连接, 可能在信息传播、资源传递等方面起着重要作用。而宁夏、安徽、河北、青海、福建和辽宁节点度数为0, 属于孤立节点。孤立节点的产生可能包括平台内容、平台的结构设计、推广宣传或其他各种因素。譬如:
这些省份政府数据开放平台中没有主动开放大量的数据集, 缺乏数据开放;
平台数据集规模相对较小, 尚未与其他省份的数据平台建立直接连接;
数据标准、格式等与其他省份不兼容, 其他省份的数据平台无法顺利连接和使用;
数据主题与其他省份没有交叉或重叠;
推广和宣传方面不足等。因此, 这些省份在数据开放方面的规模和影响力相对较低。需要强调的是, 节点度中心度为0 并不意味着这些地区在整个网络中没有重要性或作用, 只是表示在当前网络的分析范围内, 这些地区没有直接连接。
4.3 派系分析
派系分析是用于识别和研究社会网络中派系的方法。派系是指一个紧密相连的子群体, 其中每个成员都与其他成员有直接的联系。在派系中, 每个成员之间都有较高的连接度, 而与派系之外的成员之间的连接度相对较低。派系分析的目标是发现网络中潜在的派系群体, 以了解这些派系内部的关系。故本文通过派系分析探明数据开放平台中存在的派系情况, 结果如图4 所示。其中, 贵州、浙江在7 个派系中均出现6 次, 说明他们在派系间发挥着重要的纽带作用。此外, 贵州和浙江的数据开放平台可能存在以下特征, 而这些特征对两个省份在派系中的影响力也有一定程度影响。具体如下:
一是数据开放广泛且均衡:
贵州、浙江的政府数据开放平台在7 个派系中都有相似的出现次数,这可能意味着它们在多个方面都开放了数据, 并且数据的主题和内容比较均衡, 没有明显偏重于某个特定派系。广泛且均衡的特征意味着不同领域的用户可以从中受益, 包括研究机构、企业、公众、媒体等。这种吸引力有助于提高平台的影响力, 使更多人参与到政府数据的利用与交流中。
二是高度透明和开放:
贵州和浙江的政府在数据开放方面表现出较高的透明度和开放性。这两个省份在政府数据开放平台上提供了丰富的数据资源,以满足不同用户和利益群体的需求。与此同时, 政府数据开放平台的透明度和开放度, 加强了政府与公众之间的互信。公众能够更加深入地了解政府的政策和决策过程, 建立起更为健康的互动关系。
三是开放数据影响力相似:
贵州和浙江的政府数据开放平台在多个派系中均有出现, 这表明它们在数据开放领域受到广泛关注, 具有相似的影响力。
4.4 核心—边缘结构分析
核心—边缘结构描述了网络中节点之间的不平衡连接模式, 其中少数核心节点拥有较多的连接,而大多数边缘节点连接较少。用Ucinet6.0软件测算实际数据与理想模型之间相关系数为0.663,网络中成员归属情况如表9所示。
从中可知, 政府数据开放平台形成的网络整体呈现出典型的“核心—边缘” 特征。广东、贵州、海南、山东、浙江和上海被认为是核心节点, 在网络中扮演着关键的角色, 它们通常是信息传播、数据交换和资源传递的主要枢纽, 在政府数据开放方面具有较大的影响力和重要性。广西、江西、宁夏、陕西、四川、湖北、北京和天津被认为是边缘节点,在网络中的作用较为边缘化, 与核心节点之间的连接较少。但这并不意味着这些地区在政府数据开放方面没有价值, 而是它们在该网络中的连接性相对较少。
此外, 核心节点主要集中在东部地区, 而边缘节点则分布在东部和西部地区, 表明数据开放平台存在一定的区域差异。具体来说, 东部地区政府在数据开放方面相对较好, 较为积极地开展工作, 从而导致了核心节点的集聚。而西部地区在数据开放方面相对滞后, 因此在该网络中表现为边缘节点。
5研究结论
通过阅读文献和查阅数据报告, 本文将《中国地方政府数据开放报告——省域指数》中涉及的相关省级政府数据开放平台作为研究样本。基于链接分析法, 并以SNA 法作为延续和补充, 通过Google 搜索引擎、Ucinet6.0 获取平台链接数据, 同时从4 个维度、14 个二级指标构建框架对我国省级政府数据开放平台数据进行分析。得到以下结论:
5.1各省数据开放平台建设存在明显差异
从收录的网页数来看, 湖北省数据开放平台规模最大, 但从平台外部链接来看, 辽宁省数据开放平台的影响力与网络辐射力更强。以内链数为视角进行切入, 四川省和广西壮族自治区政府数据开放平台网站自身结构的层次性和完备性较高。在反链方面, 广东省政府数据开放平台的反链数远超过其他省份, 说明平台的拥护度、美誉度更高。
在各省数据开放平台外链网络域名引用数量分布中, 有11 个省级数据开放平台入链网络域名来自贵州省, 有两个省域开放数据平台入链网络域名来自广西壮族自治区, 除此之外, 其他省份在数值上表现相似。这反映出我国对数据开放平台的建设可能以“学习” 模式为主, 且贵州在其中起到示范引领作用。
5.2 各省数据开放平台网络构成一个小世界
就网络密度而言, 各省数据开放平台之间链接较少, 且链接数量分布存在一定的差异, 就网络可达性而言, 任意平台需要经过约1~2 个节点即可实现网络中所有的数据开放。
基于对各省数据开放平台网络中出度和入度的比较, 贵州、山东、天津、海南和广西的政府数据开放平台出度大于入度, 具有较强的交际互动性;
广东、浙江、江西、陕西、北京、四川和湖北入度大于出度, 平台的声望、吸引力较高。
基于点度中心性分析, 贵州、浙江和上海在信息传播、资源传递等方面起着重要作用, 宁夏、安徽、河北、青海、福建和辽宁属于孤立节点, 可能在平台内容、平台的结构设计、推广宣传等方面有所不足。
基于派系分析, 贵州、浙江在各省数据开放平台整体划分的派系间发挥重要的纽带作用, 两者数据开放程度较高, 开放内容较为均衡, 在数据治理、平台影响力方面较为相似。
在各省政府数据开放平台形成的网络中, 各省数据开放平台在整体上呈现出典型的“核心—边缘”特征。广东、贵州、海南、山东、浙江、上海为核心节点, 广西、江西、宁夏、陕西、四川、湖北、北京和天津被认为是边缘节点, 体现一定程度的地域差异。
6启示
数据开放是公众了解政策运作的重要途径, 事关我国数字化改革的战略方向和目标。而政府数据开放平台作为数据开放的重要形式载体, 有利于助推我国数字治理能力的提升, 推动了政务改革数字化走向深入。综合全文分析, 本文提出如下建议:
一方面, 扩大数据资源开放范围, 重视可视化分析。湖北省政府数据开放平台网页数最多, 在规模上占据绝对优势。该平台也提供了丰富各类行业的图解数据报告, 如新能源、医疗器械、农业科技等, 但在平台影响力方面并非十分理想。与其他省级政府数据开放平台相比, 湖北省数据开放平台的内部链接数与辽宁省、山东省、广东省等地区存在数量级的差别。深入到地区数据开放平台内部发现,辽宁省、山东省、广东省数据集资源较为丰富, 且可视化程度较高, 形式、内容与美观度方面均具有优异表现。举例来说, 辽宁省、山东省和广东省的可视化均结合地图服务, 且可视化种类在4 种以上, 而湖北省开放的数据集仅有11 个, 且可视化表现形式只包含柱状图一种类型。当以视觉传达表示时, 数据揭示了更多的洞察力。因此, 平台需要扩大数据资源开放范围, 重视可视化分析, 让数据传达具有更高的影响力和有效性, 同时也让可视化成为理解、解释和洞察数据集内容的强大工具。
另一方面, 促进各省数据开放平台合作互动,建立数据开放交流联盟。本研究发现, 整体上我国各省之间联系紧密程度差异较大, 呈现典型的“核心—边缘” 特征。核心节点之间的连接性较为紧密, 这有助于促进数据合作和资源互补。而边缘节点则需要加强与核心节点之间的联系, 以便更好地参与到政府数据开放网络中, 并与其他地区进行数据交流和合作。此外, 具体到派系层面, 贵州、浙江数据开放平台在派系中发挥着重要的纽带作用。本研究从链接层面揭示各省数据开放平台在所形成的网络中的地位, 分析结果反映, 创建开放数据交流平台, 让核心平台和边缘平台之间可以进行数据交流和经验共享, 可以促进各地区之间的合作与互动, 共同推进数据开放的发展。一是确保数据标准化和互操作性。核心平台和边缘平台的数据都遵循统一的数据标准, 以提高数据的互操作性和可比性。这样可以更好地整合数据资源, 促进跨地区、跨部门的数据共享和交流。二是深入研究贵州和浙江的数据开放策略。对贵州、浙江的数据开放平台进行深入研究, 了解其数据开放策略、实施措施和取得的成果。探究其在数据开放方面的成功经验和值得借鉴之处, 进行广泛宣传和推广。通过分享经验, 可以促进各地区之间的学习和合作, 助推政府数据开放平台数字化改革全面提质增效。
后续研究可进行不同城市层面或国家(地区)层面的比较, 希望能更具体、更深层次地对政府数据开放平台建设现状进行探讨, 为我国政府开放数据平台的建设和数字治理提供理论与数据支持。
猜你喜欢 影响力可视化 关于公布我刊2020年高影响力论文的通知眼科新进展(2024年1期)2024-01-08自然资源可视化决策系统北京测绘(2022年6期)2022-08-01让激情更具影响力作文小学高年级(2022年6期)2022-07-01思维可视化师道·教研(2022年1期)2022-03-12基于Power BI的油田注水运行动态分析与可视化展示云南化工(2021年8期)2021-12-21自然资源可视化决策系统北京测绘(2021年7期)2021-07-28基于CGAL和OpenGL的海底地形三维可视化海洋信息技术与应用(2020年1期)2020-06-11“融评”:党媒评论的可视化创新传媒评论(2019年4期)2019-07-13天才影响力NBA特刊(2018年14期)2018-08-13黄艳:最深远的影响力人大建设(2017年11期)2017-04-20扩展阅读文章
推荐阅读文章
老骥秘书网 https://www.round-online.com
Copyright © 2002-2018 . 老骥秘书网 版权所有