[摘要] 开放政府数据范围问题是开放政府数据发展中首当其冲的难题之一。本文通过对美国联邦政府及州政府开放政府数据范围分析发现,美国开放政府数据核心的价值观就是实现并创造公共价值,并以此为基础对开放政府数据范围做了规定,明确了“数据”概念的要素组成,清晰地对例外情形进行了列举设定。开放政府数据门户网站以政策为指导,提供了丰富的开放政府数据。中国可以借鉴美国开放政府数据范围的政策规定及网站实践的经验,界定“数据”及相关概念,明确我国开放政府数据范围的应然状态和例外数据。

  一、引言

  自美国联邦政府2009年相继颁布《开放和透明政府备忘录》、《开放政府指令》,拉开开放政府数据运动大幕以来,全球范围内开放政府数据热潮如火如荼。中国开放政府数据也正在发展。2015年8月19日,国务院常务会议通过《关于促进大数据发展的行动纲要》,其中明确提出,“加快法规制度建设。修订政府信息公开条例。积极研究数据开放、保护等方面制度”。目前,我国北京、上海、武汉、无锡、湛江、哈尔滨、青岛、贵阳等多地已建成了开放政府数据门户网站。

  开放政府数据是一个新生事物。我国在开放政府数据前行的道路上面临着诸多风险和难题,开放政府数据范围问题是首当其冲的难题之一。开放政府数据范围是开放政府数据的核心内容,直接关系到行政机关对哪些数据负有开放义务,公众对哪些数据拥有知情权和利用权,开放的数据有无风险,是否会对个人隐私或者国家安全等构成威胁。鉴于美国是全球开放政府数据运动的领跑者,本文将深入考察美国开放政府数据政策文本,重点研究其开放数据范围,分析其所表达的意义,以期为中国应对开放政府数据范围问题提供借鉴。

  美国联邦政府、众多州政府和地方政府的开放政府数据政策文本都对开放政府数据范围作了具体规定,其相应的门户网站提供有丰富的政府数据。选择美国联邦政府、伊利诺斯州、纽约州、马里兰州开放政府数据政策系列文本以及其相应的开放政府数据门户网站进行分析。选择这些样本的原因是:美国联邦政府的政策文本及门户网站代表了美国中央层级政府开放政府数据的特点。美国数据创新中心于2014年8月发布的州政府开放政府数据政策及网站评分报告中,伊利诺斯州、纽约州、马里兰州并列第一,得分为8分,三州的政策文本完备性高,门户网站内容丰富,功能多样,所以这三个州代表了州级政府开放政府数据的特点。

  美国联邦政府及三个州政府的政策文本中,对开放政府数据范围的规定包含的重要内容有:开放政府数据价值观及目标的阐述、相关概念的界定、予以开放的政府数据范围、不予开放的政府数据范围。下面将对联邦政府及三个州政府的政策文本中对于开放政府数据范围的有关规定作以分析,并对其开放政府数据门户网站开放政府数据范围进行考察。(见表1 ~表4)

表1  开放政府数据价值观及目标的阐述
文本内容
政府
政策文本中对于价值观及目标的阐述
门户网站中对于价值观及建设目标的阐述
联邦
政府
建立一个透明度高、参与度高、合作协调的体制;开放政府指令要求行政管理部门和机构在实现创建一个更加开放的政府目标的过程中采取以下步骤:发布在线政府信息、提高政府信息质量、创建并制度化开放政府文化、创建支持开放政府的政策框架;抓住数字机遇,加大政府开放数据的权力,建立21世纪数字平台,以期更好地为美国人民服务;管理作为资产的信息,确保联邦政府对信息资源的充分利用。
在首页上提出在这个平台上将会发现数据、工具和资源,用于研究、开发平台和移动应用程序、设计数据可视化等。
伊利诺斯州政府
提出发布行政命令的原因是:鉴于州政府数据平台使大众获取并使用,鉴于……本命令将:(1)建立开放操作标准。(2)建立政策目标该行政命令旨在企业间推行开放操作标准,因为这将使伊利诺伊州政府的运作更加透明、高效、低消耗。在全州推行开放数据会使政府内外的沟通更加顺畅,让公众帮助政府做出高效的决策,为社会进步和经济发展创造机会。(3)功能协议与承诺等。
在首页提出本州开放数据门户是各种数据集的交易所,旨在提升公共数据的获取和使用,用常规方法使公众获得州公共数据。
纽约州政府
提出政府拥有大量的有价值的数据,关乎本州公众生活的各个方面。新的信息技术可以聚集越来越多的数据,并允许政府提供数据给公众。政府可以使用这些工具提高公众获取政府数据的效率,使纽约州政府更加透明,以促进公众的信任。确保政府数据的质量和一致性是必要的,以保持它的价值和效用。
在首页上提出提供前所未有的数据访问,可浏览和下载纽约州超过1250个的数据资源等。
马里兰州政府
为了开放数据可机读,并以特定方式向公众发布;为了建立开放数据委员会,并为该委员会的构成,相关人员的任命、条款的制定、主席以及人员构成提供依据等;以及为了提供开放数据计划等而制定政策。
提出数据平台是州公共数据的中心,提升政府的透明、责任,为公众提供前所未有的参与。平台提供数据、地图、APIs等。
表2  政策文本中相关概念的界定
概念
政府
数据
数据集
其它概念
联邦
政府
“数据”是指所有的结构化信息,除非另有说明。需要把所有的内容看作数据,将所有的非结构化内容转换成结构化数据,然后确保所有的结构化数据都是与有效元数据相关联。
数据集是指以表格或非表格形式表现的数据集合。
“开放数据”就本备忘录而言,是指开放可用的数据结构,能使最终用户完全发现和使用数据。在一般情况下,开放数据将符合以下原则:公开、可访问、说明、重复使用、完整、及时、发布后的管理。
伊利诺斯州政府
“数据”是统计数据或事实信息的最终版本,具有以下特征:(i)以字母或数字形式反映于清单、表格、图形、图表或其他非叙事形式中,可进行数字传输或处理;(ii)由本州实体,或代表其定期建立或维护,并由该等实体控制;(iii)记录与本州实体相关的评估结果、交易或决定。数据一词不得包括图像文件,如设计、图纸、照片或原始文件的扫描副本,但是,该词汇应包括关于图像文件和地理信息系统数据的统计或事实信息。“数据”不包括:(1)机构可依据任何联邦、州或地方法律法规的条款,包括但不仅限于《信息自由法》,而拒绝访问的数据…… (8)法律禁止发布的其他数据。

“公共数据”指任何州级单位或地方政府在不违反其他法律文书的前提下,根据《信息自由法》履行自身公务职责时收集的所有数据,包括但不仅限于联邦法律或州法律的取代条款或有合法管辖权的法院的禁令。
纽约州政府
“数据”是统计数据或事实信息的最终版本,具有以下特征:(i)以字母或数字形式反映于清单、表格、图形、图表或其他非叙事形式中,可进行数字传输或处理;(ii)由本州实体,或代表其定期建立或维护,并由该等实体控制;(iii)记录与本州实体相关的评估结果、交易或决定。数据一词不得包括图像文件,如设计、图纸、照片或原始文件的扫描副本,但是,该词汇应包括关于图像文件和地理信息系统数据的统计或事实信息。
“数据集”是指储存设备上的已命名集合,其中包含以特定或规定方式(往往以表格形式)组织或格式化的数据。
“可发布的州数据”是指所涵盖本州实体搜集的、且依照与本州数据相关的任何和所有适用法律、法规、规章、条例、决议、政策或其他限制、要求或权利,包括但不限于合同或其他法令、限制或要求,该等实体获准许、被要求或能够向公众提供的数据。如在开放数据网站提供数据将违反法令或法规(如披露信息将构成对个人隐私的无理侵犯)、危害公众健康、安全或福利、阻碍政府运作,包括引致刑事和民事调查,或对本州实体或本州施加不必要的财务、经营或行政负担,则该等资料不属于可发布的州数据;
马里兰州政府
“数据”是统计数据或事实信息的最终版本,其符合以下条件:(I)以字母或数字形式反映于清单、表格、图表、地图或者其他非叙事形式,可进行数字传输或处理;(II)由政府部门或政府指定机构定期创建或维护。(III)测量记录、交易记录或决策记录,或提供有关政府服务的信息、举措、有关政府实体使命的资源;(2)“数据”不包括供政府内部分析所使用的统计数据、事实信息的草拟版本。
“数据集”是指储存设备上的已命名集合,其中包含以特定或规定方式(往往以表格形式)组织或格式化的数据。
“开放数据”指数据符合任何适用的法律、规则、规定、条例、决议、政策的规定或其它的限制,包括与数据相关的需求或权利,州政府应:(I)收集;(II)并被授权、要求,或有能力向公众提供相关数据。(2)“开放数据”包括经合同认定的,以及其他合法的命令、限制或要求。“开放数据”中的数据不包括,一旦开放后将:(I)违反其他认定该数据开放行为违法的法律或规定;(II)危及公众健康,安全或福利;(III)妨碍政府工作,包括刑事与民事调查;(IV)将不适当的财政、业务或行政负担强加于州政府机构;(V)披露私有财产或机密信息。
表3  政策文本中开放政府数据范围具体规定
范围
政府
予以开放的政府数据范围
不予开放的政府数据范围
联邦政府
政府信息将作为一项资产在其整个生命周期中,提升互操作性和开放性,在法律允许范围内,尽量确保政府数据在向公众发布时能很容易地被公众找到、获取和使用。
在实施开放数据政策时,机构将在信息生命周期的每一个阶段,对隐私、机密和安全风险等方面进行全面分析,确定此类信息不会被发布。如果发布的信息会违反任何法律或政策,或危及隐私、机密或国家安全,机构将不发布这些信息。
此命令中的任何内容都不会强制或授权以下信息的泄露:特权信息、执法信息、国家安全信息、个人信息、或法律所禁止的信息。
伊利诺斯州政府
从“数据”的定义可见,数据(iii)记录与本州实体相关的评估结果、交易或决定……
从“数据”定义可见,“数据”不包括:(1)机构可依据任何联邦、州或当地法律法规的条款,包括但不仅限于《信息自由法》,而拒绝访问的数据……(7)雇佣记录、与内部雇员有关的名录或清单、设备数据、信息技术、内部服务台或机构内部管理相关数据;(8)法律禁止发布的其他数据。
纽约州政府
从“可发布的州数据”的定义中可以看到:所涵盖本州实体搜集的……包括但不限于合同或其他法令、限制或要求,该等实体获准许、被要求或能够向公众提供的数据。该开放数据网站将针对由本行政命令所指定的所涵盖本州实体拥有、控制、搜集或以其他方式维护的数据及报告(如可行)提供一站式访问便利。
从“可发布的州数据”的定义中可以看到:如在开放数据网站提供数据将违反法令或法规(如披露的信息将构成对个人隐私的无理侵犯……则该等资料不属于可发布的州数据。
马里兰州政府
从“开放数据”的定义中可以看到:数据符合任何适用的法律,……州政府应……(2)“开放数据”包括经合同认定的……
从“开放数据”的定义中可以看到:开放数据中的数据不包括,一旦开放后将:(I)违反其他认定该数据开放行为违法的法律或规定……(V)披露私有财产或机密信息。
资料来源:根据联邦政府及三个州政府的开放政府数据政策文本内容整理而来。
表4   门户网站具体开放政府数据主题范围
政府网站数据范围
门户网站开放政府数据主题范围
联邦政府
data.gov
农业、商业、气候、消费者、生态系统、教育、能源、金融、健康、地方政府、制造业、海洋、公共安全、科学研究
伊利诺斯州
data.illinois.gov
健康、住房、劳动、医疗补助计划、市政当局、公共卫生、公共安全、娱乐、参考资料、社会/医疗
纽约州
data.ny.gov
经济发展、教育、能源和环境、政府和财政、健康、公共事业、公众安全、娱乐、透明、交通运输、开发人员、公开预算
马里兰州
data.maryland.gov
行政、农业、生物区、地界、预算、商业和经济、人口、教育、高地、能源和环境、地理科学、卫生和人类服务部、历史、住房、水文、影像、方位、军事、规划、公共安全、社会、建筑物、运输、实用程序、天气等
资料来源:根据联邦政府及三个州政府相应的开放政府数据门户网站内容整理而来。

  二、美国开放政府数据的价值观是实现并创造公共价值

  从表1可见,美国开放政府数据政策文本中对开放政府数据价值观、关键动机及目标进行了明确阐述,就是要通过政府向公众开放政府数据,使公众能免费获取政府数据,从而实现并创造公共价值:提升政府整体治理能力:推进参与型、责任型政府建设,实现政府的透明化,提高政府科学决策能力,提升政府部门协同合作能力;推动经济创新发展:推进政府数据开放在商业创新以及刺激经济增长方面发挥效力,使第三方基于开放的政府数据能研发新产品,提供更好的服务,促进政府决策的透明度、强化问责制,并刺激公民更多的参与等;促进民生服务惠普性;加快智慧城市建设;促进数据文化形成。

  具体来看,联邦政府的《透明和开放政府备忘录》开宗明义,号召政府致力于“让政府开放程度提高到一个前所未有的水平”。《开放政府指令》在文件开头就提出,“该指令的发布旨在指导相关行政部门与机构积极采取具体措施,确保落实总统在施政纲要中提出的透明性、参与性与合作性原则”。《数字政府:构建更好地服务美国人民的21世纪平台》政策的开头部分提出,电子政府策略要达成的目标是三方面:“让美国人民能在任何地方、任何时间、任何设备上,访问到高质量的数字政府信息和服务”等。三个州政府在开放政府数据政策文本中,都在开头部分明确提出了制定该政策的动机。伊利诺斯州提出了基于六点原因,即文本中的六个“鉴于”,而促成开放政府数据政策的颁布。纽约州提出基于四点原因、即文本中的四个“鉴于”,因此发布了该政策。纽约州提出开放政府数据的动机就是保障公众对公共数据的获取与使用,促进政府的透明,提高政府的绩效。马里兰州2012年的政策中,没有提及政策颁布的动机,但在2014年的修订版中,明确提出了修订政策的原因。由此可见,联邦政府和三个州政府都有开放政府数据的强烈意图,政策动机的焦点还是有所不同,焦点受到了联邦政府、各州的具体需求的影响。

  此外,联邦政府及州政府开放政府数据平台的建设目标也非常明确。开放政府数据平台的价值定位和功能定位立足于所从属的政府层级。联邦政府开放政府数据平台主要是对联邦政府数据资源的开放,促进联邦政府改善服务等。州政府开放政府数据平台主要是对本州政府数据资源的开放,提升州政府的透明、责任等。由此可见,开放政府数据平台定位很明确,就是政府数据资源提供平台供公众参与、利用,以发挥政府数据的价值。

  综上所述,美国开放政府数据核心的价值观就是实现并创造公共价值,通过开放政府数据强化民主政治,保证民众获得政府数据、防止行政腐败、实现数据对于经济发展及实际生活的效用。这一价值观是指导、判断开放政府数据行为和制定开放政府数据政策的标准、原则和指标。美国开放政府数据政策明确了对这一核心价值观的规定,而且将其描绘成开放政府数据要达成的目标。

  三、美国政策法规以公共价值观为基础对开放政府数据范围做出了实质性规定

  美国开放政府数据政策以公共价值观为基础,这不仅体现在政策及门户网站对开放政府数据价值观等的明文规定中,也体现在政策对开放政府数据范围的实质性规定中。从表2、表3可见,美国开放政府数据范围的实质性规定包括两大构成要件,一是对数据及其它相关概念的界定;二是在概念界定基础之上对例外情形的列举设定。

  (一)界定了“数据”及其它重要术语

  美国联邦政府在《开放数据政策——将信息作为资产进行管理》政策中明确定义了以下术语:数据、数据集、公平信息实务准则、政务信息、信息、信息生命周期、个人可识别信息、马赛克效果、开放数据、项目开放数据。在《数字政府:构建更好地服务美国人民的21世纪平台》政策中对:“数字化信息”、“数字服务”、“数据及内容”做了定义。伊利诺斯州政府2012年制定的政策明确给出了以下术语的定义:云计算、数据、公开操作标准、公共数据、战略规划、自愿共识标准组织,2014制定的政策对以下术语进行了定义:云计算、数据、授予基金、被授予者、授予机构、开放运行规程、公共数据、州级机构、机构、企业战略应用计划、战略规划、自愿共识标准组织。纽约州政府的政策明确给出了以下术语的定义:政府实体、首席数据官、数据、数据集、纽约州信息技术服务办公室、可发布的州数据。马里兰州政府的政策明确给出了以下术语的定义:委员会、数据、数据入口、数据集、政府机构、地方机构、地图与地理信息系统入口、开放数据、开放数据入口。由此可见,无论联邦政府、还是州政府的开放政府数据政策都对“数据”这一核心概念作了界定,明确了其概念的内涵和外延。此外还明确了“数据集”、“机构”等重要概念的涵义。

  (二)明确了“数据”概念的要素组成

  美国联邦政府对“数据”概念给予了一个宽泛的界定,指出数据从类别划分有结构化数据和非结构化数据,并强调了要对非结构化数据向结构化数据的转换,还提出要确保所有的结构化数据都是与有效元数据相关联。这一定义主要是站在数据管理与利用的角度。

  三个州政府对数据的定义基本相似,数据的概念中至少包含了三个要素。其一,形式要素。在概念中规定数据形式是统计数据或事实信息的最终版本,而不是初始版本、中期版本、草拟版本等。马里兰州特别指出,“数据”不包括供政府内部分析所使用的统计数据、事实信息的草拟版本;数据是字母或数字的形式反映于清单、表格、图形等中;这类字母或数字具有的特点是可进行数字传输或处理;此外,在形式要素方面排除了图像文件,但是,特别说明了术语“数据”应包括关于图像文件和地理信息系统中的数据统计或事实信息。由此可见,对“数据”的外延阐述得很清晰。其二,主体要素。州政府政策中都强调了政府数据的制作、拥有、控制主体为所涵盖本州实体或其代表,即规定“由所涵盖本州实体,或代表其定期建立或维护,并由该等实体控制”。此外,伊利诺斯州特别指出,“数据”不包括由其他政府机构提供的信息。其三,内容要素。为了体现政府数据内容与所涵盖本州实体行使法定职责的关系,规定政府数据内容与行政管理和提供公共服务过程相关,即“记录与所涵盖本州实体相关的评估结果、交易或决定”。

  (三)强调数据开放的对象是“数据集”

  美国联邦政府和州政府都强调了开放政府数据的对象是数据的集合。联邦政府政策中给出了“数据集”的概念是数据的集合,“开放数据”的概念是开放可用的数据结构,开放的数据要完整等。强调数据开放要全面完整,使用户能得以使用。州政府政策也明确了对数据集合的开放。例如伊利诺斯州政府政策中指出,公共数据是任何州级单位或地方政府履行职责时收集的所有数据。“所有”两字就指明了数据开放的成片性。因为字母或数字形式的“数据”本身并不具有特定含义。零星的数据没有什么大的价值,只有具有一定量的数据的集合,即数据集才能彰显价值,才是开放政府数据政策法规的客体。

  (四)清晰地对例外情形进行了列举设定

  美国联邦政府和州政府开放政府数据政策的原则是“开放政府数据是原则,不开放是例外”,从而才能保证实现联邦政府政策提出的“确保向公众发布数据的方式,能够使数据易找到、可访问和可利用”,从而实现伊利诺伊州政策所提出的“用信息技术促进政府透明化、提高效率、节省财政支出”,实现纽约州所提出的“利用技术来提高透明度,提高政府绩效,提升公民参与”。

  联邦政府的政策指出,“如果发布的信息会违反任何法律或政策,或危及隐私、机密或国家安全,机构将不发布这些信息”。州政府的政策对例外情形的列举是在相关概念的定义表述中。伊利诺斯州政府在“数据”的定义中清晰地列举了不予开放的8类政府数据;纽约州政府在“可发布的州数据”的定义中,概括了可发布的州政府数据是什么,并且清楚地列出了不属于可发布的州政府数据为:如在开放数据网站提供数据将违反法令或法规(如披露的信息将构成对个人隐私的无理侵犯)、危害公众健康、安全或福利等;马里兰州政府在“开放数据”的定义中,概述了开放数据的特点,并明确指出了五类数据不予开放,因为这些数据若开放,将会违反其它认定该数据开放行为违法的法规规定;危及公众健康,安全或福利等。

  由此可见:第一,美国对具体的开放数据范围的规定主要采用了定义的方式以及肯定概括与否定列举相结合的模式。政策文本在术语定义中,对应当开放的政府数据作了综合概括式的描述,正面说明开放政府数据的范围,同时列举了不予开放或者免予开放的政府数据,将其排除在政府数据开放范围之外。不予开放的政府数据范围的规定在表述的篇幅上多于对予以开放的政府数据范围的规定。第二,那些联邦政府及州政府不予开放的政府数据具有的特点是:那些政府数据的开放会给国家利益、公共利益、个人利益造成危害,危机国家安全、危害公共安全、侵犯个人隐私等,那些数据不具有公开性、共享性和广域性的特点,的确不是社会广大公众所共同需要的,也不为广大公众服务。第三,政策对开放政府数据范围例外情形的列举其核心要件包含了对开放政府数据的价值判断,以公共价值观为标准,以实现和创造公共价值为目标,兼顾国家利益、个人利益,体现了权利平衡原则。条款数量少、内涵明确、用语严谨、限定严格、切实可行。由于对例外情形进行了列举设定,因此,行政机关面对海量政府数据,只需审查其是否属于不予开放的内容,这种开放政府数据审查方式能有效减少政府数据开放的运行成本,提高政府效率,也体现了以公共价值为开放政府数据价值观的特点。

  四、美国开放政府数据门户网站以政策为指导,提供了丰富的开放政府数据

  从表1的“门户网站中对于价值观及建设目标的阐述”一栏可见,开放政府数据门户网站是开放政府数据政策的采纳、贯彻与执行,是开放政府数据的具体载体,是公众获取政府数据的通道。开放政府数据门户网站建设以公共价值的实现与创造为目标,以开放政府数据政策为指导,充分体现开放政府数据政策的内容要素。

  从表4可见,门户网站提供了丰富的政府数据资源。联邦政府平台data.gov已提供了超过190000多个数据集。数据资源涵盖众多主题门类,如农业、商业等。所调查的三个州也都提供了广泛的数据资源。伊利诺斯州数据资源涵盖:健康、住房、劳动、医疗补助计划、市政当局、公共卫生等;纽约州数据资源涵盖经济发展、教育、能源和环境等;马里兰州数据资源涵盖行政、农业、生物区、预算、商业和经济等。

  由此可见,美国开放政府数据门户网站包含了丰富的数据资源,是公共数据资源的集散地,数据资源达到了一定的深度和广度,资源数量众多,主题多样,内容完整丰富,但又不涉及个人隐私、国家安全、商业机密等。门户网站提供的数据资源的内容范围符合联邦政府、州政府的政策要求。

  五、结语

  开放政府数据是全球各国都面临的一项新事物。开放政府数据范围问题是开放政府数据的难点和关键点,是开放政府数据制度建设和开放政府数据平台建设中的核心内容。开放政府数据范围确定与开放政府数据的风险规避及开放政府数据战略目标的实现密切相关。开放的范围越合理,则开放的可操作性及所带来的收益和价值可能会越高,反之可能越低。

  我国开放政府数据工作正在大力发展。开放政府数据政策法规的建设也才刚刚开始。在一个制度发展初期,确定开放政府数据范围,循序渐进推进开放政府数据工作,这是一个必然的选择。我国开放政府数据范围的规定可以借鉴参考美国经验,立足本国实际有所创新地制定相关政策法规,明确开放政府数据范围确定所遵循的原则和标准,厘清数据、信息、大数据、开放政府数据、政府信息公开等概念及其相互间关系,明确我国开放政府数据范围的应然状态,例外事项的确定原则和范围类型,在开放政府数据平台上提供丰富的可开放的政府数据资源供公众使用,从而推动我国开放政府数据向前发展

  作者:赵润娣,西北师范大学图书馆副研究员、甘肃省循环经济与可持续发展法治研究中心兼职专家,博士,兰州 730070
责任编辑:qinpeng