【编者按】在美国联邦政府任职30多年的资深统计专家胡善庆博士对2020人口普查增加公民身份问题进行了深度分析,如果你对此也有看法,请到政府征集意见的网站(https://www.regulations.gov/comment?D=USBC-2018-0005-0001)去反馈,这里有一个意见信的样本(bit.ly/SpeakOut2Census)供参考。本文仅代表作者观点,不代表APAPA Ohio及OCAA官方立场。
The 2020 Census: From the Citizenship Question to Data Privacy
原作:胡善庆博
翻译:刘岩
2020年4月1日是下一个人口普查日。
然而,2020年人口普查的方案目前依然充满了很多不确定因素,跟普查局3月29日宣布增加公民身份问题,并使用行政数据用来补充的时候一样[1]。当时的决定是由商务部部长威尔伯·罗斯拍板的。
美国众议院至今就2020人口普查举行了至少6次公开和闭门听证会。但它们在公民问题的背景理由方面只取得了有限的成果。
自3月以来,至少有7起诉讼被提上法庭。其中6个案例挑战罗斯部长的公民问题决定,只有1个支持。6月8日,美国司法部发布了1332页的背景资料,以回应其中一项诉讼。7月23日,司法部公布了另外2400页的背景资料。在未来几周内,对于此取证程序,预计还会有更多内容发布。
这篇博文是更新我在4月2日发表的关于2020年人口普查的文章,增加了最近四个月里的最新信息。下面的图表列出了自2017年以来,关于公民身份问题和2020年人口普查的已知重大事件。
这篇博文也将讨论使用行政记录相关的数据质量和数据隐私问题,这个议题在目前很多的讨论中被忽视了。然而,它会对人口普查局未来数据的收集和使用产生深远的影响。
尤其是,即使公民身份问题从2020人口普查中删除,获取公民身份的行政记录已经开始启动。普查局的文件显示,它计划将这些行政数据与人口普查数据链接和合并,并将其从研究阶段提升到生产程序。这显然是在没有遵循规程和公众监督的情况下仓促行事。国会和诉讼似乎都没有处理这个问题。
随着下一次人口普查日临近,除非在实施之前被自行撤回,罗斯部长的决定只能由国会或联邦法院推翻。
2020人口普查的最新情
1. 公民问题的理由根
在3月26日的备忘录中,罗斯部长声称他的决定是经过“包括法律、程序和政策考虑在内的全面评估之后,”才批准司法部更有效地执行《投票权法案》的要求。在他的备忘录之前,他还在3月22日的国会听证会上作证说是司法部提出这一要求。
这一理由立即在国会两党、州和地方政府、前官员和公众中受到怀疑。许多人质疑这一决定的合理性和完备性。部分怀疑公民问题有政治动机来压制移民社区的参与,并改变政治力量的平衡。
5月8日,众议院监督和政府改革委员会举行了一场关于2020人口普查进展的听证会。一名司法部官员没有按照预定计划出席,促使该委员会发出传票,并于5月18日召开另一场听证会,但他托词诉讼在进行,没有披露任何新的信息。
6月8日,司法部发布了1332页的记录信息,其中包括内部备忘录、电子邮件和其他文件,以回应目前正在进行的7项诉讼中的一项。其中包括一份2017年7月14日的电邮[7,第775页],堪萨斯州的国务卿说:“在即将到来的2020人口普查中,增加一个简单的问题是必要的。”接着描述了这个公民身份的问题。电邮中提到这是一名白宫官员的指示。
6月21日,罗斯部长发表了一份补充备忘录,承认他在2017年2月被任命为商务部长后不久就开始考虑公民身份问题。
7月3日,主审法官评论说,罗斯部长的理由根据“缺乏诚意”和“潜在做假”。批准诉讼可以继续进行。
华盛顿邮报在7月19日的社论中,呼吁罗斯部长从2020人口普查中撤回公民身份问题[11]。
7月23日,司法部又发布了2400页的记录信息 [12]。在一封2017年5月2日的电邮中,罗斯部长问他的工作人员:“我很困惑,为什么没有采取任何措施来回应我几个月前提出的公民问题的要求。为什么没有?”
根据[14],普查局的代理局长2018年2月的一封电邮中,似乎在积极推动公民身份问题。他在邮件中写道:“我们正试图找到一个能对提案给予专业支持的人士,相比之下,我们找到许多反对该提案的专业人士。”
随着诉讼和《信息自由法案》的要求,预计将在未来几周内会有更多的记录和文件公布。
2. 关于公民身份问题的诉讼
自2018年3月以来,至少已经有7起对公民身份问题提出起诉 [8、15、16、17、18、19,20]。
6起诉讼反对增加公民身份的问题。原告包括州和地方政府、民权和社区组织,以及关心的公民。他们的主要论点包括:抑制人口普查的回报率,增加成本,降低人口普查数据的质量,违反宪法规定,和不符合现行法律和惯例。
实际上,原告声称罗斯部长的决定是出于歧视性的敌意,其实施将产生歧视性的效果。这些诉讼并不是关于他是否有权力提出公民身份问题。
支持公民身份问题的唯一例外是阿拉巴马州和阿拉巴马州的一位国会议员[18]。
众议院宪法和民事司法小组委员会在6月8日举行了听证会[21],阿拉巴马州的司法部长在证词中说,“之前的人口普查中,普查局没有将非法移民排除在每个州的人口数量之外”。他宣称,在每个州的总人口中包括“非法移民”,并允许根据该人口的数量来分配一个国会选区,违反现行法律。由此,他声称由于阿拉巴马州“非法移民”人口众多,将会失去一个国会席位。
一位前普查局局长也在6月8日同一场听证会上作证。他重申了在2018年1月与另外五名民主党和共和党政府任职的前局长表示的担忧 [23]。具体地说,就是在十年规划过程的最后阶段,加上一个未经实地考验的公民身份问题,将使所有社区的人口普查的准确性和成功受到严重威胁。
最高法院曾在2016年一致裁定,划定选区必须以一个地方的总人口数为基础,驳回了将选区划分为有资格投票人数的申辩 [24]。
3. 使用行政数据
司法部发布的信息,对罗斯部长关于使用行政数据的决定,提供了部分见解。
根据一份2018年1月29日的内部备忘录 [7,第1277页],普查局最初考虑三种选择,以回应司法部提出的公民身份问题的要求。它建议(A)数据的收集不做任何改变,或(C)使用含有公民身份的行政记录,但不在2020人口普查增加公民问题。第三种选择(B)在2020年的人口普查中加入公民身份问题被认为“非常昂贵,损害人口普查的质量,并且普查收集的公民身份数据会比行政来源更不准确。”
社会保障局[24]和税务局的数据被认为是包含有公民身份、可以运用的行政记录来源。
随后,一个选项(D)浮出水面,该选项将使用包含公民身份的行政记录,并在2020人口普查中增加公民身份问题。罗斯部长在最后的决定中选择了选项(D)。
因为它包含在两个选项(C)和(D),在这个过程中,使用公民身份的行政记录变得不可避免。
普查局预见将行政记录从研究状态提升到生产程序 [7,第1283页]。在这种情况下,行政记录将比在2020人口普查添加公民问题产生更深远、更持久的影响。
根据一份2018年3月19日的报告草稿 [7,第672页],普查局正在向移民局讨取美国公民入籍数据,以及国务院的签证和护照数据,以填补扩充社保数字身份档案。与此同时,普查局与社保局的协议将于今年到期。协议的续签必须经过新的谈判和协商。普查局目前没有根据法律规定接收或使用移民局或国务院数据的协议。
在评估选择以供罗斯部长决定的时候,普查局只是假设[7,第1283页]在2020人口普查生产周期中,“这些数据链接系统和相关的行政数据都已具备可用。”但直到目前为止,还没有一项条件到位。
4. 数据安全
2020人口普查将前所未有地依赖科技技术。历史上第一次,个人将能够在网上完成普查表格。2020人口普查将花费大约50亿美元于科技技术。
政府问责办公室在2017年2月将2020人口普查列为高风险项目,其中一个原因是关键信息技术(IT)的不确定性 [25]。众议院拨款委员会于2018年4月18日举行普查局预算听证会 [26]。两名政府问责办公室高级官员在听证会上重申,普查局在实施和保障IT系统方面将面临挑战[27]。
2018年7月16日,11名IT安全专家联名致信商务部长和普查局代理局长[28]。信中提到,普查局缺乏关于“如何实施最基本的网络安全措施”的细节,并敦促提高透明度和领导能力,以保证新的数字系统的安全与保障。一份对2020人口普查广泛科技风险的报导可见于[29]。
5. 查局局长的提
自2017年6月以来,普查局局长职位一直空缺。2018年7月18日,白宫提名史蒂芬·迪林厄姆担任普查局局长,任期为5年职位期限的剩余时间,于2021年12月31日到期[30]。迪林厄姆博士此前曾担任司法统计局局长和交通统计局局长[31]。
数据质量、隐私和相关问题
Facebook创始人马克·扎克伯格曾于2018年4月10日至11日在国会作证[32,33]。在为期两天的听证会上,近百名议员对Facebook的社交媒体隐私、数据使用和滥用问题提出了大约600个问题。其中,许多问题与2020人口普查和使用行政数据有雷同之处。
本节将讨论几个选定的议题,主要是关于社交媒体数据和政府数据相关的质量和隐私问题。
社交数据包括Facebook收集和处理的数据;政府数据包括普查、调查和行政记录。社交媒体数据与政府数据有一个主要的区别。社交媒体数据是用户自愿提供的,并在他们使用服务时所获取,而政府数据的收集通常需要遵循法律和法规的要求。
4月针对Facebook的国会听证会是在其成立14年后举行。这是Facebook不当提供数以千万计用户的数据引起的,而这些数据对2016年的总统选举产生了不可估量的影响。
在这方面,无论会添加公民身份问题与否,在2020年人口普查实施之前去考虑和评估整合行政数据所带来的潜在后果是迫切的。
A.数据
千年之交也可以被描述为大数据时代的开端。
Facebook是最大的社交媒体网络,于2004年推出。据最新统计,世界上有超过22亿的Facebook用户。用户在注册Facebook账户时提供个人数据。当他们使用Facebook服务时[34],他们的位置、关系、社交行为和其他可以想到的在线活动的附加数据被获取。
Facebook和社交媒体收集和产生的数据量是巨大的,而且可能是无限的。它们被进一步链接和处理,以促进广告收入,出售给感兴趣的公司,或与战略合作伙伴分享开发应用程序。
社交媒体数据既缺少管理其使用的法规,亦几乎没有什么普遍接受的质量指标。在更专业的层面上,新兴的研究表明,大量的数据本身并不总是能提供足够支持来进行统计推论。有趣的是,2016年的总统选举被用作一个实际例子。作者总结道:“如果不考虑数据质量,那么大数据的推论就会面对一个大数据悖论:数据越多,我们就越能欺骗自己。”
政府数据收集的历史相对较长。第一次对全国人口进行统计的普查是在1790年进行的。第一次基于概率抽样的全国性调查是在20世纪40年代建立,以产生更及时的失业统计数据。为收集普查和调查数据以及报告官方政府统计,基本数据质量标准相对早被制定。
行政数据也在同时被历史性的收集整理,以用于各种非统计行政项目。例如,在1935年《社会保障法案》签署成为法律后,最初收集的数据仅用于追踪美国受薪人士的收入记录,确定社会保障福利和计算福利水平[36]。
随着技术的进步,政府统计系统的创新愿景应运而生[37、38]。在概念上,将诸如普查和行政管理数据等多个数据源结合起来,应该可以创建一个“更好”的系统。可在实践中,由于许多技术和非技术原因,这非常不确定。
在十年一次的人口普查中,使用有限的行政记录可以追溯到20世纪70年代。今天,普查局已经开发并维护了一个数字身份系统,建立了唯一的个人标识制度,应用于联邦、商业、普查和调查个人数据,以促成数据档案之间的链接[39]。
事实上,普查局在2020人口普查的设计中亦已确定了使用行政记录和商业数据的方法,但范围限于邮政局和地址的数据,目的止于改善和提高回报率的运营用途。
在2017年2月,政府问责办公室将2020人口普查列入高风险项目名单,原因之一是针对使用行政记录的困难。“尽管普查局无法控制其他机构提供的数据准确性,但必须负责确保2020年人口普查所使用的数据达到足够的质量,”2018年4月的政府问责办公室报告称[26]。
在罗斯部长做出决定之前,政府问责办公室于2017年7月发布了一份报告,名为《2020年人口普查:普查局正在采取措施解决行政记录的限制》[41]。根据这份报告,普查局保证,“只有在研究表明数据最准确的情况下,才会使用行政记录数据”。此外,在使用任何行政数据支持普查操作之前,“普查局对每个数据源有一个质量保证流程,包括检查基础数据的完整性,以及主题专家对数据的适用范围的评估。”
上图是由政府问责办公室创制,目的是展示据称普查局实施的数据质量保证流程。
由于移民局和国务院关于公民身份的数据没有到位,普查局实际上尚未通过其质量保证过程,不可能升格到生产程序,更不用提任何公众监督了。目前还不清楚,社保数字身份档案有否通过为实施2020人口普查公民问题的同样程序。
在3月的决策备忘录中,罗斯部长指示普查局“使用剩下的两年时间,直到2020年的人口普查,进一步加强行政记录数据库、协议和统计模型,以提供更完整、更准确的数据。”这是一项艰巨的任务。
B.数据
在4月的国会听证会上,一个尴尬的时刻发生在扎克伯格被要求透露他在哪家酒店住[42]的时候。他停顿了一下,终于紧张的笑声中回答了“不”。
这一点已有效的说明:个人在美国拥有隐私权,即使它可能不是可识别个人的信息[43]。一般来说,个人的信息,比如Facebook收集或加工的个人数据,在用户不知情的情况下,可以在多大程度上被分享或出售?用户是否有权利保护自己的数据隐私?当用户数据被误用或滥用时,会有什么后果?
扎克伯格为Facebook处理用户数据道歉,尽管目前还不清楚Facebook是否真的违反了美国的任何法律或法规。在国会听证会之后,Facebook改变了隐私政策和设置[44],遵守《通用数据保护条例》(GDPR, General Data Protection Regulation)。这是欧洲最新的数据隐私法,2018年5月25日生效[45]。
在协调欧洲数据隐私法的诸多变化中,GDPR扩大了欧盟范围之外的管辖权。如果有违反规定,将处以严厉的惩罚。同时要以清楚简易的语言,在使用消费者的个人数据之前,询问是否同意,並允许改变主意。
目前在美国没有相似的GDPR法律。参议院于2018年4月10日提出一项名为《CONSENT法案》的提案,也被称为《隐私权法案》[46]。然而,GDPR和《隐私权法案》主要涵盖互联网服务提供商和在线企业,而不是政府本身。
普查局的授权和运作由美国法典第13条规定[47],该法典于1954年首次被编辑发布成文。它包括自1790年以来一直在演变的保密和隐私条款的法律要求[48、49]。
一般来说,“保密”是指提供的个人信息,如填写人口普查表,不能在未经明确同意的情况下泄露给第三方。“隐私”指的是不干涉个人事务和个人信息的自由[50]。普查局专著[48]指出,保密在很大程度上是数据传播问题,包含于隐私之中,而隐私主要是一个数据收集问题。
时至今日,普查局在网上发布关于数据保护和隐私政策及实施的信息[51]。5月7日,普查局代理局长在一篇博文中表态,“绝对承诺”保密,以回应罗斯部长决定所引发的质疑[52]。在博文中明显失缺的,是关于公民身份的行政数据收集,以及将其应用到生产时的数据隐私问题。
美国有关政府数据隐私的法律扎根于1974年的《隐私法案》[53]。一般来说,《隐私法案》提供了一套公平信息规范,管理联邦政府收集的个人可识别信息,包括限制联邦机构之间个人数据的共享。
自1970年代以来,在所有白宫保护隐私方面的指导意见中[54],2000年有一项[55]要求联邦机构进行计算机跨机构链接个人数据,必须审查并满足《隐私法案》的条件需求,包括计算机链接协议,並要通过联邦登记公告将提议的链接通知公众。
在3月份的决策备忘录中,罗斯部长指令普查局“把人口普查结果与行政记录链接”。普查局的内部文件显示,数据链接将有助于更替或以模型填补失缺的普查信息。这两种途径都会引起对数据源或使用方法的担忧,但所有细节都尚未公诸之于世。
目前还不清楚这些计划是否正如罗斯部长所说,符合的所有的法律、流程和政策要求。然而,提出这些Facebook用户已经体验过的数据隐私问题应是恰当的:
  • 透明。美国人是否有权知道并同意政府使用他们的个人数据,超出收集数据的原意范围?
  • 监督。普查局基于统计目的而使用联邦机构的行政数据是否有上限?国会和公众将在其中扮演哪些角色?
  • 问责。谁可以依法执行数据隐私限制?当数据被误用或滥用时,会有什么后果?谁来負担责任?
总结
罗斯部长在2020人口普查中做了两项决定。第一是增添公民身份问题。第二是提高行政记录的使用。
国会将继续举行听证会,法律上的挑战也已开始,最终会确定公民身份问题是否会被确定或被推翻。
收集移民局和国务院的行政数据的行动已经开始,一方面補充社会保障身份数据,另一方面准备链接人口普查记录。无论公民问题会否在在2020年的人口普查中出现,普查局都将着手获取和整合行政记录,并将其加入到工作程序。这个决定在持续的讨论中,虽然无声无息,但它对数据质量和数据隐私方面将会产生深远及长期的影响。
责声
本文中所表达的意见仅为个人观点,不反映任何组织或美国政府机构的官方立场或政策。
参考文献
请查看英文原文(可直接按文末“阅读原文”链接进入) https://www.linkedin.com/pulse/2020-census-from-citizenship-question-data-privacy-jeremy-wu/
【近期文章】
关于APAPA Ohio 公众
APAPA Ohio公众号是APAPA Ohio在俄亥俄华人协会(OCAA)的支持下办的公众号,旨在为俄亥俄的亚裔群体、尤其是华人群体提供一个分享、交流、互助的平台,宣传APAPA Ohio OCAA和其他亚裔团体的活动,促进亚裔社区对美国社会、政治、文化、教育、法律等的了解。APAPA的全名是Asian Pacific Islander American Public Affairs Association (美国亚太联盟),是在美国联邦政府注册的501(c)(3)非营利组织,网址:OhioCAA.org
继续阅读
阅读原文