大数据已经深入到我们的生活中,很多企业利用社交媒体等各渠道数据来更全面地了解用户的行为和需求,用户也通过大数据来获得更加精准个性化的服务,比如从智能手表中获得自己的健康数据等。大数据相关产业正成为经济社会发展的重要引擎,但在这过程中,数据的应用与算法机制也带来了一些问题。
2022年7月31日,北京大学国家发展研究院“平台经济的创新与治理”课题组与国发院智库联合主办、国发院传播中心协办举行了第4期承泽论坛。论坛探讨了平台经济崛起带来的数据问题、当前技术发展带来的改变以及算法治理的相关措施。
数据问题有哪些?
算法嵌入到信息系统里,是人们产生恐惧的根源。由于这种不确定性,人们担心数字的安全性以及人权、隐私甚至财产的安全性。
数据已经成为中国发展数字经济的关键要素。近期,国家互联网信息办公室发布的《数字中国发展报告》显示,2017年至2021年之间,中国的数据产量位居世界第二,占全球数据产量近10%。当前,依据大数据和人工智能(AI/ML模型)的大规模决策正在深刻影响人们生活的方方面面。
人工智能、大数据技术的发展推动了平台经济的发展,互联网平台利用算法将数据加工成产品,为用户提供服务。平台企业使用算法连接众多利益相关者,比如外卖平台会连接餐饮企业、消费者、骑手;视频平台会连接创作者和用户……这其中,算法会起到特别关键的作用,但也带来了一系列数据与算法安全的问题。
北大国发院经济学长聘副教授张俊妮表示,此前有观点认为,由于技术中立,算法没有价值观,但设计算法的人有价值观,算法的实际效果体现了价值观,个人很难抵御算法推荐或决策,所以会导致算法歧视、信息茧房等现象的出现。因此,国际上围绕算法的可信度有很多争论,质疑平台基于算法给出的决定。
北大国发院教授、北大数字金融研究中心副主任沈艳针对算法歧视现象提到隐蔽的算法歧视不易被发觉,在来自算法的歧视和来自人的歧视之间,人们更生气的是来自人的歧视,所以当歧视存在时可能会故意归咎于算法。在中国,算法歧视中最需要关注的是“大数据杀熟”的问题。
在北大法学院法学教授杨明看来,现在社会运行更多靠系统发挥作用,平台所塑造的信息生态系统已经深深地嵌入人类社会生活,而该系统的信息匹配效率决定了平台的控制力大小,当前更多是平台对人的控制。所以,算法嵌入到信息系统里,是人们产生恐惧的根源。由于这种不确定性,人们担心数字的安全性以及人权、隐私甚至财产的安全性。数据安全的威胁呈现频率高、多元化、规模化特点,数据安全关系到个人、组织乃至整个社会和国家的安全。
杨明还指出,算法时代要解决的核心问题之一是信息过载问题,即如何在海量数据中拿到有用信息。因为在此过程中可能会产生法律风险。算法同时还引发社会结构改变,包括重构人与物的交互关系,这既可能提高交互概率,也可能存在有意隔离。
“依赖数字技术的大数据管理体系,给国家治理也带来了潜在的挑战。”北大国发院政治经济学长聘副教授席天扬提出了四点见解:一是权责的不对等。公共部门通过大数据战略不断获取个人信息,但在数字技术下,无法弄清楚决定者是谁,更无法知道由谁负责;二是纠错的成本较高。以个体力量去纠正一种系统性的偏差很难;三是数字化的鸿沟。未来的公共治理要警惕在公共服务上数字技术变成新时代的种姓制度;四是系统的稳健性。当几乎所有公共服务的载体独一无二地依赖于大数据和数字技术时,一旦发生技术和非技术原因造成的系统问题,会对国家安全和社会稳定性产生重要影响。
算法治理已迫在眉睫
算法之所以成为平台治理的一个核心抓手,主要在于它作为生产工具能决定数据的匹配、计算、流通等。
席天扬认为,当前人们处在一个巨大的历史性的技术变革当中,这种技术变革会使国家治理方式发生根本性转变。数据监测显示,自2000年以来,基于大数据或数字技术的国家治理热度持续走高。从政治经济学角度来讲,这一现象本质上是国家治理从人格化的管理体系转变为非人格化的管理体系,从依靠人的治理转变为依靠数据的治理。
这种转变带来的好处很多,比如精准扶贫,所有家庭的收入信息如果能够被政府在管理当中获得,就能够精准地按照大数据来建档立卡;再如健康码的应用,在现行的防疫大目标下,健康码是一个能够以相对较低的成本去促进陌生群体之间的信任,维持社会正常运行的机制。
杨明指出,随着国家治理方式的转变,社会治理变得平台化。传统架构的社会治理体系是以“国家权力是保护个人权利的最有效的工具”为构筑基础的,其特征为功能主导、高度专业化、决策权力分散、科层式传递、有限的横向联系。信息技术的飞速发展导致公共职能与市场机制之间的关系发生根本性变化,简言之,即私人领域与公共领域之间界限的模糊化,这使得科层式、功能导向的治理结构越来越丧失效率优势。数字化转型有利于社会治理架构去中心化和扁平化的发展,数据的集中使得诸多公共事务能够集成到一个平台上来,从而使得不同利益相关者能够参与决策、共同制定问题的解决方案,即所谓社会治理的平台化。
在这个背景下,为什么算法治理越来越重要?中国政法大学数据法治研究院教授兼博导张凌寒表示,算法之所以成为平台治理的一个核心抓手,主要在于它作为生产工具能决定数据的匹配、计算、流通等。
基于算法的上述功能,平台同时扮演三重角色:一是数据生产要素的提炼和加工者。数据生产要素被平台利用算法的收集、研磨、精炼,加工成产品。在数据生产领域,此前很少有法律对其进行规范,使得数字平台经济野蛮生长。如果从社会生产的角度来观察,数据这种生产要素对于用户和平台的“价值错位”,使其对个人信息的收集和加工不仅形成一种隐忍的侵犯,更形成一种社会生产的控制模式。不论是公共服务还是商业服务者,都逐渐按照平台的模式,向不特定人开放介入,动态地收集数据进行分析和匹配。
二是数字经济交易的多边市场。多边市场资源的匹配也离不开算法,比如网约车平台要实现车辆、司机、乘客的匹配,要实现路线的规划以及定价,都是由算法来完成的。
三是数字经济的基础设施。平台企业为社会提供统一的交易基础服务,即广泛分布的计算结构。从硬件上包括了硬件终端、操作系统、应用程序App;从软件上提供了行业标准、基础通信设施、金融机构(如支付宝)、交易所等。平台因提供基础服务享有更大的竞争优势。
平台认为自己的生产要素是数据,是通过与用户的交互中免费得来的,会强调这些数据并没有太大的价值,但是在其争取投资时会将“日活用户多少亿”作为争取资本的重要指标。值得注意的是,为了规避强监管,平台会在三个角色中来回转换,因此,算法成为全球政府监管的重点之一。
算法审计、优化目标、加强监管多措并举
平台治理必须内部自治与外部规制两方面进行。从自治角度讲,平台应通过采取一些技术措施对数据安全和隐私进行保护;从监管方面来讲,监管平台要有强制规则。
2020年以来,我国密集出台了一系列平台监管新规,2021年9月,国务院九部委发布了《关于加强互联网信息服务算法综合治理的指导意见》,要求利用3年左右时间,建立一个以算法安全作为基本价值目标的算法监管体系。
2022年3月1日,《互联网信息服务算法推荐管理规定》施行,提出“算法备案”的新方案。以《互联网信息服务算法推荐管理规定》为标志,我国开创性构建了一系列具有鲜明中国本土特色的平台算法监管新规。
2022年4月8日,国家互联网信息办公室开展“清朗·2022年算法综合治理”专项行动,推出五项任务:组织自查自纠、开展现场检查、督促算法备案、压实主体责任、限期问题整改。
针对算法歧视问题,沈艳认为要推动算法审计,从内外部审计来看,平台内部审计更为重要。从路径来讲,平台要重视对输入输出和对结果的评估。内容上可以预测和优化目标、数据说明、算法技术及使用原因和算法运行效果、个人信息保护和数据安全的具体安排。评估是从歧视程度、有效性、透明度、直接影响、安全可获得性等内外部几个尺度来进行。
解决数据安全问题需要用到隐私计算。隐私计算是在确保数据安全的前提下实现数据价值流通、推动各平台互联互通和开放的基础。隐私计算涉及的不只是技术(现在很多讨论是基于受保护计算的环境、去标识化与脱敏技术、拟态计算等技术),还要有相应的制度建设。相关企业内部机制流程设计、合规安排以及外部监管配套措施等制度建设亟待推进。需要注意的是,要侧重以技术发展而不是以行政手段来解决问题。
沈艳指出,平台治理的大方向是在保护消费者和其他数据主体权益的基础上,促进创新、保持国际竞争力,主要监管原则是加强平台两端信息透明、减少信息不对称。调动平台自治、尝试数据治理沙箱等创新实践也尤为重要。还要发挥行业自律作用,多措并举,建立一个立体的治理格局。
张俊妮从“算法向善”角度对算法歧视、信息茧房等问题提出解决办法。她认为,算法优化目标是平台企业如何权衡自己与各利益相关者的关键。以YouTube为例,2005年至2010年,YouTube的目标是浏览量和点击量,导致了“标题党”的出现。2012年改成观看视频的时长,但是观看时长并不等于用户真正享受这些视频。2016年又考虑到用户满意度,用户是不是愿意分享视频等。后来,又有新的问题出现,有研究发现,在美国、法国、英国选举、全球变暖、大规模枪击事件期间,YouTube推荐的内容中系统地放大了分裂、耸人听闻和阴谋论的视频。后来,YouTube推出整改措施,试图减少推荐边缘内容和有害内容。
2019年底,YouTube将美国人通过推荐观看或者误导内容的平均时间减少了70%。2021年将边缘或误导内容的消费量降到1%以下。自2018年以来,其收入由2018年的100多亿美元增长到2021年的接近300亿美元。可见,平台在产生社会效益的同时也带来了经济效益。
平台的算法优化目标,不应该只着眼于怎么样把用户绑在平台上,应该从更深层次去满足客户的核心需求。作为平台企业,应该追求被更多人需要,被更多人深度需要,被更多人持续需要,当上述情况实现后,自然会产生经济效益。
针对大数据管理体系给国家治理带来的挑战,席天扬提出了三点建议:一是数据采集需要企业和政府两重“防火墙”;二是公共治理导入私人数据不应该成为默认权力;三是政府部门也需要数据或算法审计,比如,数据以何种方式存储在云端或政府的体系里,又是如何使用的,算法逻辑应该透明,对后果应该有问责,应该对公众的重大安全关切进行回应。
杨明认为,平台治理必须内部自治与外部规制两方面进行。从自治角度讲,平台应通过采取一些技术措施对数据安全和隐私进行保护;从监管方面来讲,监管平台要有强制规则,比如信息管理能力与法律规定的注意义务相匹配,利用算法备案与算法审计机制来扩大司法审查的可能性。
继续阅读
阅读原文