讲座回顾
3月27日晚,统计之都“数据科学云讲堂”系列讲座第三讲举行。本次讲座采取在线会议的方式,邀请弗吉尼亚理工大学电子与计算机工程系的助理教授贾若溪作题为“机器学习中的数据定价”的报告,讲座由统计之都编辑部向悦主持,讲座回顾由孔令仁整理。
贾老师于 2020 年加入弗吉尼亚理工大学担任电子与计算机工程系的助理教授。此前,她2013年本科毕业于北京大学,2018 年博士毕业于加州大学伯克利分校。贾老师的研究兴趣广泛,涉及机器学习、安全、隐私等方向,最近的研究重点是为数据市场建立算法和理论基础,以及开发值得信赖的机器学习方法。于2017 年入选EECS的rising star,她的科研成果曾被多家媒体报道。
点击阅读原文可获取本次讲座的课件,提取码【COSX】,视频录播请在B站搜索“统计之都”,或通过小程序打开:点击此处链接
内容概要
贾若溪老师首先介绍了自己所在实验室REDS(Responsible Data Science Lab)的研究领域,即数据市场研究、对抗机器学习和隐私保护。而后对本次讲座的主题--数据市场中的定价进行了背景介绍。她指出,好的数据定价能够为一些政策上的制定提供指导,例如像Google Facebook这些大公司,这些从人们数据获利的大公司,到底应该要用多少钱来做补偿;此外当前的数据定价不能反映真正的数据质量,现在数据定价的机制都非常的简单,基于一种订阅制度,按照query付费。
在对于数据估价背景进行讲解描述后,她针对上述需求性质给出Shapley value作为评估准则的方案,与Leave-One-Out error进行了比较。之后,针对Shapley value的计算难题,给出了基于蒙特卡洛的近似求解方案。同时,当数据被用做特定学习器时,可以利用学习器的结构性质对Shapley计算速度进行大幅提高,并以KNN学习器为例,对这个方法进行了讲解演示
最后,在提问交流环节,在线观众积极参与讨论,贾若溪耐心解答了同学们的疑问。
统计之都(Capital of Statistics,简称 COS)成立于 2006 年,是一个旨在推广与应用统计学、数据科学知识的公益性网站和社区。
统计之都以专业、人本、正直、团结的理念尝试推动统计和数据科学在中国的发展,促进各行业的创新和繁荣。
统计之都的数据科学云讲座是由统计之都发起,由全球志愿者共同组织的开放性公益活动。
如果您愿意奉献自己的力量(组织、宣传、编辑、翻译、剪辑等),欢迎关注微信公众号后发送"志愿者"、"云讲座"按指引进一步沟通!
继续阅读
阅读原文