GPT-3 泄露了我的真实姓名

(
机器学习算法与自然语言处理)社区是国内外知名自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。
转载自 | 夕小瑶的卖萌屋
If I had found my personal information on Google search results, or Facebook, I could ask the information to be removed, but GPT-3 seems to have no such support. [2]
对违法企业的罚金最高可达2000万欧元(约合1.5亿元人民币)或者其全球营业额的4%,以高者为准。 网站经营者必须事先向客户说明会自动记录客户的搜索和购物记录,并获得用户的同意,否则按“未告知记录用户行为”作违法处理。 企业不能再使用模糊、难以理解的语言,或冗长的隐私政策来从用户处获取数据使用许可。 明文规定了用户的“被遗忘权”,即用户个人可以要求责任方删除关于自己的数据记录。
提出了一种简单有效的从大模型中获取序列数据的方式; 探究了模型会造成隐私泄露的原因——过拟合( overfitting ); 量化地定义了大模型的“记忆力”( k-Edietic Memorization ); 探讨了如何避免泄露的几种方式。
[1] Feeling unproductive? Maybe you should stop overthinking, https://news.ycombinator.com/item?id=23893817
[2] Ask HN: GPT-3 reveals my full name - can I do anything?,https://news.ycombinator.com/item?id=31883373
[3] Extracting Training Data from Large Language Models, https://arxiv.org/abs/2012.07805
[4] Training data extraction from GPT-2, https://github.com/ftramer/LM_Memorization
扫描二维码添加小助手微信
关于我们
最新评论
推荐文章
作者最新文章
你可能感兴趣的文章
Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios) posted above belong to the User who shared or the third-party website which the User shared from. If you found your copyright have been infringed, please send a DMCA takedown notice to [email protected]. For more detail of the source, please click on the button "Read Original Post" below. For other communications, please send to [email protected].
版权声明:以上内容为用户推荐收藏至CareerEngine平台,其内容(含文字、图片、视频、音频等)及知识版权均属用户或用户转发自的第三方网站,如涉嫌侵权,请通知[email protected]进行信息删除。如需查看信息来源,请点击“查看原文”。如需洽谈其它事宜,请联系[email protected]。
版权声明:以上内容为用户推荐收藏至CareerEngine平台,其内容(含文字、图片、视频、音频等)及知识版权均属用户或用户转发自的第三方网站,如涉嫌侵权,请通知[email protected]进行信息删除。如需查看信息来源,请点击“查看原文”。如需洽谈其它事宜,请联系[email protected]。