前几天某位程序员网友发了一条推特内容:
我下午刚在京东搜 BOOX,刚刚就在朋友圈看到广告,只能说,微信输入法你一点都不冤。
不,不。这和微信输入法,乃至其他任何输入法,都没有什么关系。这不是输入法的锅。遗憾的是,社交网络上只要出现这类内容,下面的留言往往都有一大堆懒于思考的人附和,非常反智。
如果你没看明白他抱怨的是什么,我给你再翻译一下:这位网友去京东搜了 BOOX (文石)这个品牌,估计是要查看某款型号的价格,然后在朋友圈看到了 BOOX 的广告,他觉得二者之间有关联性,然后这个关联性的产生,他认为因为微信输入法泄露了信息给广告商。毫无疑问,他是微信输入法的用户。
我发现这是一种非常经典的误解,而且这种误解在中文网络上尤其多:在电商平台搜索了某个商品,随后就在其他平台看到了该商品的广告,甚至是竞争对手的平台上也有同样广告,这不是输入法泄露了我的宝贵隐私,是什么呢?
今天我们来学习一点广告行业的知识。
在互联网广告领域,这种方式叫做「行为定向广告」。对应的英文:
Behavioral Targeting Advertising.
这种方式也被行业内叫做重新营销广告」。对应的英文: 
Remarketing Advertising.
大家感兴趣的话,可以去根据关键词搜一下这个广告的机制,这是常见的互联网广告技术,并不是什么所谓高深的「黑科技」。如果你理解这一点,以后就不会总往阴谋论方向去靠了。
如果你不愿意自己通过搜索来了解,继续往下看。在基于浏览器访问的 Web 上,这种广告方式基本的逻辑是这样的:
  1. Cookie 追踪:当你在电商平台搜索产品时,该平台可能会在你的电脑或设备上存储一些小文件(称为 Cookies)。这些文件包含你的浏览信息,如搜索过的商品。
  2. 数据共享:电商平台可能与广告网络合作。当你搜索一个产品后,这个信息可能会被共享给广告网络。
  3. 广告网络:广告网络拥有跨越多个网站的广告位。当你访问其他网站时,广告网络会利用之前通过 Cookies 获得的信息,展示相关的广告给你。
  4. 重新营销:如果你在某个网站上看了某个产品但没有购买,该网站可能使用重新营销技术,通过广告网络在你浏览其他网站时再次向你展示该产品的广告,以提醒或诱导你完成购买。
考虑到读者的理解水平,到这个地方就算比较烧脑了。不过不要紧,但大家应该能推导出:如果我不让这些平台在我的电脑上存储 Cookies,是不是电商平台就不能这样给我显示广告了?
非常聪明,就是这样。不过,这还不算严谨。因为,有些更聪明的读者会提出质疑:我用的明明是手机里的应用程序啊,不是电脑的浏览器。你是说我的手机应用里也存着 Cookies 吗?
在移动互联网时代,基于移动设备访问应用,这个机制的确有所不同:
  1. 设备识别技术:移动设备上的广告技术通常使用设备识别符(如 IDFA在 iOS 设备上,和 Google 广告 ID 在 Android 设备上)来追踪用户行为,而不是依赖于传统的 Cookies。这些识别符允许广告商跟踪用户在不同应用中的行为,而不仅仅是在网页浏览中。
  2. 位置数据:移动设备的另一个关键特点是能够提供精确的地理位置数据。这允许广告商提供地理位置定向的广告,根据用户的实际位置展示相关的本地服务和商家广告。
  3. 应用内行为:用户在移动应用中的行为是另一重要数据来源。通过分析用户在应用内的活动,如购买历史、浏览习惯和交互模式,广告商可以更准确地推断用户的兴趣和需求。
  4. 跨设备追踪:随着技术的发展,广告商现在能够识别并追踪用户跨多个设备的行为模式,包括智能手机、平板电脑、笔记本电脑和智能家居设备。这种跨设备追踪有助于创建更全面的用户画像,从而提供更精准的广告。
  5. 个性化和实时投放:利用以上数据,广告商可以实时地对广告进行个性化定制并投放,以匹配用户当前的需求和兴趣。例如,一个用户可能在午餐时间附近搜索餐厅,广告系统可以利用这一信息,结合用户的地理位置和过往的餐饮偏好,展示附近推荐餐厅的广告。

无意冒犯,但这一段又可能对于一部分读者烧脑了。一下子出现了更多的术语。但实际上也没那么复杂,使用移动设备的用户,广告平台使用特定的设备识别符来对你做标记,注意,标记的是设备,一般而言,设备是指你手里的手机,而不是你具体是张三还是李四;也不管你是安迪还是山姆。这也是不少中文用户容易产生的误解。其实,广告平台并不关心你具体是谁。换句话说,如果你担心自己的隐私泄露了,但你担心的隐私数据,其实广告平台没有收集的必要。
我们用现在掌握的概念和流程简单解释一下文章开头的案例:用户在电商网站搜索了某个产品或品牌关键词,这时候平台至少会记录如下信息:你的 IDFA,以及对应的搜索关键词。注意,这只是最简的画像示例。要知道,电商平台里的搜索行为意味着强购买意愿,系统判断你的购买可能性比较大。然后这个信息会进入广告网络,后续,该品牌在广告网络里要买广告,他们要在朋友图投放广告,如果面向的是「对产品有强烈购买意向」的画像人群,该用户的画像符合,于是,广告对该用户以及其一组用户投放。该用户看到了广告,然后惊讶了。
显而易见,用户会说,为啥我的信息会进入到广告网络?为啥广告网络里会对应到是我呢?
到这个地方,我们就涉及到隐私问题了。
有些朋友可能会注意到,当你用浏览器访问一些国外的英文网站的时候,这些网站会弹出一个提示框,问你 Cookies 如何设置?
上图是一个比较典型的设置界面,访问新网站总出现,有时候让人还挺烦。这里如果你选择了定制,或是拒绝,那么,网站就不会通过 Cookies 机制来追踪你的使用习惯了。也就是说,用户自己有了选择权。
但老网民会想起来,哎,这东西在很久以前好像并没有的啊,你一说我才意识到,什么时候出现的呢?
这涉及到法律和法规问题。
我想,只要这几年关心互联网领域的人,多少都看到过这个缩写词:GDPR 。
General Data Protection Regulation,通用数据保护条例,是一部在 2018 年 5 月生效的欧洲数据保护法。GDPR 规定了用户享有隐私权,企业必须告知用户他们收集了多少数据以及收集数据的方式。
Cookies 的这个设置界面,就是 GDPR 实行之后所产生的具体影响。
其实 2018 年到今天也已经算很久了,这不都是老黄历了么?没错,法律法规的颁布和后续执行,其实影响是逐步体现。
这两年,欧盟没少对互联网大公司开出天价发单,有不少就跟这个 GDPR 有关。
然后是移动互联网领域,苹果依据《用户隐私和数据使用》规定 ,从 2021 年开始,应用程序开发商需要通过应用程序追踪透明度框架征得用户许可,然后才能跟踪用户或访问其设备的广告标识符。也就是说,如果用户不允许的话,电商平台虽然知道了你的设备的 IDFA,但其他开发商,对应不上你的设备了,你可以理解为,断了链路。
当时苹果强推新规,对于另外几家互联网依赖广告收入的巨头,也是吓出一身汗,比如 Meta、Google,都表示了反对。
如上图,如果你是 iOS 用户,可以进行这样的设置。安卓用户也有类似的机制 OAID。不过,据我所知,接受度不高。
有的用户立刻检查了一下自己的设定,发现已经不允许 App 请求跟踪了,怎么还是感觉被跟踪了呢?当然大多数时候只是幻觉,个别时候则另有原因。
其实,应用程序开发商,有很多办法依然可以获取你的设备 ID,有些时候,你不注意就着了道。
举个例子,你打开一些视频网站,会发现这些网站时不时的问你:我们有个测试版邀请你抢先使用,可以体验新特性哦。
你是不是觉得很受重视?还有这种好事儿,乐颠颠的点过去,发现,咦,名额满了(还好你没参与上)。
你说,一个使用量那么大的平台,为什么会隔三差五邀请你去使用测试版呢?总不会是你真的是高级用户吧?
因为 TestFlight 的测试用户,你的设备标志符(Device Identifier)是会被开发者获取的。苹果留了这个口子,其实是方便了开发者和开发商,而且,会觉得这里的测试用户比例很低,不会有什么影响。但可能没估计到,还是会有「聪明」(鸡贼)的开发商会钻空子,通过这个方式收集用户的设备信息。值得强调的是,这也只是我的一个猜测。
行文至此,有必要下个简单的结论:
在网络广告领域,其实没有太多的所谓的「黑科技」,现在网络上一些「传说」,比如很多人以为存在的什么细思极恐的「语音窃听」,其实都有具体的解释。不要掉进阴谋论的思维陷阱,「大公司总是变着法的想害我」,费劲心机窃听你的聊天就为了多卖你几条内裤?给你推荐你你都点过数次的外卖?疑心病发作的话,没得治,一惊一乍的,特别荒诞,成了一门玄学。
有些先入为主的网友难免还不死心:你敢保证输入法在这个过程中一点手脚都没做?
我真没有资格给你保证。不过,我们可以反推,如果输入法记录这个,广告效率是很低的。广告行业是严格看数据的,效率低哪怕一点点的方式,就会被淘汰。以我这篇文章为例,我输入了几千字,其中提到了不少产品,但输入法能筛选出来我有强烈购买意愿的词吗?太有难度了吧。
不要忘记前面我们强调的「行为」。举个例子,你和闺蜜在家里喝着咖啡聊起某个化妆品,第二天,打开手机,咦,怎么广告恰好就是这个品牌的化妆品?被窃听了?太恐怖了吧?你们只是闲聊的话,算不上什么特定行为,就好比你用输入法不停的敲字一样,但如果你闺蜜顺手在电商平台搜了一下化妆品有没有降价的话……遗憾的是,很多人就连自己前一天手机里搜了啥都记不得,更不要说考虑到其他人的行为的因素了。
微信输入法因为是一个全新的输入法,其实也没办法自证自己没有出售用户隐私,没办法对被害妄想症候群自证清白。这不是难为人呢么?但如果被证明出售隐私的办法也简单:那就是如果出售的话,不是个一锤子买卖,会是持续行为,早晚会被抓到。
如果你一直怀疑输入法,但这么多年全网也一直没有证据,那就只能是一个原因:没有。
即使是总被怀疑的搜狗输入法,其实我现在的结论也倾向于:没有。不排除在长期探索商业模式的过程中曾尝试过,但也会发现这其实是很低效的模式。
当然,我这个结论是很主观的,欢迎了解内情的朋友留言告知。
最后贡献一个小技巧:如果你在各个平台都看到某个广告,觉得有点审美疲劳的话,比如看到了太多的徕芬广告(产品其实不错),那你可以到电商平台里搜一下其他某个特定品牌的关键词。一般人儿我可不告诉他/她。

说明:本篇内容,因为提到一些公司名字,难免有人觉得是广告。但,京东、Boox、朋友圈、Apple、微信输入法、徕芬,到目前为止均没有给我为这篇打过钱。
最后,这篇文章因为是面向普通用户而写,尽量简化了不少细节,但本文难免会被广告领域的行家注意到,如果发现某个环节有误,敬请留言指出,在此提前感谢。但最好别因为一两处细节就否定整篇文章价值,那可是外行下结论的样子。
文章太长了,作为对自己的奖励,加一个广告吧,欢迎加入我开设的知识星球:
提升认知,交个朋友。
继续阅读
阅读原文