星标置顶林伯虎,有趣有料还靠谱
第332期  |  本期53词  |  累计14526词
怕太长你不听
▸ “信息审查”用英语怎么说?
▸ 离开中国的日子里,谷歌如何“懂”你我?
▸ 谷歌重返中国遇到了怎样的障碍?
今日晨读
00:48起词汇讲解  |  07:06起只听点评  |  13:42起原文朗读
Google China: Has search firm put Project Dragonfly on hold?
Google has reportedly "effectively ended" plans for a censored search engine in China.
The Intercept, which revealed the existence of Project Dragonfly in August, says Google has been "forced to shut down a data analysis system it was using" to feed the project.
原文:
https://www.bbc.com/news/technology-46604085
晨读及一词一句打卡,请点击菜单栏:每日晨读–万人打卡
332期微词卡
put sth. on hold
把……晾一边;延期
effectively
[ɪ'fektɪv(ə)li] adv. 实际上
intercept
[.ɪntə(r)'sept] v. 拦截
One Word, One World
今日重点词:

put sth. on hold
重点词造句练习:
他们把这个计划暂时搁置,直到他们有足够的钱来完成它。
(参考例句打卡后可见)
上期参考例句查看上期
A recent survey showed nearly 60% of interviewees were in favour of the plan.
扫码加入一词一句营,听免费活词造句讲解
总有一些词,分开讲没话题,但组成CP就是上头条的命。
就好比“炒股”遇到“赵薇”,“兄弟情”遇到“胡海泉”,“姜昆”遇到了“郭德纲”……
再比如:当“谷歌”遇到“中国”。
不久前,这家刚刚上了头条,原因是:即将重返中国。
仅仅几个月,谷歌再次因为中国而上头条,这次的理由是:这事要黄了。
这两天,不仅是外媒,我看到国内一些文章也在说:这次谷歌重返中国的计划眼看要黄。
但细究之下,事情不是你想象那样。

谷歌是不是回不到中国了?五分钟读下来,你会收获迄今最靠谱的答案。
1
甚至可以说:本周这条爆料,回答了萦绕在我心中许久的一个问题
离开了中国的谷歌,如何确保依然能“懂”中国网民?
先交代下背景:
搜索引擎的核心竞争力其实不只在于能搜到多少信息,更在于信息的排序。说白了:一个词条指向的结果可能是几十上百万个,那如何确保把最符合用户需求的搜索结果排在前面呢?
那最简单也最重要的一个方式:看用户怎么选。
说白了,就是让用户用他们的鼠标来投票。点开A链接的人越多,表明这个结果越符合用户的需求,那算法就相应地把这个结果的优先级往上提。
比如搜“特朗普”的用户,可能多数是搜CNN怼他的相关新闻,或是去到了介绍他的维基百科页面,或者是去围观他的推特……那这些多数派的选择就成为搜索结果页面上最重要的排序依据。
根据用户反馈来做结果排序——这个道理很常识,但有一个前提:你得有足够多的用户数据。
谷歌在中国就遇到这样的窘境。
毕竟身处墙外,所以它没办法像百度那样拥有海量中国人的搜索行为数据。那么问题来了:
长此以往,会不会使得谷歌的中文搜索结果,越来越脱离中国群众的需求?(就像百度家的英文搜索那样烂)
结果,看了这篇报道后我搞清楚了:在离开中国(准确讲是离开中国大陆)的这些年里,谷歌其实一直在用另一种方式追踪和研究中国用户的搜索偏好。
他们靠的是一家网站,叫做265.com。
这个网站听名字就有点low,没办法,人家是早期互联网创业的典型代表。
很多上点年纪的网民都有这样的印象(包括我爸妈现在上网依然保持这样的使用习惯),就是因为很多网址你记不住或者怕麻烦,所以就干脆就把浏览器主页设置成一个导航网站(就像这个265.com),打开后满满一屏全是各种网站(新华网人民网凤凰网……)你对着名字点点点就跳转过去了。
谷歌在2008年(也就是离开中国那一年)买下了这家网站。
是想借这家网站来赚钱吗?
现在看来,显然不是。
由于在中国,仍有大量网民使用这家网站,他们上来后怎么操作(点开哪些网站,页面驻留多久),对谷歌来说都是值得记录的数据。
更重要的,是谷歌特意在这家网站上内嵌了搜索框,这样用户不用再另外打开百度,直接在265.com页面上就可以输入关键词进行搜索。
谷歌颇有心机的一点:他们没有在内嵌框里使用谷歌引擎,而是使用百度
这样的做法,从用户体验来讲,和直接上百度搜索别无二致;但对谷歌而言,他们可以在这个过程中默默记住这些百度用户的数据。
这样一来,即便不在中国、即便大量中国用户没有使用谷歌的搜索引擎,但这家公司依然可以获取大量中国网民的搜索偏好数据
2
交代完这么长的背景,重点来了:
谷歌这次的重返中国计划,为什么会栽在这家导航网站上呢?
根据爆料媒体 The Intercept报道(今天音频里介绍了这家的背景,之前谷歌被爆启动重返中国的“飞龙计划”最早就是他家爆的料):
谷歌重启“飞龙计划”以后,为适应中国国情,特别需要搞清楚的一件事情就是:在中国互联网上,究竟哪些词算是敏感词?
这事办起来可能比各位想象的要难。我们的网管部门从来没有列出一个具体的清单,说这些词你不能讲,那些词你得给我禁掉……
正所谓法无明令禁止即……需要自己琢磨,谷歌琢磨这件事的方法就是调用265.com上面的数据,特别是拿这些用户在百度上的搜索结果跟谷歌自己做匹配:
同样的搜索行为,哪些结果在谷歌上能显示但在百度上是被屏蔽掉的?
通过这种比较谷歌就知道了:A不能讲、B要屏蔽掉……
这样的A、B、C,据说谷歌找到了几千个。
3
那你说,谷歌这种做法有什么问题吗?
至少在中国这头没问题——积极过滤负面词汇,这分明是积极向中方要求靠拢好吗?管你谷歌在全世界如何飞龙在天,到了中国你不还是强龙难压地头蛇?!(谷歌内部把重返中国的项目命名为“飞龙计划”)
但是谷歌没想到:这么艰难的与中国关系都搞定了,却后院起火
8月份,谷歌重返中国的秘密计划被曝光,随后,谷歌内部一个专门确保用户隐私不受侵犯的部门,发现了“飞龙计划”利用265.com网站窥探用户数据的做法。
然后隐私部门就怒了:
你们居然在搞这种默默收集用户信息的套路!关键,这既然涉及使用用户隐私,那你为什么不按规定向我报备!
这样一来,谷歌内部非常强势的隐私监管部门直接对“飞龙计划”亮了红牌。
也是因为这个原因(注意并不是由于谷歌跟中国政府又闹掰了)才使得谷歌重返中国的计划被内部叫停。
4
这个事情的来龙去脉给各位讲清楚了。
基于这样的事实接下来分析事态走向,我觉得也更加清晰。
第一,从政治层面看,基本事实是:这次谷歌重返中国遇阻,并不是由于和中国官方的政治分歧,而是出于谷歌自身的内控管理杯葛。这就意味着:(至少到目前为止)谷歌重返中国的政治基本面依然向好。
第二,从技术层面看,收集和使用用户数据只是为了优化它家的用户体验。既然这样做不对,那接下来:如果是程序的问题,就完善内部流程,把该走的隐私保护程序重走一遍;如果是做法整个不妥,那就永久关停这些个数据库,再想别的法子继续分析研究,这对谷歌来说也不算难事。
包括这篇BBC报道的文后分析也表示,“飞龙计划”的搁浅很可能只是一时,谷歌重返中国的决心依旧。
不过就在不久之前,Pichai,也就是谷歌老大,在接受国会质询时表示,目前他家还“没有计划重返中国”。
考虑到11月时还有数百名谷歌工程师就重返中国计划联名对高层提出过抗议,相信在谷歌内部,对于中国这块市场到底要不要进入、要不要早点进入,分歧仍在持续。
所以可以明确的是,短期内谷歌想要重返中国,从技术准备到内外部氛围似乎都不太乐见
但从长远来看,我相信这家搜索公司回到太平洋这头的希望依然很大。
就算一时看不到希望,或者说只是阉割后的归来,我想我们也有足够的信心笑面未来——毕竟,时代的脉搏、历史的规律、世界的大势,你我都懂。
你期待谷歌重返中国么?
欢迎留言
推荐阅读 | 谷歌2018全球热搜榜出炉
前十里面中国网友能认出一半
编辑 | Wenyu  校对 | 东奇   排版 | 丽莉剪辑 | Pzj
 - END - 
14天外刊精读
在下林伯虎
长按扫码加关注
★给林伯虎设星标,步骤如下★
更多精选文章,点下方
喜欢请点击右上角···分享 ↗
点击进入2019“虎课外刊精读”
继续阅读
阅读原文