真正的区别不是雪景小黄图,是删除它们。 “如果Google返回中国,非常有信心再赢一次。”这句话会被入选2018年十大最具争议的话题吗?很有可能。近日,李彦宏说的这句话,在互联网上引起了轩然大波。 一个流传较广的方式是,对比百度和谷歌同一关键词的图片搜索结果。选定关键词诸如“雪白”、“嫩滑”等。根据网友晒出的截图,多数情况下,百度搜索结果中排名靠前的多是“小黄图”:穿着清凉的比基尼美女图片,而谷歌的更多为雪景、美食图片。 如此的“反差”,被很多人截图并分享到社交媒体,评论多偏向嘲讽:“接地气、反映了百度的内容特色、这就是百度的价值观。亦有人解释背后的排序、算法原理,不过基本被淹没在起哄的狂欢中。为方便讨论,以下简称此事为“雪景小黄图事件”。 百度并未对此公开回应,但快速对搜索结果进行了人工干预:8月9日,时间财经根据不同关键词测试,已无法完全复现网友截图中呈现的结果。 雪景小黄图事件的真相可能令起哄者觉得无聊或尴尬:搜索结果反映用户喜好,也就是大家爱看。 山寨发布会创始人阳淼告诉时间财经,搜索结果不同背后体现的“与其说是技术差异,不如说是用户差异”。天奇阿米巴基金合伙人魏武挥表示,考虑到谷歌的国内用户相对较少,搜索结果的不同说明“大陆用户恐怕喜欢女性照片多于雪景照片”。 魏武挥认为,百度和谷歌的有差异的地方主要在对人工干预的态度上,谷歌是拒绝人工干预的,百度是可以进行干预的,“比如昨天这些对比出来后,百度就干预了排序结果”。 “小黄图”原因在用户差异 2010年谷歌退出中国以后,百度在搜索领域基本没有对手的情况下“乐不思蜀”:好处是股价翻了几番、李彦宏数钱到手软,坏处是竞价排名成众矢之的、百度其他业务几乎一无所获。 以贴吧事件、魏则西事件等为标志,百度是在商业模式和价值观上被质疑最多的互联网公司之一。甚至连百度前CTO俞军说过:“你们怀念我,我怀念 Google。如果外部压力不够,我回百度也是独木难支。百度的核心问题首先是价值观,然后是激励机制。” 稍微了解下搜索引擎对搜索结果的排序原理,即会明白雪景小黄图现象背后是用户差异,与价值观或者技术实力关系不大。 魏武挥简单解释了搜索搜索结果排序原理:“算法并不知道一个雪景和一个女性照片到底有什么差别,它只知道什么样的图片被点击得多、什么样图片所在的网站的权重高”。最后的结果就是,被点击更多的图片就会出现在最前面。 股票社区雪球网上的一位百度投资者更进一步推测了雪景小黄图出现的原因:“‘雪白’这个只要认识字就懂的词语,没人去搜索,而很多男人会用雪白肌肤,雪白大腿去搜索,于是百度大数据很好的体现‘雪白’的搜索偏好”。 谷歌中国的搜索结果页之所以未出现类似百度的结果,也非技术或者价值观的差异。2010年退出中国以后,谷歌用户中使用中文搜索者相对较少,“少到这部分用户的喜好对搜索结果权重排序不能产生影响。”一位业内人士分析。 用谷歌和百度分别搜索同一个英文关键词,可以为上述分析提供佐证。下图为分别用百度和Google图片搜索关键词“hot”的结果: 搜索结果的自然呈现上体现不出百度和谷歌的价值观差异,但在对此类事件的处理上,两家的区别比较明显。 谷歌与百度的区别 雪景小黄图事件发酵后,消息称百度迅速对搜索结果进行了人工干预,尽管社交媒体上机智的网友各种尝试,目前百度图片搜索大部分类似词汇均已无法复现。本次事件中,这种干预带来的不良后果之一,是给舆论场讨论带来更多误解。 例如,北师大新闻学院执行院长喻国明教授亲自尝试,未能复现截图的对比效果后,发微博谴责“百度的确有不少需要改进的地方,但用捏造的方式侮辱对方的方式无论如何都是一种下三烂的做法,是为人所不齿的”。在遭遇网友的留意质疑后,该条微博被删除。 2008年,谷歌的官方博客发文称,Google搜索排名一直遵循着三项原则,其中一条就是坚决反对人工干预搜索结果。理由有两点:“搜索算法自动排名质量远高于人工干预排名;只要出现一次失败的查询结果,就意味着我们需要对搜索算法进行改进”。 比较知名案例发生在2009年。彼时有网民发现,在谷歌图片搜索中输入奥巴马夫人的名字Michelle Obama时,第一张弹出来的照片竟遭人丑化,米歇尔被PS成猩猩脸。 谷歌的处理方式是,在该图片的上方提示“搜索结果可能带有冒犯性,如果你感到不愉快,我们深感抱歉”,同时强调不会仅因用户抱怨就删除搜索结果。 业内人士介绍,谷歌的“反对人工干预搜索结果”并非绝对无干预。谷歌的干预主要通过对算法调整来实现,“通过直接采集用户的喜好,将这些因素加入到搜索引擎算法中,再从结果中体现搜索结果的忧与劣”。另外,如涉及违法、含有儿童色情内容、存在病毒和恶意软件的网站,谷歌也同样进行人工干预。而百度的干预方式很多是“直接调整某些网站或某一类网站的排序”。 互联网评论人阑夕曾写文章分析百度人工干预搜索结果的问题,他以自己一篇涉及李彦宏的博客文章微博。该文章发表后,他的博客“就从百度消失了,很多相关搜索结果都排得非常靠后。”文章的结论是“过分的依赖人工干预对百度来说是颗不定时的炸弹”。 这篇文章的发布时间是2009年。自那时以来,“不定时炸弹”偶有爆炸,百度人工干预下的竞价排名模式屡屡受到质疑,但并未伤筋动骨。(北京时间财经 李拜天) (责任编辑:李荣) |