引言
正值百度搜索再次陷入舆论漩涡,微软 bing 又迷之无法访问,值此辞旧迎新新春佳节之际,我也来蹭个热点。本文不去讨论搜索引擎应该做什么,怎么做,也不着重讨论我对这些搜索引擎的态度。相反地,本文单纯作为对于同样的搜索内容,不同搜索引擎返回结果的客观对比,还望各位读者自行从结果中做出自己的价值判断。本文尝试的搜索内容包括中文内容和英文内容两部分,其中既有计算机,和科研等方向的专业知识,也有日常大家常用的关键词,新闻和 howto 型的搜索。比较的搜索引擎包括,google,bing,baidu,sogou,360,yandex,naver,duckduckgo,yahoo。搜索环境设定为所有网站均走代理出口。所有网站均通过 chrome 隐身模式访问,避免用户登陆和 cookie 对结果的影响,同时不开启一切可能会修改页面前端布局和屏蔽广告的插件。Here we go!
首先是网站列表
网址 | 可访问性 | 公司所在地 | |
---|---|---|---|
www.google.com | 被屏蔽 | us | |
bing | www.bing.com | 国际版被屏蔽,国内版昨日起已无法访问 | us |
baidu | www.baidu.com | cn | |
sogou | www.sougo.com | cn | |
360 | www.so.com | 访问延迟异常偏高,不确定情况普遍性 | cn |
yandex | yandex.com | ru | |
naver | www.naver.com | kr | |
duckduckgo | duckduckgo.com | 被屏蔽 | us |
yahoo | search.yahoo.com | us |
中文搜索
日常信息
这部分包含了大部分用户的大多数搜索的情况,比如具体的地点,人物,新闻事件和 how to 等,这些也是广告的高发区。中文搜索比较首先排除 naver 和 yandex 两个本土化引擎,其对于中文搜索的支持非常之弱,远没有到可以满足基本使用的程度。其中 naver 会自动认为输入的汉字是汉文,因此还是会返回很多韩文结果,而 yandex 中文搜索非常脆弱,其中还混有大量劣质网站的结果。
以下没有明确提及广告的,都代表搜索无广告。但请注意,这里的统计只包含了显性广告,也即网站直接标注为广告的条目,至于其他条目的权重和广告性质,本着客观的精神不予判断和统计。
日本北海道
比如我想去旅行,搜一搜有什么好玩的。
- google:首页显性广告:无。第二条目为北海道维基百科,其他条目基本和北海道旅游相关,是一些文章和马蜂窝之类的网站。
- bing:显性广告无,维基词条出现在第三位,内容整体与旅游相关。
- baidu:首页头部显性广告:2条。尾部广告2条。其他内容搜索质量尚可。
- sogou:首页头部显性广告:5条。其他内容包括了北海道教师失联的一些条目和旅游相关的条目。
- 360:首页头部显性广告:3条,尾部显性广告:2条。正式内容第一条是一本北海道旅游的图书的百科。其他条目内容相关性还可以接受。
- duckduckgo:无广告,维基词条在第一位,但是,搜索内容绝大多数都是日文条目。
- yahoo:无广告,均为日文条目。
美国签证办理
希望可以找到怎么办签证,而不是怎么骗签证。
- google:首页显性广告:无。大使馆官网出现在第一顺位。
- bing:质量极其低下,被劣质网站 seo 刷关键词占据。首页完全没有任何有效信息,也没有官网条目。
- baidu:显性广告前1后3。官网在除去广告的第一顺位。
- sogou:显性广告前3后2。首页没有官网条目。
- 360:显性广告前0后1。官网处于第一顺位,此条目搜索质量和内容接近google。
- duckduckgo:无广告,官网处于第一顺位。
- yahoo:无广告,官网处于第一顺位。
黄背心
就是想静静的看看新闻和分析。
- google:维基百科与近期新闻评论。
- bing:百度百科,维基百科与新闻。
- baidu:首页末尾卖背心的显性广告1条。百度百科与新闻。
- sogou:搜狗百科与各网站新闻。
- 360:百度百科与各网站新闻。
- duckduckgo:百度百科(你没看错)与新闻。
- yahoo:百度百科与新闻。
中国银行电话
就是想找客服搜一下电话。
- google:电话第一词条。
- bing:搜索质量低下,大量劣质网站条目。
- baidu:电话第一词条,广告无。
- sogou:电话唯一词条,其他结果全部隐藏。
- 360:电话第一词条。
- duckduckgo:官网第一词条。
- yahoo:官网第一词条。
鱼香肉丝做法
饿了。
- google:各网站的菜谱和百度百科。
- bing:百度百科,以及大量劣质网站条目。
- baidu:百度百科及花式菜谱。
- sogou:菜谱。
- 360:尾部广告1条,360百科及菜谱。
- duckduckgo:百度百科及菜谱。
- yahoo:百度百科及菜谱。
北京天气
就是想看下明天要不要穿秋裤。
- google:面板型天气展示。
- bing:广告前1后1,无面板展示。
- baidu:面板型天气展示。
- sogou:面板型天气展示。
- 360:面板型天气展示。
- duckduckgo:无面板展示。
- yahoo:无面板展示。
百度股价
我是炒(bai)股(jia)的小行家。
- google:面板型股价展示及相关新闻。
- bing:相关新闻,及一些过于宽泛的条目。
- baidu:面板型股价展示及相关新闻。
- sogou:面板型股价展示及相关新闻。
- 360:面板型股价展示及新闻以及工具性网站。
- duckduckgo:行情网站及相关新闻。
- yahoo:行情网站及相关新闻。
萨拉赫
伪球迷补补课。
- google:百度百科第一条,维基百科第二条。
- bing:维基百科,及其他无关条目。
- baidu:百度百科,条目相关性不错。
- sogou:搜狗百科和其他同名者的条目。
- 360:360百科,相关性不错。
- duckduckgo:百度百科及相关新闻。
- yahoo:百度百科及相关新闻。
金赛纶
漂亮妹子谁不喜欢。
- google:百度百科第一条,维基百科第二条。
- bing:维基百科第一,百度百科第二,及大量垃圾条目。
- baidu:百度百科。
- sogou:搜狗百科。
- 360:360百科。
- duckduckgo:百度百科,360百科。
- yahoo:百度百科,360百科,条目几乎与 duckduckgo 重合。
托福报名官网
只是想安静的找到正确的网站报个名。
- google:官网一位。
- bing:广告前1后1,除去广告官网1位,外赠大量垃圾网站。
- baidu:官网一位。
- sogou:广告前3后1,除去广告官网1位。
- 360:官网二位。
- duckduckgo:官网一位。
- yahoo:官网一位。
清华大学录取分数线
梦总是要有的。
- google:相关网站。
- bing:全是垃圾。
- baidu:第一位是个闲侃的百家号,没有面板倒是很意外。
- sogou:分数选择面板。
- 360:分数选择面板。
- duckduckgo:相关网站。
- yahoo:相关网站,对于大量搜索词条,yahoo 和 duckduckgo 呈现出结果高度相似的特征。
专业知识
韩语 大重型 强势型
这一知识,中文甚至各个语言社区都信息很少,格外考验搜索引擎的能力。
- google:1条相关。
- bing:全是垃圾。
- baidu:两条相关。
- sogou:1条相关。
- 360:无关。
- duckduckgo:无关。
- yahoo:无关,yahoo 依旧和 duckduckgo 呈现出结果高度相似的特征。
副歌 英文
有时就是想快速确认一下某个单词的英文怎么说。
- google:第一条维基百科,可以直接预览看到英文。
- bing:头部广告1条。第二条维基百科。
- baidu:第一条百度翻译,直接预览。
- sogou:第一条搜狗翻译,直接预览。
- 360:第一条360翻译,直接预览。
- duckduckgo:第一条是辞典,但无预览。
- yahoo:第一条是辞典,但无预览。
规范理论
万一想起来用中文搜一下物理专业知识呢。
- google:都是和 Gauge field theory 相关的词条。
- bing:全是垃圾。
- baidu:除了一个百科外,都是无关词条。
- sogou:虽然还是有大量无关词条,但有好几条相关词条。
- 360:部分相关词条。
- duckduckgo:一些相关词条,和一些名称类似的无关词条。
- yahoo:同 duckduckgo。
英文搜索
再来看一下用英文进行搜索的情况。
文献搜索
文献搜索是科研过程很重要的部分,方便准确的文献搜索能力,是科研工作者选择搜索引擎的必要条件。
arXiv: 1805.05958
尝试直接搜索 arxiv 文章。
- google: 第一条目,还包括了 github 的引用条目
- bing:第一条目
- baidu:第一条目
- sogou:无法搜索到 arxiv 条目,倒是包含了 github 的引用条目
- 360: 无法搜索到结果
- duckduckgo:第一条目加提醒面板
- yahoo:第一条目
- yandex:第一条目
- naver:第一条目
1805.05958
只搜索一个 arxiv 号,看看谁家可以心领神会这串神秘代码。
- google: 第一条目
- bing:第一条目
- baidu:首页没有
- sogou:无法搜索到 arxiv 条目
- 360: 无法搜索到
- duckduckgo:第一条目
- yahoo:第一条目
- yandex:唯一条目
- naver:第一条目
10.1103/PhysRevLett.121.206601
搜索 doi 号码来找文章。
- google: 第一条目
- bing:第一条目
- baidu:没有正确结果
- sogou:没有正确结果
- 360: 没有正确结果
- duckduckgo:第一条目
- yahoo:第一条目
- yandex:没有正确结果
- naver:没有正确结果
Phys. Rev. Lett. 121, 206601
搜索文章的引用格式来找文章。
- google: 第一条目
- bing:第一条目
- baidu:没有正确结果
- sogou:没有正确结果
- 360: 没有正确结果
- duckduckgo:第一条目
- yahoo:第一条目
- yandex:没有正确结果
- naver:没有正确结果
Universal properties of many-body localization transitions in quasiperiodic systems
用文章题目来找文章。
- google:arxiv 结果
- bing:arxiv 与 aps 结果
- baidu:百度学术与 arxiv 结果
- sogou:搜索有40字限制,搜到了 arxiv 和 aps 结果
- 360: 没有正确结果
- duckduckgo:aps 和 arxiv 结果
- yahoo:aps 和 arxiv 结果
- yandex:arxiv 结果
- naver:arxiv 结果
MBL quasiperiodic critical
用关键词和缩写来找文章。
- google:大量相关学术文章
- bing:大量相关学术文章
- baidu:有效信息极少
- sogou:有效信息极少
- 360: 有效信息极少
- duckduckgo:大量相关学术文章
- yahoo:大量相关学术文章
- yandex:有学术文章,但相关性没有非常高
- naver:学术文章相关性还可以
Annual Review of Condensed Matter Physics 6 (1), 15–38.
更加冷门的文章引用格式看是否能精准找到文章。
- google:第一条目就是文章
- bing:文章在第四条目
- baidu:没有文章
- sogou:没有文章
- 360: 没有文章
- duckduckgo:文章在第四条目
- yahoo:文章在第四条目
- yandex:没有文章
- naver:没有文章
技术搜索
numpy
直接搜索某个工具。
- google: 官网第一,文档第三,库第五
- bing:官网第一,pypi 第二,文档第五
- baidu:官网第一,文档第三,无库(因为百度爬虫被 github 屏蔽)
- sogou:广告前1后1,文档第二,官网第三
- 360: 官网第二
- duckduckgo:官网第一,文档第二
- yahoo:官网第一,文档第六
- yandex:官网第一,库5文档6
- naver:官网第一,库第三
mathematica git
如果我想了解 git 来管理 mathematica 代码的工作流和实践,就这么搜索的话。
- google:高度相关,大量来自 stackoverflow 等的解决方案和实践
- bing:至少前两条高度相关
- baidu:无有价值信息
- sogou:有一些相关信息
- 360: 无有价值信息
- duckduckgo:有相关信息
- yahoo:信息依旧类似 duckduckgo
- yandex:有相关信息,同时混有不少俄语信息
- naver:无相关信息
sqlalchemy casacades=”delet orphans”
只是想快速知道 sqlalchemy 中这个选项是什么意思的话。
请注意以下结果,由于引号的出现,可能受到了不同搜索引擎对引号处理的影响。
- google:高度相关,直接给出文档具体位置和社区的相关讨论
- bing:完全无结果
- baidu:只有一条博客结果
- sogou:大量无关的内容
- 360: 大量无关内容
- duckduckgo:虽都和技术有关,但无对应内容
- yahoo:信息依旧类似 duckduckgo
- yandex:存在一些相关内容,同时混有不少俄语信息
- naver:完全无结果
oh point group character table
有时,不管是物理学家还是化学家,需要快速找到某个空间群的特征标表看那么一下。
几个网站均可完成任务,不过 sogou 和 360 给出的真的有特征表的链接较为靠后,而其他网站都是第一个链接就可查到对应的表。
小结
虽然说了要客观和旁观,最后还是稍微评价几句。至少在国内的搜索引擎里,百度也不算那么烂,如果非在国内选,不用百度用另外国内网站的话,可能效果还不如百度。只是它们树不够大没招那么多风而已。而对于专业知识和科研搜索,google 几乎是一枝独秀无可替代的。第一选择当然总是谷歌,如果实在上不了的话。看起来国内幸存能上的里边,也许 yahoo 的效果还差强人意。这次盘点,发现这么一个各方面还行的冷门选手,也算是一个收获吧。还有三个小吐槽。搜狗的域名半拼音半英文是什么鬼,为什么不是 sougou 或者 sogo 或者 sougo。bing 对于中文内容恶意seo的防止还任重道远。duckduckgo 和 yahoo 的搜索结果,也不知是谁抄谁的,简直孪生兄弟。