• Home
  • About
    • refraction-ray photo

      refraction-ray

      Blog of thoughs and archive of experience

    • Learn More
  • Posts
    • All Posts
    • Tags Archive
    • Posts Archive
  • Projects
  • RSS

搜索引擎终极盘点

24 Jan 2019

  • 引言
  • 中文搜索
    • 日常信息
      • 日本北海道
      • 美国签证办理
      • 黄背心
      • 中国银行电话
      • 鱼香肉丝做法
      • 北京天气
      • 百度股价
      • 萨拉赫
      • 金赛纶
      • 托福报名官网
      • 清华大学录取分数线
    • 专业知识
      • 韩语 大重型 强势型
      • 副歌 英文
      • 规范理论
  • 英文搜索
    • 文献搜索
      • arXiv: 1805.05958
      • 1805.05958
      • 10.1103/PhysRevLett.121.206601
      • Phys. Rev. Lett. 121, 206601
      • Universal properties of many-body localization transitions in quasiperiodic systems
      • MBL quasiperiodic critical
      • Annual Review of Condensed Matter Physics 6 (1), 15–38.
    • 技术搜索
      • numpy
      • mathematica git
      • sqlalchemy casacades=”delet orphans”
      • oh point group character table
  • 小结

引言

正值百度搜索再次陷入舆论漩涡,微软 bing 又迷之无法访问,值此辞旧迎新新春佳节之际,我也来蹭个热点。本文不去讨论搜索引擎应该做什么,怎么做,也不着重讨论我对这些搜索引擎的态度。相反地,本文单纯作为对于同样的搜索内容,不同搜索引擎返回结果的客观对比,还望各位读者自行从结果中做出自己的价值判断。本文尝试的搜索内容包括中文内容和英文内容两部分,其中既有计算机,和科研等方向的专业知识,也有日常大家常用的关键词,新闻和 howto 型的搜索。比较的搜索引擎包括,google,bing,baidu,sogou,360,yandex,naver,duckduckgo,yahoo。搜索环境设定为所有网站均走代理出口。所有网站均通过 chrome 隐身模式访问,避免用户登陆和 cookie 对结果的影响,同时不开启一切可能会修改页面前端布局和屏蔽广告的插件。Here we go!

首先是网站列表

  网址 可访问性 公司所在地
google www.google.com 被屏蔽 us
bing www.bing.com 国际版被屏蔽,国内版昨日起已无法访问 us
baidu www.baidu.com   cn
sogou www.sougo.com   cn
360 www.so.com 访问延迟异常偏高,不确定情况普遍性 cn
yandex yandex.com   ru
naver www.naver.com   kr
duckduckgo duckduckgo.com 被屏蔽 us
yahoo search.yahoo.com   us

中文搜索

日常信息

这部分包含了大部分用户的大多数搜索的情况,比如具体的地点,人物,新闻事件和 how to 等,这些也是广告的高发区。中文搜索比较首先排除 naver 和 yandex 两个本土化引擎,其对于中文搜索的支持非常之弱,远没有到可以满足基本使用的程度。其中 naver 会自动认为输入的汉字是汉文,因此还是会返回很多韩文结果,而 yandex 中文搜索非常脆弱,其中还混有大量劣质网站的结果。

以下没有明确提及广告的,都代表搜索无广告。但请注意,这里的统计只包含了显性广告,也即网站直接标注为广告的条目,至于其他条目的权重和广告性质,本着客观的精神不予判断和统计。

日本北海道

比如我想去旅行,搜一搜有什么好玩的。

  • google:首页显性广告:无。第二条目为北海道维基百科,其他条目基本和北海道旅游相关,是一些文章和马蜂窝之类的网站。
  • bing:显性广告无,维基词条出现在第三位,内容整体与旅游相关。
  • baidu:首页头部显性广告:2条。尾部广告2条。其他内容搜索质量尚可。
  • sogou:首页头部显性广告:5条。其他内容包括了北海道教师失联的一些条目和旅游相关的条目。
  • 360:首页头部显性广告:3条,尾部显性广告:2条。正式内容第一条是一本北海道旅游的图书的百科。其他条目内容相关性还可以接受。
  • duckduckgo:无广告,维基词条在第一位,但是,搜索内容绝大多数都是日文条目。
  • yahoo:无广告,均为日文条目。

美国签证办理

希望可以找到怎么办签证,而不是怎么骗签证。

  • google:首页显性广告:无。大使馆官网出现在第一顺位。
  • bing:质量极其低下,被劣质网站 seo 刷关键词占据。首页完全没有任何有效信息,也没有官网条目。
  • baidu:显性广告前1后3。官网在除去广告的第一顺位。
  • sogou:显性广告前3后2。首页没有官网条目。
  • 360:显性广告前0后1。官网处于第一顺位,此条目搜索质量和内容接近google。
  • duckduckgo:无广告,官网处于第一顺位。
  • yahoo:无广告,官网处于第一顺位。

黄背心

就是想静静的看看新闻和分析。

  • google:维基百科与近期新闻评论。
  • bing:百度百科,维基百科与新闻。
  • baidu:首页末尾卖背心的显性广告1条。百度百科与新闻。
  • sogou:搜狗百科与各网站新闻。
  • 360:百度百科与各网站新闻。
  • duckduckgo:百度百科(你没看错)与新闻。
  • yahoo:百度百科与新闻。

中国银行电话

就是想找客服搜一下电话。

  • google:电话第一词条。
  • bing:搜索质量低下,大量劣质网站条目。
  • baidu:电话第一词条,广告无。
  • sogou:电话唯一词条,其他结果全部隐藏。
  • 360:电话第一词条。
  • duckduckgo:官网第一词条。
  • yahoo:官网第一词条。

鱼香肉丝做法

饿了。

  • google:各网站的菜谱和百度百科。
  • bing:百度百科,以及大量劣质网站条目。
  • baidu:百度百科及花式菜谱。
  • sogou:菜谱。
  • 360:尾部广告1条,360百科及菜谱。
  • duckduckgo:百度百科及菜谱。
  • yahoo:百度百科及菜谱。

北京天气

就是想看下明天要不要穿秋裤。

  • google:面板型天气展示。
  • bing:广告前1后1,无面板展示。
  • baidu:面板型天气展示。
  • sogou:面板型天气展示。
  • 360:面板型天气展示。
  • duckduckgo:无面板展示。
  • yahoo:无面板展示。

百度股价

我是炒(bai)股(jia)的小行家。

  • google:面板型股价展示及相关新闻。
  • bing:相关新闻,及一些过于宽泛的条目。
  • baidu:面板型股价展示及相关新闻。
  • sogou:面板型股价展示及相关新闻。
  • 360:面板型股价展示及新闻以及工具性网站。
  • duckduckgo:行情网站及相关新闻。
  • yahoo:行情网站及相关新闻。

萨拉赫

伪球迷补补课。

  • google:百度百科第一条,维基百科第二条。
  • bing:维基百科,及其他无关条目。
  • baidu:百度百科,条目相关性不错。
  • sogou:搜狗百科和其他同名者的条目。
  • 360:360百科,相关性不错。
  • duckduckgo:百度百科及相关新闻。
  • yahoo:百度百科及相关新闻。

金赛纶

漂亮妹子谁不喜欢。

  • google:百度百科第一条,维基百科第二条。
  • bing:维基百科第一,百度百科第二,及大量垃圾条目。
  • baidu:百度百科。
  • sogou:搜狗百科。
  • 360:360百科。
  • duckduckgo:百度百科,360百科。
  • yahoo:百度百科,360百科,条目几乎与 duckduckgo 重合。

托福报名官网

只是想安静的找到正确的网站报个名。

  • google:官网一位。
  • bing:广告前1后1,除去广告官网1位,外赠大量垃圾网站。
  • baidu:官网一位。
  • sogou:广告前3后1,除去广告官网1位。
  • 360:官网二位。
  • duckduckgo:官网一位。
  • yahoo:官网一位。

清华大学录取分数线

梦总是要有的。

  • google:相关网站。
  • bing:全是垃圾。
  • baidu:第一位是个闲侃的百家号,没有面板倒是很意外。
  • sogou:分数选择面板。
  • 360:分数选择面板。
  • duckduckgo:相关网站。
  • yahoo:相关网站,对于大量搜索词条,yahoo 和 duckduckgo 呈现出结果高度相似的特征。

专业知识

韩语 大重型 强势型

这一知识,中文甚至各个语言社区都信息很少,格外考验搜索引擎的能力。

  • google:1条相关。
  • bing:全是垃圾。
  • baidu:两条相关。
  • sogou:1条相关。
  • 360:无关。
  • duckduckgo:无关。
  • yahoo:无关,yahoo 依旧和 duckduckgo 呈现出结果高度相似的特征。

副歌 英文

有时就是想快速确认一下某个单词的英文怎么说。

  • google:第一条维基百科,可以直接预览看到英文。
  • bing:头部广告1条。第二条维基百科。
  • baidu:第一条百度翻译,直接预览。
  • sogou:第一条搜狗翻译,直接预览。
  • 360:第一条360翻译,直接预览。
  • duckduckgo:第一条是辞典,但无预览。
  • yahoo:第一条是辞典,但无预览。

规范理论

万一想起来用中文搜一下物理专业知识呢。

  • google:都是和 Gauge field theory 相关的词条。
  • bing:全是垃圾。
  • baidu:除了一个百科外,都是无关词条。
  • sogou:虽然还是有大量无关词条,但有好几条相关词条。
  • 360:部分相关词条。
  • duckduckgo:一些相关词条,和一些名称类似的无关词条。
  • yahoo:同 duckduckgo。

英文搜索

再来看一下用英文进行搜索的情况。

文献搜索

文献搜索是科研过程很重要的部分,方便准确的文献搜索能力,是科研工作者选择搜索引擎的必要条件。

arXiv: 1805.05958

尝试直接搜索 arxiv 文章。

  • google: 第一条目,还包括了 github 的引用条目
  • bing:第一条目
  • baidu:第一条目
  • sogou:无法搜索到 arxiv 条目,倒是包含了 github 的引用条目
  • 360: 无法搜索到结果
  • duckduckgo:第一条目加提醒面板
  • yahoo:第一条目
  • yandex:第一条目
  • naver:第一条目

1805.05958

只搜索一个 arxiv 号,看看谁家可以心领神会这串神秘代码。

  • google: 第一条目
  • bing:第一条目
  • baidu:首页没有
  • sogou:无法搜索到 arxiv 条目
  • 360: 无法搜索到
  • duckduckgo:第一条目
  • yahoo:第一条目
  • yandex:唯一条目
  • naver:第一条目

10.1103/PhysRevLett.121.206601

搜索 doi 号码来找文章。

  • google: 第一条目
  • bing:第一条目
  • baidu:没有正确结果
  • sogou:没有正确结果
  • 360: 没有正确结果
  • duckduckgo:第一条目
  • yahoo:第一条目
  • yandex:没有正确结果
  • naver:没有正确结果

Phys. Rev. Lett. 121, 206601

搜索文章的引用格式来找文章。

  • google: 第一条目
  • bing:第一条目
  • baidu:没有正确结果
  • sogou:没有正确结果
  • 360: 没有正确结果
  • duckduckgo:第一条目
  • yahoo:第一条目
  • yandex:没有正确结果
  • naver:没有正确结果

Universal properties of many-body localization transitions in quasiperiodic systems

用文章题目来找文章。

  • google:arxiv 结果
  • bing:arxiv 与 aps 结果
  • baidu:百度学术与 arxiv 结果
  • sogou:搜索有40字限制,搜到了 arxiv 和 aps 结果
  • 360: 没有正确结果
  • duckduckgo:aps 和 arxiv 结果
  • yahoo:aps 和 arxiv 结果
  • yandex:arxiv 结果
  • naver:arxiv 结果

MBL quasiperiodic critical

用关键词和缩写来找文章。

  • google:大量相关学术文章
  • bing:大量相关学术文章
  • baidu:有效信息极少
  • sogou:有效信息极少
  • 360: 有效信息极少
  • duckduckgo:大量相关学术文章
  • yahoo:大量相关学术文章
  • yandex:有学术文章,但相关性没有非常高
  • naver:学术文章相关性还可以​

Annual Review of Condensed Matter Physics 6 (1), 15–38.

更加冷门的文章引用格式看是否能精准找到文章。

  • google:第一条目就是文章
  • bing:文章在第四条目
  • baidu:没有文章
  • sogou:没有文章
  • 360: 没有文章
  • duckduckgo:文章在第四条目
  • yahoo:文章在第四条目
  • yandex:没有文章
  • naver:没有文章

技术搜索

numpy

直接搜索某个工具。

  • google: 官网第一,文档第三,库第五
  • bing:官网第一,pypi 第二,文档第五
  • baidu:官网第一,文档第三,无库(因为百度爬虫被 github 屏蔽)
  • sogou:广告前1后1,文档第二,官网第三
  • 360: 官网第二
  • duckduckgo:官网第一,文档第二
  • yahoo:官网第一,文档第六
  • yandex:官网第一,库5文档6
  • naver:官网第一,库第三

mathematica git

如果我想了解 git 来管理 mathematica 代码的工作流和实践,就这么搜索的话。

  • google:高度相关,大量来自 stackoverflow 等的解决方案和实践
  • bing:至少前两条高度相关
  • baidu:无有价值信息
  • sogou:有一些相关信息
  • 360: 无有价值信息
  • duckduckgo:有相关信息
  • yahoo:信息依旧类似 duckduckgo
  • yandex:有相关信息,同时混有不少俄语信息
  • naver:无相关信息

sqlalchemy casacades=”delet orphans”

只是想快速知道 sqlalchemy 中这个选项是什么意思的话。

请注意以下结果,由于引号的出现,可能受到了不同搜索引擎对引号处理的影响。

  • google:高度相关,直接给出文档具体位置和社区的相关讨论
  • bing:完全无结果
  • baidu:只有一条博客结果
  • sogou:大量无关的内容
  • 360: 大量无关内容
  • duckduckgo:虽都和技术有关,但无对应内容
  • yahoo:信息依旧类似 duckduckgo
  • yandex:存在一些相关内容,同时混有不少俄语信息
  • naver:完全无结果

oh point group character table

有时,不管是物理学家还是化学家,需要快速找到某个空间群的特征标表看那么一下。

几个网站均可完成任务,不过 sogou 和 360 给出的真的有特征表的链接较为靠后,而其他网站都是第一个链接就可查到对应的表。

小结

虽然说了要客观和旁观,最后还是稍微评价几句。至少在国内的搜索引擎里,百度也不算那么烂,如果非在国内选,不用百度用另外国内网站的话,可能效果还不如百度。只是它们树不够大没招那么多风而已。而对于专业知识和科研搜索,google 几乎是一枝独秀无可替代的。第一选择当然总是谷歌,如果实在上不了的话。看起来国内幸存能上的里边,也许 yahoo 的效果还差强人意。这次盘点,发现这么一个各方面还行的冷门选手,也算是一个收获吧。还有三个小吐槽。搜狗的域名半拼音半英文是什么鬼,为什么不是 sougou 或者 sogo 或者 sougo。bing 对于中文内容恶意seo的防止还任重道远。duckduckgo 和 yahoo 的搜索结果,也不知是谁抄谁的,简直孪生兄弟。



web