google 语法
目前, Internet 上有两种搜索引擎. 一种是The Searchable Subject Index,索引式搜索. 这种搜索引擎
只搜索站点的Title和Meta描述信息. 而无法搜索个人主页,Yahoo就是一个索引式搜索引擎. 第二种是The
Full-Text Search Engine 完全内容搜索引擎.通过Spider(蜘蛛?!) 技术搜索数百万个甚至数十亿个页面
.而且可以搜索页面的Title和内容. 所以能够比索引式搜索做更全面的搜索.Google就是一个完全内容搜
索引擎.Google语法
基本连接符
Google 默认的连接符是 AND; 意味着如果你不加其他修饰符号直接搜索的话, Google就会对所有的
关键字同时进行搜索.
snowblower Honda "Green Bay"
如果要从几个关键字中指定任中一个, 可以使用OR 连接符.
snowblower OR snowmobile OR "Green Bay"
如果要明确的指出2个或多个关键字使用OR连接, 可以用括号连接
snowblower (snowmobile OR "Green Bay")
同时你也可以使用电脑编程里管道符号 "|" 来表示OR的功能. 如果要在搜索结果中不包括某个关键字,
使用- (减号/短横线)
snowblower snowmobile -"Green Bay"
Google将搜索包括snowblower 和 snowmobile ,不包括Green Bay.
简单搜索和手气不错
手气不错是Google一个很有特色的功能.你可以迅速得到Google认为的最符合你搜索结果的页面(就是
最常搜索的结果).
比如你搜索washington post 手气不错会把你带到 http://www.washingtonpost.com/. 而president
则是 http://www.whitehouse.gov/ .
大小写
很多的搜索引擎是大小写敏感的,比如你搜索GEORGE WASHINGTON, 就无法搜到"George
Washington","george washington". Google是不区分大小写的,搜索Three, three, THREE都可以得到相
同的结果.
特殊语法
除了基本的AND,OR连接符外, Google还提供了高级搜索的语法.
intitle: 限制你搜索的网页标题. allintitle: 搜索所有关键字构成标题的网页. 但是推荐不要使用
allintitle: 这个语法,因为他和其他的语法合起来使用的效果并不好.
intitle:"george bush"
allintitle:"money supply" economics
inurl: 用于搜索网页上包含的URL. 这个语法对寻找网页上的搜索,帮助之类的很有用.
allinurl: 功能类似allintitle: 但也同样不推荐使用.
inurl:help
allinurl:search help
intext: 只搜索网页<body>部分中包含的文字(也就是忽略了标题,URL等的文字).
allintext: 不推荐使用.
intext:"yahoo.com"
intext:html
inanchor: 搜索连接中包含锚点标记. 锚点标记就是指连接的标记, 比如<a
href="http://www.oreilly.com>;O'Reilly and Associates</a> 中的O'Reilly and Associates就是锚
点标记.
inanchor:"tom peters"
site: 可以限制你搜索范围的域名.
site:loc.gov
site:thomas.loc.gov
site:edu
site:nc.us
link: 可以得到一个所有包含了某个指定URL的页面列表. 例如link:www.google.com 就可以得到所有连
接到Google的页面.不用担心http:// 部分,事实上即使你输入了Google也会将其忽略:p
cache: 搜索Google索引里页面的副本, 即使他原本的URL已经不存在或者完全发生了变化,这部分很适合
页面经常变动的搜索. 如果Google搜索不到你输入的关键字, 那么很有可能你所看到的是Google缓存着的
最新页面.
cache:www.yahoo.com
daterange: 限制搜索特定时间段里的检索内容. 注意是加入Google检索的时间, 而不是页面创建的时间.
但是这个时间在Google整理检索的时候不会发生变化. 比如一个网页是February 2制作的,加入Google检
索的时候是April 11 使用daterange:检索的时候就在April 11的检索里被搜索到. Google在August 13
重建了索引,但仍然在April 11里被搜索到.
daterange:的格式是Julian,而不是Gregorian格式.
"George Bush" daterange:2452389-2452389
neurosurgery daterange:2452389-2452389
filetype: 搜索文件的后缀或者扩展名,注意filetype:htm和filetype:html会得到不同的结果. 你也可以
搜索各种不同的页面脚本语言,比如ASP, PHP, CGI等等. Google对部分Microsoft的文档也做了索引, 比
如PowerPoint (PPT), Excel (XLS), and Word (DOC)等等.
homeschooling filetype:pdf
"leading economic indicators" filetype:ppt
related: 搜索和指定页面相关的页面,比如你搜索related:google.com , 会得到很多搜索引擎,比如
HotBot, Yahoo!, Northern Light等等.
related:www.yahoo.com
related:www.cnn.com
info: 提供一个和指定URL更多信息的页面列表,包括URL缓存的连接,包括URL的连接,和URL相关的连接,包
含URL的页面. 注意, 这里搜索的结果取决于Google是否对该URL进行了索引. 如果没有的话, 搜索结果将
会少很多.
info:www.oreilly.com
info:www.nytimes.com/technology
phonebook: 用于查询电话号码.
phonebook:John Doe CA
phonebook:(510) 555-1212
site,link,inurl,allinurl,intitle,allintitle
“site”表示搜索结果局限于某个具体网站或者网站频道,如“sina.com.cn”、“edu.sina.com.cn
”,或者是某个域名,如“com.cn”、“com”等等。如果是要排除某网站或者域名范围内的页面,只需
用“-网站/域名”。
示例:搜索中文教育科研网站(edu.cn)上所有包含“金庸”的页面。.
搜索:“金庸 site:edu.cn”.
结果:已搜索有关金庸 site:edu.cn的中文(简体)网页。共约有2,680项查询结果,这是第1-10项 。
搜索用时0.31秒。.
示例:搜索包含“金庸”和“古龙”的中文新浪网站页面,.
搜索:“金庸 古龙 site:sina.com.cn”.
结果:已在sina.com.cn搜索有关金庸 古龙的中文(简体)网页。共约有869项查询结果,这是第1-10项
。搜索用时0.34秒。.
注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:”将被作为一个搜索的关
键字。此外,网站域名不能有“http”以及“www”前缀,也不能有任何“/”的目录后缀;网站频道则只
局限于“频道名.域名”方式,而不能是“域名/频道名”方式。诸如“金庸 site:edu.sina.com.cn/1/”
的语法是错误的。.
.“link”语法返回所有链接到某个URL地址的网页。.
示例:搜索所有含指向华军软件园“www.newhua.com”链接的网页。.
搜索:“link:www.newhua.com”.
结果:搜索有链接到www.newhua.com的网页。共约有695项查询结果,这是第1-10项。搜索用时0.23秒
。.
注意:“link”不能与其他语法相混合操作,所以“link:”后面即使有空格,也将被GOOGLE忽略。.
.
“inurl”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中
。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、
“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某
项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。.
示例:查找MIDI曲“沧海一声笑”。.
搜索:“inurl:midi 沧海一声笑”.
结果:已搜索有关inurl:midi 沧海一声笑的中文(简体)网页。共约有14项查询结果,这是第1-10项。
搜索用时0.01秒。.
示例:查找微软网站上关于windows2000的安全课题资料。.
搜索:“inurl:security windows2000 site:microsoft.com”.
结果:已在microsoft.com内搜索有关 inurl:security windows2000的网页。共约有198项查询结果,
这是第1-10项。搜索用时0.37秒。.
注意:“inurl:”后面不能有空格,GOOGLE也不对URL符号如“/”进行搜索。GOOGLE对“cgi-bin/phf
”中的“/”当成空格处理。.
“allinurl”语法返回的网页的链接中包含所有查询关键字。这个查询的对象只集中于网页的链接字
符串。.
示例:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGI-BIN目录中含有PHF脚本程序(这个
脚本是不安全的),表现在链接中就是“域名/cgi-bin/phf”。.
语法:“allinurl:"cgi-bin" phf +com”.
搜索:已向英特网搜索allinurl:"cgi-bin" phf +com. 共约有40项查询结果,这是第1-10项。搜索用
时0.06秒。.
.
“allintitle”和“intitle”的用法类似于上面的allinurl和inurl,只是后者对URL进行查询,而
前者对网页的标题栏进行查询。网页标题,就是HTML标记语言title中之间的部分。网页设计的一个原则
就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关
率的专题页面。.
示例:查找日本明星藤原纪香的照片集。.
搜索:“intitle:藤原纪香 写真”.
结果:已搜索有关intitle:藤原纪香 写真的中文(简体)网页。共约有284项查询结果,这是第1-10项
。搜索用时0.03秒。.
.
GOOGLE的罕用高级搜索语法:related,cache,info.
related用来搜索结构内容方面相似的网页。例:搜索所有与中文新浪网主页相似的页面(如网易首页
,搜狐首页,中华网首页等),“related:www.88blog.com.cn/index.shtml”。.
cache用来搜索GOOGLE服务器上某页面的缓存,这个功能同“网页快照”,通常用于查找某些已经被
删除的死链接网页,相当于使用普通搜索结果页面中的“网页快照”功能。.
info用来显示与某链接相关的一系列搜索,提供cache、link、related和完全包含该链接的网页的功
能。.
示例:查找和新浪首页相关的一些资讯。.
搜索:“info:www.88blog.com.cn”.
结果:有关www.88blog.com.cn的网页信息。.
新浪首页.
北京站 上海站 广东站. ... 游戏世界, |, 影音娱乐, |, Club缘, |, 男.
人女人, |, 论坛聊天, |, 时尚潮流, |, 文教育儿, |, 车行天下, |,.
软件下载. ....
Google 提供这个网址的信息:.
查看Google网页快照里www.88blog.com.cn的存档.
寻找和www.88blog.com.cn类似的网页.
寻找网页有链接到www.88blog.com.cn.
寻找网页包含有’www.88blog.com.cn’.
注意:文中[]符号是为了突出关键词,在实际搜索中是不包含的;本文采用的是意译;本译文已经征得作者
许可;本译文可任意转载,请保留本文的头信息
1. 双引号可以用减号代替,比如搜索["like this"]与搜索[like-this]是一个效果
2. Google不会处理一些特殊的字符,比如[#](几年前还不行,现在可以了,比如搜索[c#]已经可以搜到
相应的结果),但是还有一些字符它不认识,比如搜索[t.]、[t-]与[t^]的结果是一样的
3. Google充许一次搜索最多32个关键词
4. 在单词前加~符号可以搜索同义词,比如你想搜索[house],同时也想找[home],你就可以搜索
[~house]
5. 如果想得到Google索引页面的总数,可以搜索[* *]
6. Google可以指定数字范围搜索。搜索[2001..2005]相当于搜索含有2001、2002直到2005的任意一
个数的网页
7. 搜索[define:css]相当于搜索css的定义,这招对想学习知识的人很有效;也可以用[what is css]
搜索;对中文来说,也可以用[什么是css]之类的
8. Google有一定的人工智能,可以识别一些简单的短语如[whenwas Einstein born?]或[einstein
birthday]
9. 通过[link:]语法,可以寻找含有某个链接的网页,比如[link:blog.outer-court.com]将找到包
括指向 blog.outer-court.com超级链接的网页(最新的Google Blog Search也支持这个语法),但是
Google并不会给出所有的包含此链接的网页,因为它要保证pagerank算法不被反向工程(呵呵,可以参见
那两个Google创始人关于pagerank的论文,可下载)
10. 如果在搜索的关键词的最后输入[why?],就会在结果中出现链接到Google Answers的链接
http://answers.google.com ,在里面可以进行有偿提问
11. 现在出现了一种兴趣活动,叫做Google Hacking,其内容是使用Google搜索一些特定的关键词,
以便找到有漏洞的、易被黑客攻击的站点。这个网站列出了这些关键词:Google Hacking Database(
http://johnny.ihackstuff.com/index....ule=prodreviews )
12. 在Google 中输入一组关键词时,默认是“与”搜索,就是搜索包含有所有关键词的网页。如果要“
或”搜索,可以使用大写的[OR]或 [|],使用时要与关键词之间留有空格。比如搜索关键词[Hamlet
(pizza | coke)],是让Google搜索页面中或页面链接描述中含有Hamlet,并含有pizza与coke两个关键词
中任意一个的网页。
13. 并非所有的Google服务都支持相同的语法,比如在Google Group中支持 [insubject:test]之类
的主题搜索。可以通过高级搜索来摸索这些关键词的用法:进入高级搜索之后设置搜索选项,然后观察关
键字输入窗口中的关键字的变化
14. 有时候Google懂得一些自然语言,比如搜索关键词[goog], [weather new york, ny], [new
york ny]或[war of the worlds],此时Google会在搜索结果前显示出一个被业内称为“onebox”的结果
,试试看吧!
15. 并非所有的Google都是相同的,它因国家版本(或是说语言版本)而异。在US版下,搜索
[site:stormfront.org]会有成千上万的结果,而在德语版下,搜索[site:stormfront.org]的结果,嗯,
自己看吧。Google的确与各国政府有内容审查协议,比如德国版,法国版(网页搜索),中国版Google新闻
16. 有时候Google会提示你搜索结果很烂,比如你搜索关键词[jew]试试,Google会告诉你它给出的
搜索结果很烂,然后给你一个解释:http://www.google.com/explanation.html
17. 以前,搜索某些关键词如[work at Google] 时会看到Google给自己打的广告。可以去
http://www.google.com/jobs/了解Google的工作
18. 对于一些“Googlebombed”(大概意思是指Google搜索的结果出问题了)的关键词,会有一个广告
链接到:http: //googleblog.blogspot.com/2005/09/googlebombing-failure.html (中国大陆需要代理
才能访问)。比如搜索[failure],第一条是美国布什总统介绍
19. 虽然现在Google还没有支持自然语言,但这里有一段录像显示了支持自然语言的搜索引擎的使用
效果:http://blog.outer-court.com/videos/googlebrain.wmv
20. 有人说在Google中搜索[president of the internet],其结第一条表明了president of the
internet是谁,我也是这么认为的,而且你还可以使用这个logo支持本文作者:http://blog.outer-
court.com/files/president.gif
21. Google现在不再有“stop words”(被强制忽略的关键词),比如搜索 [to be or not to be],
Google返回的结果中间还列有相关的完整短语搜索结果
22. 在Google 计算器(http://www.google.com/help/features.html#calculator )中有个彩蛋:输入
[what is the answer to life, the universe and everything?]时,会返回42。(关键词翻译过来的意
思是指“生命、宇宙和一切的答案”,这是一个著名科幻小说中的情节,详情参见http:
//en.wikipedia.org/wiki/The_Answer_to_Life,_the_Universe, _and_Everything)。试试吧,哈哈
23. 你可以在搜索时使用通配符[*],这在搜索诗词时特别有效。比如你可以搜一下["love you
twice as much * oh love * *"] 试试
24. 同样,你的关键词可以全部都是通配符,比如搜索["* * * * * * *"]
25. www.googl.com是在输错网址后的结果,也是个搜索网站,但搜索结果与Google完全不同。而且
此网站也赚Google的钱,因为它使用Google AdSense
26. 如果你想把搜索结果限制在大学的网站之中,可以使用[site:.edu]关键词,比如[c-tutorial
site:.edu],这样可以只搜索以edu结尾的网站。你也可以使用Google Scholar来达到这个目的。也可以
使用[site:.de]或[site:.it]来搜索某个特定国家的网站12. 在Google 中输入一组关键词时,默认是“
与”搜索,就是搜索包含有所有关键词的网页。如果要“或”搜索,可以使用大写的[OR]或 [|],使用时
要与关键词之间留有空格。比如搜索关键词[Hamlet (pizza | coke)],是让Google搜索页面中或页面链
接描述中含有Hamlet,并含有pizza与coke两个关键词中任意一个的网页。
发表评论