第十四章 附录

上一章 目录 下一章
第一节 搜索引擎发展史
搜索引擎从一种技术、一种应用工具,已经演变成一种生活习惯、一种商业平台和一个巨大的产业了。我们不妨从了解搜索引擎的发展历史入手,来深入认识搜索引擎。
一、搜索引擎编年史:全球
搜索引擎是早于万维网出现的,但是在万维网出现之前,搜索引擎还仅仅是实验室的工具,并没有能够成为大众的工具。短短的十多年的时间,搜索引擎除了在技术上的进步有目共睹之外,这种技术的应用对互联网乃至大众生活产生的影响是任何一个搜索引擎发布之初都没有办法预见的。
1990 年
1990 年 12 月 蒙特利尔大学的学生Alan Emtage 发明了Archie。虽然当时World Wide Web 还未出现但网络中文件传输还是相当频繁的,而且由于大量的文件散布在各个分散的 FTP 主机中,查询起来非常不便,因此Alan Emtage 想到了开发一个可以以文件名查找文件的系统,于是便有了 Archie 。Archie 的工作原理与现在的搜索引擎已经很接近,它依靠脚本程序自动搜索网上的文件,然后对有关信息进行索引,供使用者以一定的表达式查询。
1991 年
1991 年4 月
明尼苏达大学(University of Minnesota )的一个研究小组开发出了Gopher,它最初的设计目的是在校园里建立信息共享系统,让每个人都可以简单发布自己的研究成果,并能共享别人发布的信息。由于这个系统设计得界面简单,一致性好,很快就在Internet 上流行起来。Gopher 最大的特点就是用户要作的只是从菜单中做出选择,而由Gopher 完成所需的操作,它可能要与另外一台计算机建立连接,或者要下载一个文件,或者打开一个Telnet 会话等,所有的过程用户都不必关心,也不必知道得到的数据是存放在哪台计算机中的。
广域信息服务 WAIS 出现,WAIS 是 Internet 提供的快速信息查询服务工具,将相关的资料组织成一个可按关键词检索的数据库资料,提供给公众检索。
1991 年 8 月
万维网诞生。万维网的发明者蒂姆•伯纳斯-李在 alt.hypertext 讨论组上贴出了一份关于其研究项目万维网的帖子。该项目旨在构建链接系统,“允许建立指向任意点任意信息的链接”,万维网开始名副其实。
1992 年
1992 年7 月
文字模式的网页浏览器 Lynx 出现,Lynx 是一种提供文字模式的浏览器,此程序支援
UNIX、LINUX、DOS 等多种操作系统。
1993 年
1993 年2 月
Architext 发布。6 个斯坦福大学生的想通过分析字词关系,以对互联网上的大量信息作更有效的检索。到 1993 年中,这已是一个完全投资项目 Architext,他们还发布了一个供webmasters 在自己网站上使用的搜索软件版本,后来被叫做Excite for Web Servers,也是后来的知名网站www.xiaoshuodaquan.com 的前身。
1993 年3 月
美国总统Bill Clinton 发出了全球第一封电子邮件。
1993 年 6 月
WWW Wanderer 诞生。世界上第一个用于监测互联网发展规模的“机器人”程序是Matthew Gray 开发的World wide Web Wanderer,刚开始它只用来统计互联网上的服务器数量,后来则发展为能够检索网站域名。
1993 年 11 月
ALIWEB 诞生。与Wanderer 相对应,Martin Koster 于 1993 年 10 月创建了ALIWEB,它是 Archie 的HTTP 版本。ALIWEB 不使用“机器人”程序,而是靠网站主动提交信息来建立自己的链接索引。
1993 年 12 月
随着互联网的迅速发展,使得检索所有新出现的网页变得越来越困难,因此,在Matthew
Gray 的Wanderer 基础上,一些编程者将传统的“蜘蛛”程序工作原理作了些改进。其设想是,既然所有网页都可能有连向其他网站的链接,那么从跟踪一个网站的链接开始,就有可能检索整个互联网。到 1993 年底,一些基于此原理的搜索引擎开始纷纷涌现,其中以
JumpStation 、The World Wide Web Worm (Goto 的前身,也就是今天 Overture ),和 Repository-Based Software Engineering (RBSE ) spider 最负盛名。然而JumpStation 和WWW Worm 只是以搜索工具在数据库中找到匹配信息的先后次序排列搜索结果,因此毫无信息关联度可言。而RBSE 是第一个在搜索结果排列中引入关键词串匹配程度概念的引擎。
1994 年
1994 年 1 月
第一个既可搜索又可浏览的分类目录EINet Galaxy(Tradewave Galaxy)上线,除了网
站搜索,它还支持Gopher 和Telnet 搜索。
1994 年4 月
Yahoo 斯坦福大学的两名博士生David Filo 和美籍华人杨致远(Gerry Yang)共同创办了超级目录索引 Yahoo,并成功使搜索引擎的概念深入人心。
互联网上第一个支持搜索文件全部文字的全文搜索引擎WebCrawler 是发布,在它之前,用户只能通过URL 和摘要搜索,摘要一般来自人工评论或程序自动取正文的前 100 个字。
1994 年7 月
Lycos,最早现代意义上的搜索引擎出现于 1994 年7 月。当时Michael Mauldin 将John Leavitt 的蜘蛛程序接入到其索引程序中,创建了大家现在熟知的Lycos,这是搜索引擎史上又一个重要的进步。当时Locys 数据量为 54,000,除了相关性排序外,还提供了前缀匹配和字符相近限制,第一个在搜索结果中使用了网页自动摘要。
1995 年
1995 年2 月
Infoseek 的搜索引擎才与公众见面,并于1995 年 12 月与Netscape 签署战略性协议,使
它成为一个强势搜索引擎(注:2001 年 2 月,Infoseek 停止了自己的搜索引擎,开始改用Overture 的搜索结果)。
1995 年4 月 Alexa 上线,并最终成为广受欢迎的网站排名系统。
1995 年 6 月 第一个元搜索引擎Metacrawle 出现。
1995 年9 月26 日 Inktomi 创立。
1995 年 10 月 Excite 网站正式公布。
1995 年 10 月 LookSmart 上线,后来成为最有名的分类目录网站。
1995 年 12 月 DEC的AltaVista登场亮相,大量的创新功能使它迅速到达当时搜索引擎的顶峰。AltaVista 是第一个支持自然语言搜索的搜索引擎,是第一个实现高级搜索语法的搜索引擎,AltaVista 也声称是第一个支持用户自己向网页索引库提交或删除URL 的搜索引擎。
1995 年 6 月 www.xiaoshuodaquan.com
1996 年
1996 年 5 月20 日 Inktomi 公司成立,强大的 HotBot 出现在世人面前(Hotbot 曾是随后几年最受欢迎的搜索引擎之一,后被Lycos 收购)。
1996 年Mamma
Dogpile
1997 年
1997 年4 月 Ask Jeeves,也就是现在的www.xiaoshuodaquan.com 上线。
1997 年7 月 FAST Search 上线
1997 年 GoTo 上线
1998 年
1998 年 1 月 Openfind创立,其技术源自台湾中正大学吴升教授所领导的 GAIS 实验室。Openfind 起先只做中文搜索引擎,曾经是最好的中文搜索引擎,鼎盛时期同时为三大著名门户新浪、奇摩、雅虎提供中文搜索引擎。
1998 年2 月
中国人自己的搜索引擎“搜狐”问世,“出门靠图,上网找搜狐”开始了中国互联网的门户时代。
1998 年 5 月 Yahoo 搜索采用Inktomi 技术。
1998 年 6 月 开发时目录DMOZ 发布。
1998 年9 月27 日 Google 诞生。
MSN Search 上线。
1998 年 10 月 Lycos 收购Wired/HotBot。
1999 年
1999 年 1 月 At Home 收购Excite。 www.xiaoshuodaquan.com 上线。
1999 年2 月 GO Network 上线。
1999 年 5 月 Fast (Alltheweb )公司发布了自己的搜索引擎AllTheWeb 。
1999 年 6 月 CMGI 收购AltaVista 。
1999 年7 月 迪斯尼收购Infoseek。
1999 年9 月 FindWhat 上线。
2000 年
2000 年 5 月 Terra 收购Lycos。 2000 年 6 月 Vivísimo 上线。 Yahoo 搜索采用 Google 技术。
2000 年 10 月 Google 推出AdWords 广告服务。
2001 年
2001 年4 月 Teoma 登场。Teoma 支持类似自动分类和提供专业链接目录的功能,同年9 月被提问式搜索引擎Ask Jeeves 收购。
2001 年 8 月
LookSmart 整合 www.xiaoshuodaquan.com 并升级收费服务。非商业网站可通过 LookSmart 旗下的www.xiaoshuodaquan.com 进行免费登录;商业网站则必须付费登录,还推出了“Express Modify”服务,允许付费快速修改网站信息。
2001 年9 月
AskJeeves 收购Teoma
WiseNut Wisenut 由韩裔Yeogirl Yun 创立。2001 年春季发布Beta 版,2001 年9 月5 日 发布正式版,2002 年4 月被分类目录提供商looksmart 收购。
2001 年9 月21 日
搜狐公司在国内率先宣布对搜索引擎收费。但这项收费服务不是针对普通网民,而是对希望把自己的网站加入搜狐搜索引擎的企业提供分类搜索服务收费。
2001 年 10 月 GoTo 更名为Overture。
2002 年
2002 年 1 月
Yahoo 收购StarMedia Network 旗下的巴西搜索引擎 Cade,并将其与Yahoo 搜索引擎整合。通过本次收购,Yahoo-Cade 将成为南美第三大网络媒体网站。
2002 年2 月
Google 推出了Adword Select 竞价排名广告业务,用户可针对目标关键词搜索结果页面中Adword 广告链接排名进行竞价,最低竞价为 5 美分,Google 竞价排名在考虑竞价高低同时还参考链接的点击率。
2 月28 日起,百度竞价排名前3 位的网站开始出现在搜狐缺省搜索结果最前列。
2002 年3 月 12 日 新浪网搜索引擎中的网页搜索服务被百度停止。
2002 年 5 月 微软拒绝继续与RealNames 合作,导致后者宣布将在 6 月28 日停止关键词搜索服务并宣布倒闭。
2002 年 12 月 Google 推出了商品购物搜索引擎Froogle。
2003 年
2003 年3 月 Yahoo 收购Inktomi。
2003 年4 月
FindWhat 收购Espotting。
Google 收购Applied Semantics 。
Overture 收购AltaVista 和Fast/AlltheWeb。
4 月 15 日新浪正式宣布和中国搜索联盟结成战略合作伙伴,为企业提供搜索排名服务。
2003 年 6 月
Google 推出AdSense 服务。
2003 年 10 月 Yahoo 收购Overture。
2004 年
2004 年2 月 Yahoo 整合其收购的多家搜索引擎技术,推出了YST 全文搜引擎技术,Yahoo 宣称其全文搜索引擎已索引了43 亿个网页文件。Yahoo 推出新的搜索引擎,意味着与Google 多年合作的终结。
Lycos 停止搜索服务。
2004 年3 月
AltaVista、AlltheWeb 切换为Yahoo搜索。
AskJeeves 收购Excite、iWon、My Way。
2004 年4 月 Google 推出Gmail 邮箱服务,全球率先推出 1G 免费邮箱。
2004 年 6 月
AOL 收购www.xiaoshuodaquan.com。
Yahoo 在中国推出独立域名的搜索引擎一搜www.xiaoshuodaquan.com。
Ask Jeeves 收购Tukaroo Search。
百度Baidu 获得新一轮投资,Google 成为其战略投资者。
2004 年 8 月
8 月3 日,搜狐正式推出全新独立域名专业搜索网站“搜狗” (www.xiaoshuodaquan.com ),力推用户互动式搜索功能。
Yahoo 推出Local Search Engine,提供本搜索服务。
8 月 19 日
Google 首次公开发行股票 IPO,在美国NASDAQ 成功上市,Google 的IPO 采用荷兰式拍卖的形式,上市后市值达到300 亿美元,超过众多老牌传统上市公司。
2004 年9 月 15 日
全球最大的在线购物网站Amazon 亚马逊发布了其Web 搜索服务工具的新版本www.xiaoshuodaquan.com,可从用户所选择的各种资源中组织有用信息,并能记住用户的个人搜索记录。
2004 年 11 月 MSN 发布新的搜索引擎。
Google 宣布收录网页超过 80 亿。
2005 年
2005 年 1 月
Gigablast 宣布收录网页超过 10 亿。
AOL 发布新版的搜索引擎,并采取多项措施加强搜索引擎。
2005 年3 月
美国传媒大亨Barry Diller 的IAC 公司宣布收购Ask Jeeves,涉及金额达 19.5 亿美元,
IAC拥有超过 40家不同网站,其中包括在线旅行站点 Expeidia、www.xiaoshuodaquan.com,社交网站
www.xiaoshuodaquan.com、www.xiaoshuodaquan.com 及其它流行站点 Ticketmaster、LendingTree 等。
2005 年4 月
4 月 12 日,搜狐以约1000 万美元全资收购国内一家名为Go2Map 的电子图公司,搜狐在完成对Go2Map 的收购之后将把其资源整合进搜狐的搜索业务线当中。Go2Map 从2000年开始专注于网络图搜索领域,Go2Map在该细分市场内已经做到了接近 90%的市场份额。
4 月 18 日,Yahoo 把旗下“Overture”更名为Yahoo Search Marketing,美国市场将率先实施更名计划,海外市场也将陆续更名,但日本和韩国将继续保持“Overture”品牌。调整之后。Overture 的搜索广告产品将以“Sponsored Search(赞助搜索)”为名,而本付费搜索则称为“Local Sponsored Search(本赞助搜索)”
2006 年 1 月27 日 www.xiaoshuodaquan.com 上线,取代了www.xiaoshuodaquan.com。
2006 年9 月 微软正式发布全新的搜索技术Live Search。
二、搜索引擎编年史:中国
1996 年
1996 年 8 月 ITC 爱特信电子技术公司(北京)有限公司正式注册,也就是后来的搜狐。
1997 年
1997 年2 月 爱特信公司正式推出ITC 中国工商网络。
1997 年 10 月29 日 由北大网络实验室研制开发的天网中英文搜索引擎在CERNET 上向广大Internet 用户提供Web 信息导航服务。
1998 年
1998 年2 月 搜狐推出。
1998 年 12 月
四通利方宣布并购海外最大的华人网站公司“华渊资讯”,成立全球最大的华人网站
“新浪网”,引起海内外极大关注。
1999 年
1999 年2 月2 日 新浪网推出新一代中文搜索引擎“新浪搜索“测试版。
1999 年3 月 在分类搜索的基础上,搜狐发展成为综合性网络门户,推出丰富的特色频道,提供多种网络服务。
2000 年
2000 年4 月 13 日 新浪网在美国纳斯达克上市。
2000 年 6 月 百度正式推出中文搜索引擎,并且宣布全面进入中国互联网技术领域。
2000 年7 月 12 日 搜狐公司在美国纳斯达克上市。
2000 年 9 月 网易正式推出了全中文搜索引擎服务,并拥有国内唯一的互动性开放式目录管理系统。
2000 年 10 月 百度始为新浪提供服务。
2000 年 11 月 1 日 新浪搜索正式推出国内第一家综合搜索引擎。
2001 年
2001 年2 月 百度为www.xiaoshuodaquan.com 提供全面搜索服务。
2001 年 10 月 百度推出全新商业模式“竞价排名“。
2002 年
2002 年3 月 新浪网搜索引擎推出搜索引擎new 指数。
2002 年9 月 中搜与中国互联网新闻中心(中国网)联合发起成立“中国搜索联盟”。
2002 年 10 月 百度开始为雅虎中文提供搜索技术,雅虎同时加入百度竞价排名阵营。
2002 年 11 月 百度开始为网易提供搜索技术,百度发布MP3 搜索。
2003 年
2003 年4 月 新浪与中国搜索联盟结成战略合作关系共拓搜索引擎服务。
2003 年7 月 百度推出图片、新闻两大技术化搜索引擎。
2003 年 8 月 中搜正式推出第三代智能搜索引擎,新浪、搜狐、TOM、网易等七大门户网站同时宣布采用其搜索引擎技术。
2003 年 12 月 百度陆续推出区搜索、“贴吧”等划时代功能,搜索引擎步入社区化时代。
2003 年 12 月 “中国搜索”告成立,并推出搜索门户www.xiaoshuodaquan.com 及新闻中心。
2004 年
2004 年2 月26 日 中搜推出全球首款桌面搜索产品“网络猪”。
2004 年3 月 首届搜索力经济高峰论坛在厦门召开。
2004 年 6 月 网易采用Google 网页搜索技术。
2004 年 8 月3 日 搜狐推出第三代互动式搜索引擎“搜狗”。
2005 年
2005 年2 月 百度发布全球首款支持中英文的硬盘搜索工具。
2005 年4 月 搜狐收购中国领先的在线图服务公司 Go2Map。
2005 年 5 月 18 日 百度正式宣布推出影视搜索服务,提供影视资源在线观看及下载服务。
2005 年 6 月23 日
百度推出名为“百度知道”的互动式知识问答分享平台,进军“知识搜索”领域。
2005 年 6 月30 日 新浪正式推出自主研发搜索引擎“爱问”。
2005 年 8 月5 日 百度在美国纳斯达克上市,首日股价涨幅达354%。
2005 年9 月23 日 百度发布图搜索服务,正式提供本化图搜索服务。
2005 年 11 月7 日
搜狐公司正式成为 2008 年北京奥运会赞助商,成为百年奥运史上第一个互联网类别赞助商。
2006 年
2006 年3 月 17 日搜索引擎战略大会第一次中国会议在江苏南京举办。
2006 年4 月 “网络猪”正式更名IG,并定义为新一代个人门户,推出搜索市场。
2006 年4 月
百度推出第三个社区类搜索产品——“百度百科”(www.xiaoshuodaquan.com )。
Google 中国公司正式成立并发布中文名称“谷歌”。
2006 年7 月 百度发布新产品“百度空间”。
2006 年9 月 百度竞价排名全面推出智能排名功能,以“综合排名指数”作为排名的标准。
2006 年 11 月 微软Live Search 和中国电信合作推出 114 搜索。
2006 年 12 月 网易悄然推出自主开发的搜索引擎“有道”。
第二节 搜索引擎行业八卦
一、中国 SEO 市场概况
中国SEO 市场开始萌芽于2003 年初,2004 年底,达到了一个**。但那时候 SEO 引起关注,更多是因为大量作弊手段的流行,严重影响了搜索引擎的正常使用。
这一期间所谓的 SEO 服务公司,大都是以兜售Google 左侧排名为生。由于排名的不稳定性,导致在2005 年 5 月份后,一大批所谓的排名公司倒闭。这一期间,标准的遵循搜索引擎搜索道德的SEO 服务开始诞生。
2006 年,是中国 SEO 迅速发展的一年,行业了出现了一批引导正确操作规范的个人,
开始向中国的企业传播合理的 SEO 理念。SEO 也得到了广大媒体的正面报道。而且像“好
耶”这种大品牌搜索引擎营销公司的介入,SEO 的形象得到极大的改善,也得到了Google,
Yahoo、百度的承认。这一年内,大量的行业领军站点开始尝试SEO 的魅力,这个行业也得到了前所未有的关注。中国的 SEO 服务,也有了信心向它在国外一样,成为网站开展搜索引擎营销的核心战略之一。
经过几年的积累和沉淀,国内目前 SEO 服务公司的基本现状为:
二、杨致远为Yahoo 做优化
Yahoo 是最早使用 SEO 技术的公司之一,那个时候,他们仍然没有估计到搜索产业巨大增长潜力在世纪之交即将来临。Yahoo 的联合创始人大卫•费罗和杨致远那时候为了增加站点的曝光度,想办法让他们的网站能被互联网上其他搜索引擎发现。通过对站点结构的优化和一些“狡猾”的代码编写技巧,他们的网站变得很容易被那些新用户检索到。当时他们也没有考虑将这种服务商业化操作,因为当时没有人清楚这样做到底是符合商业道德的还是非法的,也没有可以参考的简单标准。
三、SEO 大赛
以组织或者是赞助比赛的形式推广产品和服务,是近年来比较流行的。搜索引擎领域经常也会有一些赛事,从搜索引擎之间各种技术层面的较量,到广大用户搜索技巧的比拼,每次都搞得红红火火。最近,一场以搜索引擎优化为主题的比赛,在没有任何媒体宣传的情况下火爆了起来。
印象中比较早的一次 SEO 大赛发生在2004 年5 月,当时澳洲的DarkBlue 和SearchGuild推出了一项名为“挑战 SEO”的Google 左侧排名竞赛活动。竞赛以“nigritude ultramarine”为竞赛关键词,吸引了全球各不少搜索引擎优化专家的眼球。主办方声称举办这个活动的目的是希望探讨一下Google 究竟是如何进行排名的,设立了“竞赛奖”和“保持奖”两个奖项,竞赛日期是2004 年 5 月7 日-7 月7 日,6 月7 日晨9 时,在Google 中搜索竞赛关键词,排名第一的网站将获得“竞赛奖”,7 月 7 日晨9 时,在Google 中搜索竞赛关键词,排名第一的网站将获得“保持奖”。
但是由于在比赛规则上没有很好设定,这次比赛最终沦为搜索引擎作弊者的温床,各
种欺骗搜索引擎的手段层出不穷。虽然比赛产生了很大的影响,但是也让很多人对 SEO 产
生了误解,把SEO 当成了作弊、滥用关键词的代名词。
www.xiaoshuodaquan.com 可以说是最精明的 SEO 大赛发起人。作为一个从事二手汽车在线交易的公司,www.xiaoshuodaquan.com 可以说和 SEO 毫无关系。但 www.xiaoshuodaquan.com 却想到了 SEO 大赛的方式,并设置了奖金。虽然800 美元的奖金不算丰厚,但获得名次的意义可不仅仅在于奖金。于是SEO 们纷纷加入,经过数月的竞争,大赛告一段落,真正受益的当然是 www.xiaoshuodaquan.com 了。
这次 SEO 大赛可以说是一次经典的商业炒作案例,Carcasher 给出了丰厚的奖品,包括 14,
000 美元、42"Plasma 彩电,、索尼PSP 游戏机和iPod 这些奖品之外,还有一个标的为 12000
美元的 www.xiaoshuodaquan.com 的2007 年的 SEO 服务合同,这些让 SEO 专家们趋之若鹜。当然,更能吸引高手的是奖品背后的荣誉。
国内比较有影响力的一次 SEO 大赛,应该是刘韧和老白之间的一次玩票性质的较量。
二人以“**语录”做Google 排名竞赛关键词。虽然他们都不是真正意义上的 SEO,但是却有着非常广泛的人脉资源和网站资源。国内的 SEO 高手纷纷支招,网友们的主动链接也让这次二人之间的比赛迅速扩展成为业界的事情。
**语录这样的关键词,虽然不算是热门词,但是长期积累下来的文章和网页多如牛
毛。选择这样的词作为 SEO 比赛的结果就是很难找到。好在刘韧和老白都有不少朋友,否则不知道要优化到什么时候才能让自己的网页浮出水面。
最近一次由浩维传媒组织的 SEO 大赛就更有点传奇特征了。大赛发起前,有人就竞赛
关键词是什么做出猜测和建议,比如有人就建议用月饼这个词。但是考虑到不利于完整观察
以及有可能因为竞赛影响原来的搜索结果,大赛组织方还是决定制造一个新的词汇。于是,
一个绝对新词,在Google、百度等搜索引擎搜索结果均为零的词语诞生了:“渡虎谷”。
渡虎谷 SEO 大赛有一些特点:
站内全文检索 TRS 提供了一个独立的产品做站内检索,与TRS WCM 可以很好集成。TurboCMS 没有自己的全文检索系统,需要与第三方的系统做集成。

这两个产品都很贵,都要几十万,不是个人网站可以使用的,这里提出来,做为内容管理领域的优秀软件简单分析,供参考。两者都是生成静态页面,同时允许.shtml 来包含动态查询,调用外部数据库。且两者的很多功能已经具备了页面优化的特征,在此软件基础上做优化工作会很轻松容易。
适合个人网站的也有不错的系统,还有电子商城类的,可以探讨挖掘。
2、即时通信
特点是:和潜在客户即时沟通。这类软件有两种。
被动沟通:MSN、QQ 等 可以加入很多好友进行交流沟通,洽谈生意。现在很多电子商务网站都有这两类联系工具。大家都很熟悉。
第二种是主动沟通:“网眼”类交流工具它们有一句经典的广告语是:“网眼,让
访客变顾客,流量变销量!” 安置在网站上,这类工具能够让你主动联系上正在浏览你网站
的每一个客户,查看到对方身份信息(如来自区、登陆次数、使用搜索引擎和所查询的关
键词等等),分析出最有价值的潜在客户,同时获取对方的采购意向、联系方式等重要的商
业信息,从而将你网站上的浏览者都转变成为真正的客户,不再像过去那样,因为要等着客
户打电话过来而流失大量宝贵的商业机会,让你的网站变成真正意义上的销售门户。但是这
类产品中有些产品由于其技术原理不合理,会导致整个被框在 IFRAME中,对搜索引擎极
不友好。具体采用时,请注意它们的技术原理。如果选对了产品,对销售量的转化和用户行
为分析还是很有效的。
3、邮件群发
特点是:直接投放到用户面前,定位比较精确。分垃圾群发和许可营销。
好的邮件群发系统能对大批量的邮件群发进行有效的跟踪和分析,让邮件发送者全面掌握邮件群发的状态和效果,结合消费者数据仓库进行客户关注分析,分析数据成为后续电子商务营销的决策依据。垃圾群发的效果越来越差,要进行细分定位才会改良效果。邮件列表是基于用户许可的原则,用户自愿加入、自由退出,稍微不同的是,Email 营销直接向用户发送促销信息,而邮件列表是通过为用户提供有价值的信息,在邮件内容中加入适量促销信息,从而实现营销的目的。
4、留言板群发
特点是:制造大量垃圾链接。
目前大家都在使用它做外部连接,很多SEO 公司和SEO 个人在客户急功近利的压力下,天天启动它群发,似乎都没有别的事情可以做了。如果把留言板略微修改一下,它的效果就大打折扣。现在这样的链接群发很容易被搜索引擎封杀。
5、论坛群发
特点是:做品牌推广。
论坛以软文性质出现的最多,重点在于品牌产品的宣传推广。
《暴力营销》是其中的代表作,内置式OCR 解码模块,可绕过论坛“验证码”。
论坛群发对机器性能要求很高,一般机器发 10 万个论坛需要好几天甚至 10 来天。使用虽然简单,但对结果无法跟踪。发送成功率在 65%左右,但是最后真正保存下来的帖子估计能在 10%就不错了。因为论坛是一个有斑竹管理的方,一般的文不对题就很容易被删掉,略微有点经验的就能看出来是机器所发,那就更加是删你没商量,因此实际效果不怎么样。要想多保存帖子存活量,还得在文章内容方面下工夫。它无法选择论坛,这个是最大的弊端。
该软件由于天天骚扰论坛管理,引起很多斑竹的痛恨,已经掀起反《暴力营销》狂潮,
下面是一个斑竹反《暴力营销》的一个例子:《垃圾网站》论坛群发软件的推出,标志着中
国网络营销正式进入“暴力时代”。《暴力营销》被自动替换成《垃圾网站》了。
由于主站点访问人数过多,速度较慢,建议访问镜像站点:
[美国]http://病毒网站已被屏蔽/
[美国]http://病毒网站已被屏蔽/
上面的网址也被替换成“病毒网站已被屏蔽”字样。
6、博客群发
特点是:发垃圾链接。
国内已经出来了专门往博客的留言评论里发垃圾链接的软件,这个跟留言板群发类似。
但还没有看到能够自动创建博客、自动登陆发帖的国产博客发帖软件,要是有的话,估计博
客网站就要大大遭殃了。
7、在线分析诊断
特点是:分析网页的各种页面元素关系等。
这些工具对于 SEO 专职人员来说,用得较多。主要是分析网页中存在的问题,减轻人工工作量。这一类工具大家都很熟悉,这里列举一些如下:
关键词搜索引擎排名速查
网页坏链接在线检测
网页在线SEO 体检
Google Dance 查询
中文域名删除组合查询
网页在线SEO 体检
网页Meta 信息检测
Dmoz 收录查询
页面热点统计 可以统计出网站上最受欢迎的页面的排名
同时在线统计 可以统计出 15 分钟网站上的同时在线人数
回头率分析 可以统计出访客回访网站的频率

比较熟悉的大概有如下几个:
Google 网站访问统计(Google Analytics): http://www.xiaoshuodaquan.com/analytics/
ITSUN 网站流量统计:http://www.xiaoshuodaquan.com
51yes 网站流量统计:http://www.xiaoshuodaquan.com
阿江统计:http://www.xiaoshuodaquan.com
武林榜:http://www.xiaoshuodaquan.com
二、Google Sitemaps
Google Sitemaps 是Google 的一个和网站管理员相关的工具,有点象Blog 的RSS 功能,是一个方便自己的服务,如果大家(互联网上所有的信息源)都采用了这种方式提交自己的更新的话,Google 就再也不用派出那么多爬虫辛辛苦苦的到处乱窜了。任何一个站点,只要有更新,便会自动“通知”Google,方便Google 进行索引。
Google Sitemaps 的用法非常简单。
首先在自己网站根目录上上建立一个名为 Google11e5844324b7354e.Html,文件本身可
为空。然后在Google Sitemaps 主页上单击验证按钮,Google 会验证这一文件。如果验证通过,Google 会显示一个已验证状态,并提供一个指向用户网站统计信息的链接。经过验证后,用户随时可以通过单击“网站概述”页上的链接来查看自己网站的统计信息。
接下来,建立 Sitemaps 文件。Sitemaps 文件是XML 格式的,Google 建议使用 Sitemaps协议格式的文件。不过使用 BLOG 的RSS 甚至纯文本文件也都可以。XML Sitemaps格式其实也很简单,建议多花几分钟转换为XML Sitemaps格式后再提交Google。Sitemaps 协议是 XML 的变种,用于概括与Web 抓取工具相关的 Sitemaps 信息。对于每个网址,都可以加入抓取“提示”(如最后修改日期和近似更改频率)。Sitemaps 协议以 <urlset>开始标记开始,以 </urlset> 结束标记结束。 每个网址包含一个作为父标记的 <url>条目。 每一个 <url> 父标记包括一个 <loc> 子标记条目。<loc>是网页文件的网址。此网址应以http 开始并少于 2048 个字符。 <lastmod>表示该文件上次修改的日期。此日期允许删除时间部分,例如YYYY-MM-DD 。其他的可选项可以不加。
最后,在 Google Sitemaps 的提交页面填写你生成的Sitemap 址,并提交即可。
过了几个小时后,再登录 Google Sitemaps,可以看到功能菜单。
三、通过 sitemaps 分析死链
Google Sitemaps 还提供了Google Spider 对用户网站访问情况的说明报告,如:查询统计信息、抓取统计信息、网页分析、索引统计信息等信息。“查询统计信息”中,有列出几个进入你网站的热门搜索关键词。在“抓取统计信息”中,可以看到Google Spider 抓取网站的概要统计和抓取错误的址。实现了网站主和GoogleSpider 的信息交互。通过该表可以详细得知站点的死链情况。
第四节 Google 的几个著名现象
一、Google Trust Rank
1、TrustRank 的提出背景
搜索引擎在计算网页排名的时候,非常依赖链接,而且链接的质量越来越显得重要。这种情况下,需要对链接的来源站点质量进行判断。更重要的是,以前依靠链接和相关性来决定排名的方式,已遭到了各种各样作弊行为的挑衅,Spam 的横行,直接导致了Google 必须找到一种新的反作弊机制,以确保高质量的站点来获得搜索引擎的亲徕。因而 Sandbox 和TrustRank 被提了出来。意图确保好的站点能获得更高的搜索表现,并加强对站点的审核。 Google 自己关于TrustRank 的最初论述也提到了这些:
垃圾页面经常使用各种各样的作弊方法来获取一个好的搜索引擎排名。虽然人工可以很容易识别这些垃圾,但问题是这么多的页面,靠人工是无法完成的。所以我们就提出了我们最新的半自动的一种技术方案。我们首先让我们的专家选择一些好的样板页面,然后分析他们的链接结构并以此结构来比较其他页面,进而发现那些没有作弊可能性较大的页面。我们讨论了好几种样板选择和如果发现优质页面的方案。 我们利用AltaVista 在因特网上进行了实验,并评估了我们这项技术的效果。结果证明我们能够很好的通过网上一小部分优质的网站来辨别垃圾页面,当然这些优质的样板网站数量不得少于200 个。
2、什么是Google Trsustrank?
Google 诚信指数(TrustRank)是指网站对于Google 而言值得信赖的程度。
网站 TrustRank 的计算采用人工和机器链接分析相结合的方式。通过 Google 或其他一些检索机构的专家,可以先确定一批站点的TR 值,在通过机器的链接结构分析来确定互联网上其他站点 TrustRank 值,然后以 TR 值的高低来做为网页排名的一个重要依据。跟 PR值原理类似,如果其他站点获得了来自高 TR 值站点的链接也将获得更高的 TR 值。GoogleTrustRank 应该是以站点而不是页面为单位的。
3、Google TrustRank 的影响
Google TrustRank 的影响现在已经越来越明显,大量的SEO 通过实践都证明了TrustRank
是真实存在的。而Google 也早就注册了TrustRank 的商标。
Google TrustRank 对于网站排名有种非常重要的影响:
二、Google Sandbox
1、什么是Sandbox 所谓沙盒效应指的是,新的网站在 Google 里面很难得到好的排名,无论你怎么优化这
个网站。换句话说,一个新的网站,可以有很丰富的相关的内容,可以有大量的高质量的链
接,网站既搜索引擎友好,也用户友好,所有一切都优化的很好。但是在一段时间之内,就
是很难在Google 里面得到好的排名。可以说,Google 的Sandbox 有点像给予新网站的一个试用期。在这段试用期内,新网站几乎无法在竞争比较激烈的关键词下得到好的排名。
这个现象最早是在2004 年 3 月开始被注意到。沙盒效应更多的是发生在以竞争比较激烈的关键词为目标的网站上。那些不太商业的,竞争比较少的关键词,发生沙盒现象的机会就比较小。
虽然沙盒效应是这一两年最热门的话题,但到目前为止,没有人能够确认确实存在沙盒效应,Google 从来没有肯定或否定过。有人认为,沙盒效应本身就是一个独立的过滤算法,把所有新网站的排名暂时都排到后面。
也有人认为沙盒效应只是一种效应或现象,它本身并不是一个过滤器,而是很多其他排名因素所造成的一个现象而已。比如说,Google确实在近一两年开始在把链接的年龄以及链接页的历史情况都考虑在内。还有网站获得链接的速度,如果一个网站在短时间内获得了大量的链接,Google会怀疑这些链接是买来的,或者是通过作弊手段得到的。这些与时间有关的因素组合起来,就可能对新网站产生这种沙盒现象。
虽然对 Sandbox 的本质是什么众说纷纭,但一般都认为这种现象是存在的,因为是可以观察到的。
大部分人认为 Google 之所以会制造这种 Sandbox 效应,是为了清除那些垃圾网站。通常这些垃圾网站都会快速买大量链接,得到好的排名,赚一笔钱后,这些作弊手段被发现了,网站被删除或被惩罚。但是这些人也不在乎,这个域名也就被放弃了,转而开始做另外一个新的网站。
在Google 开始出现Sandbox 以后,有可能大部分的这些垃圾网站制造者都没什么耐心,要等他的网站从沙盒里面出来,从而也就不建这些垃圾网站了。
通常沙盒效应会维持六个月,有一些针对竞争性不高的关键词的网站,可能在沙盒里会短一些。行业竞争越高,沙盒效应会越长。
Sandbox 仅是发生在Google 排名中的一种现象。一般认为,Sandbox 效应是发生在距今最近的Google 算法更新后(即业界称为“Florida” 与 “Austin ” 更新)。具体是这样的:Google 会给新网站额外加上一定的分值,使得新网站的排名迅速上升(某几种目标关键词)。随后的一段时间里(大概是一到三、四个月),网站的排名就会逐渐下降,有的主要关键词排名甚至会消失(尽管你的 PR 很高,页面内容与原来一样)。这就如沙漠里的沙流将周围的物体慢慢吞噬,所以业界给这种现象取名为Sandbox 现象。
2、怎样去正确看待Sandbox 效应?
当你的网站进入了Sandbox 效应时期,你并没有受到Google 的处罚,你也很确定Google依然收录你的网站。你应该保持平静,即使你的网站是在一开始就有很多重要的关键词都排得很好,现在突然间消失了或者下降了很多,我们仍然需要保持心理平衡。
首先要放宽心,因为从根本上说,你没办法逃避沙盒现象。随着时间的推移,过大概六个月以后,你的新网站或新域名自然会从沙盒里出来。
同时,当你的网站还在被Sandbox 沙盒效应影响的时候,你应该利用这段时间来增加网站的内容,寻求更多的导入链接。
实际上有了沙盒效应,对很多网站运行者来说,可能是一件好事。因为在大概半 年的
时间里,你只能把精力放在网站内容上面。而不会去考虑排名。
从长远来看,一旦沙盒效应结束,你的导入链接的年龄也足够长了,会被记入算法当中。你 的网站也有了足够的内容,那么你的网站排名会有一个质的飞跃。
3、Sandbox 效应时期采取的措施?
在 Sandbox 效应时期,我们应该采取有效的措施,尽快从 Sandbox 效应中跳出来,
重新获得排名。以下是几种常用的措施:
相应的返回结果,你可对确知Google 是否正在进行更新,及Google 更新的规律与趋势。
四、Sitelinks
1、什么是Sitelinks
经常使用Google 的人,一定对下面这情况并不陌生:可能搜索某一关键词的时候,会发现排在第一名的结果除了正常的显示标题、描述和网址之外,下面还可能会以链接的方式列出几个该网站其他页面的标题。这种情况下,第 1 名在Google 显示的位置范围差不多是第2 名的二倍,更加吸引注意和彰显行业至尊位。
这种情况在Google 以前出现了很久,但似乎最近才从Google 的网站管理员帮助中心得到了比较详细的解释:
The links shown below some sites in our search results, called Sitelinks, are meant to
help users navigate your site. Our systems analyze the link structure of your site to find
shortcuts that will save users time and allow them to quickly find the information
they’re looking for.
We only show Sitelinks for results when we think they’ll be useful to the user. If the
structure of your site doesn’t allow our algorithms to find good Sitelinks, or we don’t
think that the Sitelinks for your site are relevant for the user’s query, we won’t show
them.
At the moment, Sitelinks are completely automated. We’re always working to
improve our itelinks algorithm, and we may incorporate webmaster input in the future.
显示在有些网站的搜索结果下面的链接,叫做站内链接(Sitelinks ),这些链接是为了帮助用户更好访问你的站点。我们的系统通过分析网站的链接结构,来发现这种快捷方式,以帮助用户接省时间、更迅速找到他们想找的东西的。只有当我们觉得这些站内链接对我们的用户非常有价值的时候我们才会把他显示出来。如果你网站的结构不能让我们的算法找出高质量的站内链接,或者我们认为这些链接跟我们的用户搜索请求并不相关的时候,我们也不会把它们显示出来。
目前,站内链接完全是机器自动生成的,我们也一直在致力于提高我们的站内
链接算法,将来我们可能会让我们的广大网站管理员参与进来。
根据 Google 的说法,Sitelinks 的主要目的在于帮助用户更快速、以更简单的方式找到
所需的信息。当然,Google 只是对部分关键词排在首位的网站才提供 Sitelinks,一般说来,
这类关键词多为网站名称、品牌、商标。
2、如何获得Google Sitelinks?
既然 Google Sitelinks 是通过算法自动得出的,那么肯定有些较重要的因素能够帮助网站获得 Sitelinks,也许,这是下一步网站建设者努力的一个方向,毕竟,与单纯的所谓排名优化相比,让更多的用户点击访问网站才是实现 SEO 目标的真正保障。
首先要在特定的搜索项中排名第一,这是最根本的,因为 Sitelinks 只向在 SERP 中排名第一的网站提供。
使用网站名称或名称中的一部分作为主关键词,将是获得 Sitelinks 的决定性因素。
仔细撰写网页的描述与内容部分,对被DMOZ 收录的网站,应考虑是否使用NOODP 标签。
据大多数人观察,Google Sitelinks 与网页在 SERP 中的点击量有关,也即是说,单纯排名是不够的,必须能在 SERP 页中引起用户的注意并点击。
网站的内部链接也相当重要,并要保证Googlebot 对网站深层页面的访问。此外,通过对大多数 Sitelink 页面的观察,内部链接与导航出现在网页HTML 代码靠前位置具有一定优势。
很多人推测Google Sitelinks 可能使用Google toolbar(工具条)数据来采集数据,包括用户对特定网页的访问情况、收藏情况等等,这就又回到了 SEO 的老问题上,即让用户感到有用,感到有价值而收藏并多次访问。
3、Sitelinks 的其他推测
当然,在现阶段,仍然没有太肯定的关于Sitelinks 实现机制的结论,但一般说来,如果某个网站在 Google 的SERP 中拥有Sitelinks,可以认为Google 将该网站判定为该搜索项方面的权威网站。
此外,在 Sitelinks 中,链接采用的方式使得玩味:SERP 中的其他链接均是直接指向目标址,而 4 个 Sitelinks 则采取类似 JavaScript 实现的 302 跳转,联系到 Google 说明中的 “and we may incorporate webmaster input in the future”,说明了什么?
五、补充材料
1、什么是Google 补充材料
在Google 搜索结果中除了列出网页的网页快照,类似网页以外,有时候 Google 还会把网页标志为补充材料。
到目前为止,Google 并没有太多信息告诉大家补充材料是怎么定义的。在Google 自己的网站管理员指南中所给的官方信息是这样写的:
补充网站是 Google 辅助索引的一部分。对辅助索引进行抓取的限制少于主要索引。例如,一个网址的参量可能使该网站无法被抓取到主要索引中,但仍可能被抓取到我们的补充索引里。
将网站包括其中的索引是完全自动的,没有任何方式可以选择或更改你网站的索引。请放心,包含网站的索引不会影响该网站的PageRank。实际的情况是,被标为补充材料的网页在 Google 搜索结果中一般都会被排在普通网页的后面,所以通常是找不到的。除非关键词是比较长,并且比较具体的时候,补充材料才会出现。
被标为补充材料的网页是在单独的数据库(补充索引)里,不是主索引数据库,在补充索引里的网页被爬行的次数会减少,网页快照的日期也通常都是很旧的。
如果你的网站有很多网页被标为补充材料,在绝大部分情况下都不是什么好事。因为只有在普通结果不够的时候,被标为补充材料的网页才会出现在搜索结果中,自然对网页的排名有很大影响。
2、补充材料产生的原因
被标为补充材料的网页,通常有下面几种情况:
第一,有网址规范化问题。也就是带有 www 和没有 www 的两个网址版本都在数据库中,那么其中一个就有可能被标为补充材料。
第二,有时候已经被删除的网页,也就是实际上应该返回 404 错误的 URL,会被列为补充材料。或者域名已经过期了,也有时会被标成补充材料。
第三,有时候网站管理员在改动网页之后,新旧内容的两个版本的网页都会出现在
Google 索引中。而糟糕的是,其中一个会被标为补充材料。
第四,复制内容网页。很多转载或抄袭的内容会被标为补充材料。因为 Google 也没办法判断哪一个是原创的,所以有时候原创者也会遭殃。
第五,网页上相同或相似的内容太多。比如导航系统占网页内容比例比较大,而正文部分比较小。
从上面这几种情况来看,补充材料在大部分情况下和网页内容重复或类似有关。
如果你的网页被标志成补充材料,有什么办法解决呢?基本上没有什么太好的办法。你只能改正你所能控制的部分,比如说网址规范化问题,正文内容太少等。然后就等着Google 解决他们自己的算法问题吧。
3、补充材料对排名的影响
这个问题就比较复杂,要具体情况具体分析。
像前面讲的,同一个URL 可能出现在不同的数据库中,新版本的URL 可能会出现在正常的主要关键词的搜索中。但是在其他关键词搜索中,它也可能出现在补充材料中。
如果你的网站有很多补充材料,有可能影响排名。但是如果这些补充材料都有一个相应的新的 URL +日期+网页快照版本,对排名的影响就不大。如果这些补充材料没有新的版本,影响就比较大。
补充材料 URL 会不会被更新呢? 会被更新,但是被重新抓取的频率要比较低。当Google 蜘蛛来抓取这个URL 的时候,如果以前使它成为补充材料的那个原因已经不存在了的话,这个URL 可能就被重新归入主数据库。
补充材料会存在多长时间?一般来说补充材料会继续存在长达一年或更长的时间。不过出现补充材料并不是最大的问题,如果你的网站新版本已经都被重新抓取,就没关系了。
书书网手机版 m.1pwx.com