搜索结果显示、爬虫、301重定向小研究
刚才在China Search Engine Watch上看见一个关于多个域名如何让搜索引擎只显示主打域名的讨论,就我的理解,301重定向对搜索引擎是友好的,说301在baidu那里过不了关的,我个人认为也是误传。
baidu spider和googlebot访问网站有一个比较有意思的区别,像我以前的wordpress,用pixian.org/blog和blog.pixian.org都可以访问,我没有做任何301重定向之类的东西,安装wordpress的时候是用blog.pixian.org安装的,就是说blog.pixian.org是主打。分别用baidu和google搜索,搜索结果里面baidu是用pixian.org/blog的方式显示的,google和yahoo用的是blog.pixian.org的方式显示的。就像我们硬盘里的东西,如果说baidu喜欢“我的电脑–C盘–目录1–目录2”这样搜索下去的化,那google和yahoo就喜欢在桌面上建立一个“目录2”的快捷方式。后来我在google的网站管理员上登陆了我的网站,并设置首选域为blog.pixian.org,接着又做了301重定向把pixian.org/blog定到blog.pixian.org,过一段时间以后,包括baidu在内的搜索引擎都是按照blog.pixian.org的方式来显示搜索结果的。可见baidu还是认301的。
我现在这个域名www.onepx.com是今年3月10号开始启用的,11号把blog.pixian.org上所有的内容搬了过来并做了301重定向。内容都在www.onepx.com下,省去了blog.www.onepx.com和www.onepx.com/blog的烦恼。然后到google网站管理员工具里面提交了www.onepx.com,13号在工具面板里就显示“索引状态:您网站的网页包含在 Google 索引中。请参阅索引统计信息。”效率还算蛮高的。此前blog.pixian.org的Page Rank是3,如果下次Google Page Rank再次更新的时候能给www.onepx.com 3/10,那我就算相当满意了,毕竟搬站换域名,对这个肯定是有影响的。刚搬站,用google搜索我以前的一些关键词,老站url和新站url有时候都会同时出现在搜索的结果中,目前还是老站的结果更靠前,但值得欣慰的是都没有被认为是“补充材料”,这是一个很好的开始,如果不做301,我估计即使我从服务器上删除老站所有内容,www.onepx.com也难免会被认为是“补充材料”。等老站从搜索引擎索引中消失的时候,再拿掉301。和搜索引擎对话,越直接越好,除非必要,不要用任何重定向。
以上纯属个人一家之谈,如有错误,还请指正。
