搜搜Soso的搜索技术目前还真不行
--James Qi 2009年10月20日 (二) 11:15 (CST)
搜搜从9月初推出自己开发的搜索引擎后,我们网站来自Soso的流量就下降了好多,给sosospider@tencent.com发邮件要求恢复爬行、收录后,这段时候我们也看到Sosospider恢复了频繁爬行我们的网站,而且发现收录量已经大大增加了,用site:www.18dao.com等关键词“搜索到约148,000项结果”,每天新收录的页面也不少,但仍然有两个比较明显的问题:
1、Soso部分收录页面的URL很奇怪,例如http://www.18dao.com/index.php?oldid=149962&title=18dao:%E7%83%AD%E9%97%A8%E5%86%85%E5%AE%B9 ,都不知道是怎么会出现这样的链接,而http://www.18dao.com/robots.txt 中的“Disallow: /*&oldid=”还制止不了,就改为“Disallow: /*oldid=”才能禁止爬行这样的URL
2、本站关键词在Soso排名很差,虽然Soso对我们的网站收录量不小了,但从Soso来的流量明显比9月份以前Soso使用Google搜索技术的时候少了很多,使用很多关键词查询我们网站的内容都在前几页找不到,这和在Google、Baidu中的情况相差很大,不知道这是不是因为恢复爬行后把我们网站当成了新网站、经过“沙盒”过一段时间会正常?
我们几个网站在Soso中都存在上面说的两个问题,我又给sosospider@tencent.com写去了邮件,希望得到回答。
我们采用MediaWiki的网站只有Google的收录很好,Baidu以前也出现过收录奇怪URL的情况,我们不得不修改robots.txt进行限制和引导,现在Soso看来也有类似问题,甚至更奇怪的一些问题,在搜索引擎的“爬行、索引、展示”中的第一个步骤就显得技术上差了。毕竟搜索引擎技术可不是一朝一夕炼成的,Soso还要花长时间来积累。
标签:搜搜、Soso、搜索、Sosospider。 |
相关内容:
|