现在很多人都在做搜索引擎优化,大的方向每个人都懂:内容,标题,关键字,外链等等。

但是要想比别人做得更好,就需要看细节的东西了。

本文列出了一些常见搜索引擎优化问题,以及具体的解决方案,希望对相关的人员有所帮助。

1. URL的大小写

这个问题常见于使用.NET技术的网站,事实上是因为网站服务器在配置上就是要响应大写的URL,

它不会重定向或者重写小写的版本。随着搜索引擎在识别标准版本和忽略重复版本的技术上有了很大的进步,

我们也常常不关注这个问题。但是,搜索引擎并不完美,所以我们必须要自己动手。

如何解决:

在IIS 7服务器上有一个URL重写模块,可以帮助解决这个问题。在这个工具的界面上,你可以执行小写的URL,

之后这条规则就会加到网站的配置文件中,从而解决问题。

常见的搜索引擎优化问题,以及解决方法


2. 首页有多个版本

这个问题也是经常会在.NET的网站上碰到,当然其他的平台也会有。

举个例子,我们通常会碰到这种URL:

www.example.com/default.aspx

www.example.com/index.html

www.example.com/home

当然,现在搜索引擎也会帮你解决这个问题,但是最好的做法是第一时间自己解决。

如何解决:

要发现这些网页可能会有点棘手,因为不同的平台有不同的URL结构,所以解决方法有点像猜谜。

你可以用工具模拟蜘蛛爬行你的网站,导出excel表的爬行记录,筛选 标签,搜索网站首页标题,

很容易就可以找到重复的首页。

我比较倾向于301转向,将其他重复页面指向到我们确定的那个首页,

你也可以通过添加rel=canonical标签来解决这个问题。

另一种方案是使用工具,例如Screaming Frog,来模拟蜘蛛爬行,找出指向重复页面的链接。

然后你可以编辑这些重复的页面,指向正确的URL,这样就不需要通过301转向而担心链接权重的降低。

小提示:你可以查看每条URL的谷歌缓存,来看是否有问题。如果谷歌没有发现重复的URL是一样的,

你可以看到这写URL不同的PR和缓存日期。

3. URL结尾的查询参数

在有数据库驱动的电子商务网站,这种问题很常见。也并不是说其他类型的网站没有,

但是一般电子商务网站上有大量的产品属性和筛选选项,如颜色,大小等。在这种情况下,

用户点击的URL在搜索引擎优化方面都比较友好,

但是可以常常看到有很多链接的结尾是像我下面的例子这样的:

www.example.com/product-category?colour=12

在这个例子中,某种颜色是作为筛选产品类别的依据。这种筛选方法对于用户来说是很好的,

但是对搜索引擎就不好了,尤其是有时候客户并不是用颜色来搜索某个特定的产品。

在这种情况下,对某些关键词来说,这个URL就不是一个好的登陆页。

当很多的参数结合起来的时候,可能会导致蜘蛛资源被用尽。更糟糕的是,有时候尽管参数的位置不一样,

但是却返回相同的内容,例如:

www.example.com/product-category?colour=12&size=5

www.example.com/product-category?size=5&colour=12

尽管路径不一样,但是这两个URL返回的是相同内容,搜索引擎会认为这些页面是重复内容。

请记住,谷歌是根据你网站的PR值来分配蜘蛛资源的。请确保这些蜘蛛资源有充分的利用。

如何解决:

在继续之前,我们要解决另外一种常见的相关问题:URL可能对搜索引擎不友好是因为他们不是数据库驱动的。

在这个特殊情况下,我并不担心以上的问题,我更担心的是蜘蛛资源浪费和一些不需要的页面被索引了。

首先要解决的是哪些页面是要蜘蛛爬取和索引的,这个取决于你的关键字研究,

你需要交叉引用数据库中核心关键词的属性。

在电子商务网站,每个产品都有其关联的属性,这也是数据库的一部分。下面是一些常见的例子:

Size (i.e. Large)  尺寸(大)

Colour (i.e. Black) 颜色(黑色)

Price (i.e. £49.99) 价格 (£49.99)

Brand (i.e. North Face) 品牌(North Face)


常见的搜索引擎优化问题,以及解决方法


你的工作是要找出哪些属性是关键词的一部分,用户可以找到这个产品。

还要确定用户需要使用哪些属性的组合。这样做后,你可能会发现一个搜索量很高的关键词

是North Face + waterproof jackets(防水夹克)。

这时,你需要做一个被爬行和索引的North Face + waterproof jackets登陆页。

还要确保数据库属性中有一个对搜索引擎友好的URL,

不是"waterproof-jackets/?brand=5" 而是"waterproof-jackets/north-face/.

"还要将这些URL添加在网站的导航结构中,

PR值可以传递,用户也很容易找到。

另一方面,你可能会发现Northface+Black这个组合的关键词搜索量很低。

你也就不会想要Northface+Black这两个属性的页面被爬行和索引。

如果你已经清楚哪些属性是要被索引的,哪些不需要,下一步行动要不要开始取决于URL有没有被索引。

如果URL还没有被索引,最简单的方法是把URL结构添加到robots.txt文件中。

要完成这个可能需要多尝试一下RegEx,请确保RegEx是正确的来以防万一。

此外一定要使用谷歌的管理员工具Fetch, 需要注意的是,把已经被索引的URL添加到Robots.txt文件中不会让他们从索引库中被删除。

如果URL已经被索引,我们需要用rel=canonical标签来解决。如果不巧网站正在开发中,

你不能进行修改的工作,你会像上面遇到的情况一样不能解决核心问题,这时候,

rel=canonical标签可以帮助你延迟一点解决问题。

把rel=canonical标签添加到你不想被索引的URL上,然后指向不想被索引的相关URL。

4. 软404错误

这种情况通常不在预料中,用户没有觉得什么不一样,但是搜索引擎蜘蛛知道不同之处。

发表评论 已发布 0

还可以输入 800 个字
 
 
评论 打印