SEO

Drupal SEO 入门

Drupal 核心模块中就包含了可选的 SEO 优化选项,此外还有一些有益的 Drupal 的第三方模块,他们都可以帮助 Drupal 的使用者提升搜索引擎的排名。本文就将介绍一些 Drupal SEO 时必装模块和相应的设置,希望对您有所帮助。但是这只是 Drupal SEO 的开始…… 

  • 开启简洁链接(Clean URLs)
  • 开启 Path 模块 (从 Drupal 4.3 开始进入 Drupal 核心模块)

    Path 模块可以让您通过添加路径别名(path alias),来达到自定义链接名的效果。例如 http://www.mypetal.com/node/7 可以定义为 http://www.mypetal.com/library/drupal-seo 。

Drupal SEO 常用模块

本文罗列了 Drupal SEO 常用模块,定期更新中……

Calais 模块介绍

Calais?我一天就可以收到关于它的12,238封电子邮件。快点把它关掉(Buzz off)。

不不,不是 Cialis (西力士:伟哥2代),看清楚是 Calais。它是一种免费的(就成本而言)对自然语言的处理程序,一种富语义的元数据(rich semantic metadata),一种网络服务,等等诸如此类的东西(thingy: 东西)。切入正题(cut to the chase),它主要从您的网站读取文字信息,基于同样使用这项服务的人从其它多得数不清(bazillions)的网站读到的文字,它能为您通过计算自动得出(figure out)一些敏感的标签(sensible tags),这样您的编辑人员就可以省去这项工作。

寻找属于您的利基市场

如果您急切需要在 web 上展现您的生意,那么您可能最先想到的是一个网站。让我们暂时先不考虑积极的搜集和与将来网站设计有关的一系列令人头疼的问题,并假设您对您的网站已经有了一个完善的构思,并且有能力来实现它。现在开始就要认真考虑(be get down to doing/n.)文案,您应该很清楚地知道一件事就是网站必须用一种最切实可行的方式来介绍您的生意。

“oh,我在广告单页上花了笔小钱(时间)。现在,我仅仅需要把我精美宣传手册和广告页上的内容直接搬到网页内容里!”这个主意好吗?非也。因为当您看着或者是阅读这些资料时,无论您的广告做得有多么棒,它们可能在一些特定词句的结合上缺失关注。

您可以把您的广告内容作为一个起点,但是一般来说:对各方都有利的网页内容很多地方都需要重写。网站文案的最终目标是以一定的、可以满足(至少不要让他们感到厌倦)于人们的眼球的频率使用您的关键字,同时也是别人使用搜索引擎时会查找的关键字。更重要得是,您应该知道关键字放在一个网页的哪一部分效果最好。

SEO Drupal .htaccess 文件(适合multi-site)

如果要对基于 Drupal 建立的网站进行 SEO (Search Engine Optimization——搜索引擎自然结果优化),那么就一定要尽量避免网站内的重复页面。因为当搜索引擎的爬虫抓取到大量的重复页面时,搜索引擎就会降低对网站页面的打分,当然这种影响可能并不太容易被察觉。

当我们使用 Drupal 时通常会碰到这样的问题,例如:页面 http://www.mypetal.com/node/12 和页面 http://mypetal.com/node/12 显示的是相同的内容。或许您会认为这是大惊小怪,但事实上这是两个独立的页面,它们的内容重复,这一点对 SEO 不利。好在 Drupal 开发者早已为我们考虑到了这点,只要做个略施小计就能唤醒这个功能:) 

注意:本文只针对拥有一级域名的网站,二级域名的网站不存在这个问题。

Drupal 多站点(multi-site) robots.txt 配置攻略

Drupal 凭借其强大的扩展性备受使用者的亲睐,而且 multi-site 配置更是一绝(multi-site 是指只用一套 Drupal 程序,同时结合域名的设置,就可以建立多个网站)。本文主要讲述如何在 multi-site 下为每个网站配备的独立 robots.txt 文件。

Multi-site 下 robots.txt 的困惑

在使用 multi-site 技术建立多个网站时可能会碰到这样的问题:一个网站希望被搜索引擎收录,允许爬虫抓取网页,而同一个 Drupal 系统下的另一个网站出于某种原因不希望被搜索引擎爬虫抓取网页。举例来说:网站1 mypetal.com 希望网页被 Google 收录,但是 网站2 car.mypetal.com 是一个案例演示网站,期中的数据不希望被收录到 Google 中。但是当我们打开 Drupal 根目录时就会发现只有一个 robots.txt 文件,这就意味着所有站点都是使用这个 robots.txt,如果修改就会影响到全部站点。

好在我们不是第一个碰到这个问题的人,只要善用搜索功能,不论是搜索 drupal.org 还是 google.com 相信都会找到满意的答案。下面就是我结合自己的搜索结果整理的两个解决方案。

修改 Drupal 的 robots.txt 文件

在 SEO (Search Engine Optimization——搜索引擎优化) 时关键的一点是为搜索引擎的爬虫提供一个好的、干净的链接地址,这就意味着在一个网站内不能有内容重复的两个或以上不同链接地址的页面。 然后这个问题在对 Drupal SEO 时尤为突出。而且如果使用的第三方模块中存在一些不合理的链接,那么这个问题就会更加严重了。

这时我们就要用到 robots.txt 这个文件,它的作用是限制爬虫机器人抓取文件范围。从 Drupal 5 时代起,Drupal 安装包里就包含了这个文件了,它的位置在安装包的根目录下。但是它还不够完美,需要一些改善。

修改Drupal 的默认 robots.txt 文件

抓取延时

 第一步要做的就是注释掉 Crawl-delay 这行。除非您的网站规模很大,或者备受爬行机器人的困扰,如果不是这样,那么不需要这行。

Crawl-delay: 10

在 Robots.txt 中,下面提及到规则都可以帮助减少爬虫收取重复内容的数量。

Drupal SEO

现在的网站,就算拥有优质的网页内容也不能保证一定就能带来网页流量。SEO(Search Engine Optimization)在如今的网站发展中起到关键性的作用。