1. 首页
  2. SEO技术
  3. 入门教程

SEO搜索引擎基础设计理念【Google】

因为目前搜索引擎优化无法完全解读网页内容,所以网页设计时需要以搜寻蜘蛛容易索引方式制作。对搜寻引擎来说,它们看到的网页跟我们并不相同。在这章节中,我们将把重点集中在网站的技术层面上,这样的网站架构,在搜寻引擎与用户的眼中才会相似。可以把这个章节分享给程式设计师,前端工程师,和网页设计师,让所有参与网站制作的人都有相同知识。

要制作能被索引的内容

为了在搜索引擎列表有更好的表现,重要的内容请使用HTML格式。就算搜寻引擎蜘蛛抓取的技术越来越进步,Flash,Java,以及其它非文字的内容通常还是会被蜘蛛忽视或认为不重要。若想让内容如实呈现给访客,最简单的方式就是使用HTML文字给搜寻引擎抓取。但是,更棒的方式是呈现给搜寻引擎的同时又保有视觉设计的网站。

以下为几种方式:

  • 1.图片用Alt属性。指派gif,jpeg或png格式的图片”alt attributes” in HTM为了便于搜寻引擎解读,在这些图片加上一些文字叙述。
  • 2.做网站内导航性质的搜索框与内部连结。
  • 3.为Flash与Jave Plug-ins增加文字叙述版本。
  • 4.提供视频与音频的文字复本,以便于这些说明文字被搜寻引擎索引。

「我的网页无法被收录。我为了Juggling Pandas做了一个Flash,但却无法在Google找到它。发生什么事了?」

用搜寻引擎的方式检视您的网站

很多网站在「内容索引」有着很大的问题,所以网页设计制作完成之后重复检查是必需的。通过检视工具,例如:Google’s cache(页库存档), SEO-browser.com, and the MozBar,您可以检阅您的网页内容哪些可以被搜寻引擎读取与索引。看看您目前开启的网页在Google是如何显示的吧?看看相同的网页在搜寻引擎与在您眼中有何不同。

以下Moz用Juggling Pandas做例子:​

 

SEO搜索引擎基础设计理念【Google】

哇!这就是我们的样子吗?

使用Google catch的功能,我们可以发现Google所看到的JugglingPandas.com首页并没有我们来的丰富,而这是因为网站的一些构造无法被搜寻引擎解读。

以下Moz用Axe Battling Monkey Blog做例子:

 

SEO搜索引擎基础设计理念【Google】

嘿!有趣的小游戏跑那儿去了?

呜嗯……透过Google catch,我们可以发现右上方显示的网站真是空白的可怕。没有文字说明,也看不到小游戏。网页设计时,这个网站全部是用Flash建造,但很可惜的,这也意味着搜寻引擎无法索引到任何文字,更别说Flash小游戏。没有使用HTML,这个网站在搜寻引擎上的排名可是会非常难看。

最明智的做法是除了检查文字内容,同时也使用SEO工具仔细检查网站在搜寻引擎的显示内容。不只是图片,下面即将叙述的「连结」也​​适用这样的做法。

要有能被抓取的连结构造

正如搜寻引擎需要抓取关键字来分类网站内容,网页也需要有正确的连结让搜寻引擎可以第一时间的抓到它们,所以拥有一个能够被搜寻引擎蜘蛛爬行抓取的正确连结构造非常重要。但也有许多网站会犯这致命性的错误,把连结建立在蜘蛛无法进入的地方,而这也使得网页无法被索引,隐藏在网络世界中。

以下,我们用图片来示意发生这问题的原因:

 

SEO搜索引擎基础设计理念【Google】

 

在上面的图片,Google蜘蛛已经爬到了页面A且看到了通往页面B与E的连结。但是因为不正确的连结构造,就算页面C与D很可能是这个网站里最重要的页面,蜘蛛还是无法爬向页面C或D(或着是说,蜘蛛有可能根本不知道有页面C和D的存在)。若Google蜘蛛找不到,这也代表着页面C与D并不存在,就算有再好的内文,关键字选的再精准,网页设计在美观,和再聪明的行销手法,只要蜘蛛无法爬行到,一切都是白搭。

来解剖连结架构吧!

 

SEO搜索引擎基础设计理念【Google】​​

 

网页上所有可供点击,让访客从一个网页移动到另一个网页,呈现的形式包含图片,文字,或是其他物件,就是所谓的连结。而连结是网际网络中最基本的元素,网页设计上最常听到的词就是「超连结」。在上图中, “<a” 代表着连结的开始,而这连结会告诉浏览器(以及搜寻引擎)这个连结要去哪。在这个例子,这个连结要去http://www.jonwye.com。在这之后,访客可以看到的文字在SEO搜寻引擎最佳化的世界中称做锚点文字,用来介绍连结的目的地。以这个网站为例,网站的目的地是Jon Wye的客制化皮带,所以在锚点文字显示「Jon Wye’s Custom Designed Belts」,最后的“</a>”则是连结的结尾,用来防止页面上的其他语法与之相连结而产生错误。

以上是一个连结的最基本形式,且这是搜寻引擎完全可以理解的方式。搜寻蜘蛛会知道它们须把连结放入资料库,且用它来计算网页的搜寻独立(Query-Independent)的变量(类似Google的PageRank),并根据结果分类索引。

搜寻独立(Query-Independent)搜寻蜘蛛在索引后进而分类一个新网页前,会先以网站内的关键字与网页连结预估网站的重要性与价值,与用户的搜寻习惯是不一样的。

来看一下网页无法被读取的常见原因吧!

● 网页使用线上提交表格

 

若您的网站最初设计时是需要访客完成线上表格登入后才能够进入,那搜寻引擎可能就无法看到那些被保护的内容。表格的形式有可能是密码保护的登入页或是问卷调查。不管是那种形式,搜寻蜘蛛一般不会尝试去提交表格,所以任何经由表格登入才能够进入的页面,蜘蛛都不会去抓取。

 

● 使用无法剖析的JaveScrip连结

 

若是您使用JaveScrip形式的连结,您会发现搜寻引擎要嘛不抓取,要嘛就是给崁入的连结很低很少的权重。若您想让蜘蛛抓取,请用标准的HTML连结替代(或着用HTML搭配)。

 

● 连结指向被Meta Robots tag或是robots. txt封锁的页面

 

Meta Robots tag或是robots. txt两个都是网站管理员设定禁止搜寻蜘蛛进入特定网页的程式。但是要小心,虽然许多的网站管理员企图为了防止垃圾蜘蛛进入而使用这两个指令,但若使用不当可能整个网站都无法让蜘蛛进入。

 

● 网页使用Frames或iframes

 

网页设计技术上来说,Frames与iframes形式的连结是能被搜寻引擎抓取的,但两者对于搜寻引擎来说都存在着对其组织与追踪的结构性问题。除非您知道搜寻引擎如何索引与追踪Frames所连结的网站内容的专业人士,不然还是别用的好。

 

● 蜘蛛不使用搜寻框

 

虽然这跟上述警告的线上表单相关,但这太普遍了必须另外提出来。有一些网站管理员以为在网站内放一个搜索框,搜寻蜘蛛就会找到访客搜寻的内容。但很可惜的,蜘蛛不会使用搜索框找访客搜索的关键字,只要没做好网站连结,这样的页面就永远都被隐藏,不被抓取。

 

● 使用Flash,Java,以及其它的plug-in

 

上面的例子中,在Juggling Panda网站内崁的连结就是最好的例子。虽然每只熊猫都是通往另个网页的连结,但因为蜘蛛无法利用这类型的连结格式通往其它页面,使的这些页面对搜寻引擎来说是隐形的。

 

● 网页拥有过多连结

 

搜寻引擎在网页上只会抓取固定数量的连结。这个限制是为了防止垃圾连结与保护排名的正确性。若网页上有过多的连结,就有「不是所有连结都会被抓取与索引」的风险。

 

只要你避免掉入这些陷阱,您就有个干净,能被索引的HTML连结让蜘蛛能够简单进入的网站。

Rel=”nofollow

Rel=”nofollow”可以用下面的语法:

<a href=”http://moz.com” rel=”nofollow”> Lousy Punks! </a>

 

连结可以有很多属性,搜寻引擎几乎全都忽视了,除了rel=”nofollow”属性。在上面的例子,加上rel=”nofollow”在连结内,代表着告诉搜寻引擎这个网站拥有不值得信任的内容,让搜寻引擎不要继续往下检索,避免网页权重被扣分。

 

Nofollow,按字面上来看,是下达指令让搜寻引擎不要跟踪这个连结(虽然有些还是会去跟踪)。Nofollow属性一开始是为了帮助停止部落格,留言版的垃圾自动回覆和连结,但演变到了现在,变成了告诉搜寻引擎降低这个连结原本的价值。每个搜寻引擎对Nofollow的连结判别都有些微不同,但很显然的Nofollow的连结不会比一般的连结拥有更多权重。

难道nofollow的连结不好吗?

虽然Nofollow的连结与Follow连结相比较下并没有什么价值,但它仍是一种可以配置多样连结的普遍方式。一个拥有很多对内连结的网站通常也有很多的Nofollow连结,而这也并不是一件坏事。实际上,Moz的排名因素分析显示,与排名较低的网站相比,拥有较多Nofollow对内连结的网站通常往往拥有较高的排名。

Google

Google声明在大多数的情况下,他们不会跟踪Nofollow的连结,这些连结也不会被传递PageRank或锚点文字的价值。实际上,使用Nofollow连结促使Google把目标连结放在整体网页范围外。Nofollow的连结没有任何权重,只被当作是HTML文字(也就是说连结不存在)。尽管如此,许多网站管理人认为就算是从具有权威性的网站来的Nofollow连结,例如维基百科,仍然也是可提高自身网站信任度的。

Google对nofollow的定义

Bing & Yahoo!

Bing, 提供Yahoo搜寻引擎技术,也曾声明它们的搜寻引擎蜘蛛会抓取网站内的Nofollow连结,但并不会包含其价值,也相对的对网站排名没有任何效果。

Bing对nofollow的定义

 

关键字的使用和目标锁定

关键字对搜寻的过程十分重要,它是建构搜寻过程的基石与语言。实际上,关键字是整个资讯检索科学(包括网路搜寻引擎,例如:Google)的根基。当搜寻引擎抓取网页时,搜寻引擎会依据网页内的文字内容(关键字)做分类,而不是把内容全放在同一个含有25亿网页的资料库。所以搜寻引擎有数亿万个小资料库,而每个小资料库都是特定的关键字或词, 可以让搜寻引擎在最快的速度进行检索。

 

显然的,假如您想让您的网页能在「狗」这个关键字的搜寻结果排名出现,最好确保「狗」这个关键字在您的网页是容易被搜寻引擎抓取的关键字。