搜索引擎优化原创内容
新站点不需要“提交”到搜寻引擎才能登记上市。一个来自于以建立好的、其他站点的简单链结就会让搜寻引擎拜访新站点,并且开始‘爬’过该站内容。它可能得花几天甚或几周从这样一个已建立站点取得连结,并使所有主要搜索引擎开始拜访并索引新站点。
一旦搜索引擎发现了新站点,它一般将拜访和开始索引该站,直到所有标准的 <a href> 超连结被链结的页索引到为止。只能透过Flash或JavaScript才能拜访的链结可能不会被蜘蛛机器人找到。
当搜索引擎的蜘蛛机器人爬过一个站点时会取决相当数量的不同因子,并且该站的许多页可能不会被索引到除非它们网页级别、连结、或流量增加到一个程度。从站点的根目录到该页的距离,以及其它比重考量,也许也是决定是否该页得到检索的因素。Cho et al.(Cho et al. 1998) 描述了哪些页会被拜访、哪些会收入搜寻引擎索引的决定标准。
网站员可透过在网域根目录里标准robots.txt档案指示蜘蛛机器人不索引某些文件或目录。标准的实现要求是搜索引擎在拜访这个网域时参考这个文件,虽然搜索引擎的蜘蛛机器人当它拜访某站点网页时将保留这个文件的快取拷贝,并且更新速度没像网站员那么快。网站发展人员可能使用这个特性防止某些页,譬如购物车或其它动态、特定使用者的内容出现在搜索引擎结果中,并且防止机器人进入死循环和其它机器人陷阱。
对于某些有偿提交的查寻引擎(像雅虎),支付象征性费用提交也许会节省一些时间,虽然雅虎有偿提交方案不保证提交人/公司包括在他们的查寻结果中。
搜寻引擎优化的白帽法包括遵循搜寻引擎哪些可接受哪些不能接受的指导方针。他们的建议一般是为用户创造内容,而非搜寻引擎、是让这些内容易于被蜘蛛机器人索引、并且不尝试对搜寻引擎系统耍花招。经常网站员于设计或构建他们的网站犯了致命错误、疏忽地"毒害" 该站以致排名不会很好。白帽法优化员企图发现并纠正错误,譬如机器无法读取的选单、无效链接、临时改变导向、或粗劣的导引结构。
因为搜寻引擎是以文本为中心,许多有助于网页亲和力的同样手段同样便利于搜寻引擎优化。这些方法包括最佳化图形内容、包括ALT 属性、和增加文本说明。甚至Flash动画可于设计该页时包括替代性内容──这本来用来给访客无法阅读Flash的环境用的──来帮助优化。
这里是一些搜寻引擎认为适当的方法:
* 在每页使用一个短、独特、和相关的标题。
* 搜索引擎优化编辑网页,用与该页的主题有关的具体术语替换隐晦的字眼。这有助于该站诉求的观众群,在搜寻引擎上搜寻而被正确导引至该站。
* 在该站点增加相当数量的原创内容。
* 使用合理大小、准确描述的汇标,而不过度使用关键字、惊叹号、或不相关标题术语。
* 确认所有页可透过正常的链结来访问,而非只能透过Java 、JavaScript或Macromedia Flash应用程序访问。这可透过使用一个专属列出该站所有内容的网页达成:网站地图(SiteMap)
* 透过自然方式开发链结:Google不花功夫在这有点混淆不清的指南上。写封电子邮件给网站员,告诉他您刚刚贴了一篇挺好的文章,并且请求链接,这种做法大概很可能为搜寻引擎所认可。
* 参与其他网站的网络集团(译按:web ring 指的是有相同主题的结盟站群)──只要其它网站是独立的、分享同样题目、和可比较的品质。
垃圾索引(Spamdexing)意指透过欺骗技术和滥用搜索算法来推销毫不相关、主要以商业为着眼的网页。许多搜索引擎管理员认为任何搜索引擎优化的形式,其目的用来改进网站的页排名者,都是垃圾索引。然而,随时间流逝,业界内公众舆论发展出哪些是哪些不是可接受的、促进某站的搜索引擎排名与流量结果的手段。
因为搜寻引擎以高度自动化的方式运作,网站员通常可以利用某些未被搜寻引擎认可的手段、方法来促进排名。这些方法经常未被注意除非搜索引擎雇员亲临该站点并注意到不寻常活动、或在排名算法上的某个小变化导致站点丢失以过去方式取得的高排名。有时某些公司雇用优化顾问评估竞争者的站点、和"不道德的" 优化方法向搜寻引擎报告。
垃圾索引经常与合法的、不介入欺骗的搜寻引擎优化技术搞混。垃圾索引专注于让该网站得到更多的曝光率,而非他们选用的关键词,这导致令人不满的搜寻结果;相对的,优化则专注于他们希望得到的排名,基于特定目标关键字上;这导致令人满意的搜寻体验。
当这些不好的垃圾索引被发现时, 搜寻引擎也许会对那些被发现使用不道德的优化手段者采取行动。在2006 年2月,Google拿掉了BMW 德国站和Ricoh 德国站,因为他们用了这些方法。
斗蓬法(cloaking)简单来讲就是网站站长用了两版不同的网页来达到最佳化的效果。一个版本只给搜索引擎看,一个版本给人看。搜索引擎说这种做法是不正规,如发现,该网站会永远从搜索引擎名单中被剔除。
关键字、搜索引擎优化隐密字 (hidden text with keyword stuffing) 是另外一欺骗搜索引擎的做法。通常是指设定关键字的颜色和网页背景颜色一样,或透过 css hidden attribute (隐密特性) 来达到优化效果。这种做法一旦被Google发现,遭遇也会是该网站从Google的数据库中除名!
相关信息: