Feb 06, 2013 PHP

搜索引擎工作过程与 SEO

        搜索引擎的工作的过程非常复杂,而简单的讲搜索引擎的工作过程大体可以分成三个阶段。         (1)、爬行和抓取:搜索引擎蜘蛛通过跟踪链接访问页面,获取页面 HTML 代码存入数据库。         (2)、预处理:搜索赢球对抓取来的页面数据文字进行文字提取、中文分词、索引等处理,以备排名程序调用。         (3)、排名:用户输入关键字后,排名调用索引库数据,计算相关性,然后按一定格式生成搜索结果页面。 一、爬行和抓取 爬行和抓取是搜索引擎工作的第一步,完成数据收集任务。 1.1、蜘蛛         搜索引擎用来爬行和访问页面的程序被称为蜘蛛(spider),也称为机器人(bot)。 各大SEO引擎搜索的蜘蛛会一次又一次访问爬取我们站点的文章内容,也会耗费一定的站点流量,有时候就必须屏蔽一些蜘蛛浏览我们的站点。掌握各大搜索引擎蜘蛛爬虫,对我们开展网站SEO优化具有挺大作用;这里搜集了各大搜索引擎的蜘蛛爬虫UA,便于需要时查看。 1.2、蜘蛛代理名称 1.2.1、百度蜘蛛:BaiduSpider         常见的Baiduspider和Baiduspider-image(抓取图片),百度公司还有其它几个蜘蛛:Baiduspider-video(抓取视频)、Baiduspider-news(抓取新闻)、Baiduspider-mobile(抓取wap),都不常见。         百度蜘蛛爬虫UA:         PC端:Mozilla/5.0 (compatible; Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)           移动端:Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46…

Jan 01, 2013 PHP

SEO 常见术语

导航         请确保你的网站导航(网址导航)都是以 html 的形式链接。所有页面之间应该有广泛的互联,要满足站内任何页面可以通过回连到达主页,如果无法实现这一点,可以考虑建立一个网站地图。   首页         网站的首页(home 或 index 页等)应该采用文本的形式,而不是 flash 等。这个文本里面要包含你的目标关键字或目标短语。   标签         <title> < /title>这是标题标签,里面应当包含你最重要的目标关键词。         <keywords></keywords>这是关键词标签         <description></description>这是描述标签   PR 值算法         PR值全称为PageRank,用来表现网页等级的一个标准,级别分别是0到10,是Google用于评测一个网页“重要性”的一种方法。         PR(A) =(PR(B) /L(B)+PR(C) /L(C)+PR(D)/L(D)+...+PR(N)/L(N))*q+(1-q)         其中,PR(A):指网页 A 的佩奇等级(PR 值), PR(B)、PR(C)...PR(N)表示链接网页…

Jul 06, 2012 PHP

搜索引擎的排名原理

        要了解搜索引擎优化,首先了解搜索引擎的基本工作原理。搜索引擎排名大致上可以分为四个步骤。一、爬行和抓取        搜索引擎派出一个能够在网上发现新网页并抓取文件的程序,这个程序通常被称为蜘蛛或机器人。搜索引擎蜘蛛从数据库中已知的网页开始出发,就像正常用户的浏览器一样访问这些网页并抓取文件。        并且搜索引擎蜘蛛会跟踪网页上的链接,访问更多网页,这个过程就叫爬行。当通过链接发现有新的网址时,蜘蛛将把新网址记录入数据库等待抓取。跟踪网页链接是搜索引擎蜘蛛发现新网址的最基本方法,所以反向链接成为搜索引擎优化的最基本因素之一。没有反向链接,搜索引擎连页面都发现不了,就更谈不上排名了。        搜索引擎蜘蛛抓取的页面文件与用户浏览器得到的完全一样,抓取的文件存入数据库。二、索引        搜索引擎索引程序把蜘蛛抓取的网页文件分解、分析,并以巨大表格的形式存入数据库,这个过程就是索引。在索引数据库中,网页文字内容,关键词出现的位置、字体、颜色、加粗、斜体等相关信息都有相应记录。        搜索引擎索引数据库存储巨量数据,主流搜索引擎通常都存有几十亿级别的网页。三、搜索词处理        用户在搜索引擎界面输入关键词,单击“搜索”按钮后,搜索引擎程序即对输入的搜索词进行处理,如中文特有的分词处理,对关键词词序的分别,去除停止词,判断是否需要启动整合搜索,判断是否有拼写错误或错别字等情况。搜索词的处理必须十分快速。四、排序        对搜索词进行处理后,搜索引擎排序程序开始工作,从索引数据库中找出所有包含搜索词的网页,并且根据排名计算法计算出哪些网页应该排在前面,然后按一定格式返回“搜索”页面。        排序过程虽然在一两秒之内就完成返回用户所要的搜索结果,实际上这是一个非常复杂的过程。排名算法需要实时从索引数据库中找出所有相关页面,实时计算相关性,加入过滤算法,其复杂程度是外人无法想象的。搜索引擎是当今规模最大、最复杂的计算系统之一。        但是即使最好的搜素引擎在鉴别网页上也还无法与人相比,这就是为什么网站需要搜索引擎优化。没有 SEO 的帮助,搜索引擎常常并不能正确返回最相关、最权威、最有用的信息。

Jun 06, 2012 PHP

新手遇到这些快照难题 该如何解决?

        很多时候快照的变化会预示着网站近期的一些走向,根据操作实例来讲,如果你的快照无缘无故的回档甚至消失,那么网站八成是被拔毛了。也正是因为快照有着这样的预示作用,使得很多新手朋友对于快照总是有着这样或是那样的敏感情绪。鉴于此,我总结了一些快照出现的问题分享给大家,希望可以帮到同为站长的你我。当然以下也只是我个人的看法,欠妥的地方大家一起讨论。一、快照更新的频率与网站关键词排名有无直接的关系?        相信这是很多站长最关心的问题,因为在实际的操作过程中我们会发现,如果自己的快照时间变化无常,时而停滞不前,时而延迟数天,那么自己的网站就一定会产生一定的影响。要不关键词掉落,要不直接被 K 掉。因此这就让很多站长变得犹如惊弓之鸟,盲目的以为只要快照不正常,那么网站就会产生大的问题。其实在百度官方定义中,快照只不过是纯文本文档,是网站无法打开之际提供给用户的一种预览界面,并无其他附加值。因此盲目的将快照更新频率与网站排名挂钩有点不太合适。不过通过正常的操作来看,如果你的站点正规,更新内容及时且高质,并且能够做好外链建设和流量的引入,那么快照会保持一种迅捷的更新频率。所以说快照更新的快照一定程度上呈现出你最近的网站状况。二、快照回档就一定会是 K 站的节奏吗?        相比于快照更新不正常,首页快照回档才是更恐惧的事情。因为在很多老站长看来,快照回档就是 K 站的前奏,没有犹豫和商量。其实我觉得这事情未必就直接影响,因为在我看来,每个网页在搜索引擎那都会有若干个备份,在一些比较特殊的情况下比如百度算法调整阶段,很容易会出现显示效果的差错,导致之前的备份被调用出来,这就出现了咱们所担心情况的发生,但是当一切企稳之后异常现象又会再次消失。因此只要我们自身网站没有问题,不存在作弊手段,那么无伤的可能性还是比较低的,但对于那些本身内容更新就不及时、存在作弊建站手段的网站来说,快照回档显然是自身质量无法满足当下爬取要求,回档其实更像是 K 站的前兆,毕竟有因才有果,网站硬件实力才是我们拒绝盲目对待快照的最坚实基础。三、快照与首页不匹配怎么办,难道有问题?        不知道大家出现过这个问题没有,当你点击首页快照的时候,你会发现出来的页面与首页并不相关,而是一个其他的页面,如果出现这种情况是不是就意味着网站首页已经被 K 掉,只剩下内页了呢。其实问题不能这么简单的分析,如果我们看到快照与着陆页位置不匹配,那么是一定存在问题的,但是不一定代表不能补救。如果你的关键词排名还在,那么问题就可能预示着两个信息,其一,网站本身的访问稳定性不够,致使蜘蛛无法爬取索引正常的内容,其二,原创力度太低,采集内容与主页一共被监察。所以说当出现这种问题的时候,大家要先根据自己网站的情况进行一番彻底的分析,然后依照问题出现的点进行布置和补救,加大原创力度和内容建设,做好外链指向等等,虽然问题不会直接导致 K 站,但是未雨绸缪,提前打个预防针也还是不错的。四、首页快照迟迟不放出来是不是就等于原创力度不够?        对于新站,一般会有一个考察期,在这个阶段中很多网站都是先放出内页,再放出首页,所以说在这个阶段你会发现,你的站点内页和首页的更新频率是不相同的,有些时候内页快照的更新更及时。当出现这种问题的时候,不要盲目的以为自己的首页重复度过高导致的搜索扣分,然后盲目的做内链指向首页,其实只要网站空间运行稳定,首页原创度中等偏上,一些属性不存在过多的雷同,那么首页快照的释放就一定是早晚的事情。大家没有必要过多的去担心和恐惧。但是在这个过程中有时候还会出现另外一种情况,那就是首页更新及时,内页倒是收录少,更新缓慢,这种情况其实并不被大家所重视,当出现这种情况的时候我觉得这多与网站建设有关,多发一些内页的高质量链接,不要总把外链指向首页就能解决相应的问题,其实就是增加下内页的权重。五、对于快照,我们该以怎样的心态对待?        关于快照,就像前面所说,它只是一个存档,一个应急备案,大家对它的变化没有必要过分敏感,之所以这么多“预言”变成现实,其主要因素还在于你的网站站点未必成熟和坚挺。如果网站建设出现问题,原创不够,稳定性不高的话,那么说什么都没用,你肯定在搜索引擎那得分不高,被 K 站也未必是快照引起的。因此打铁还需自身硬,为了得到更好的关键词排名,我们应该做好网站是首要,不过对于快照我们还是要有一个认知,那便是快照更新快代表我们在内容上有一定的优势,蜘蛛很青睐,因此在日后的操作中要更加注意内容的补充力度和频率。       对于快照我只是说出了自己的看法,或许可以给同为站长的朋友们些许帮助。

May 05, 2012 PHP

如何培养 SEO 思维

        无论是专业的 SEOER 还是个人站长,都应该尝试培养自己的“SEO 思维”,利用这种思维能够让你在对网站进行优化时更加有规则、有目的、有执行力,可以更好地保证优化的效果实现!这里结合我个人的经历和体会,浅谈一下什么是 SEO 思维,还有如何培养这种思维。一、怎么定义“SEO 思维”        以我的感受和理解,SEO 思维指的就是无论在网站建设过程中,还是日常的其它活 动中,都能把所接触到的事物敏锐地与网站的 SEO 联系起来,从中发现对优化有帮助、有 价值的信息,从而从新的层次上提升 SEO 优化的水平。毕竟,在我们的日常工作和生活之 中,有许多有价值的信息可以对网站的优化起到作用,这其中涉及到发掘热点事件中有价值 的新鲜“关键词”,抓住时机利用新出现的关键词进行布局和优化,从而获得搜索流量。另外, 对于网站优化流程的管理,则可以积极借鉴企业管理中的一些常用方法,特别是对于职业 SEOER 来说,对待手中掌握的多个优化项目,就需要引入项目管理的高效办法来提高工作 的效率,保证每个项目都能达到应有的效果。二、如何培养“SEO 思维”2.1、熟练掌握基本的 SEO 技能        要做到利用 SEO 思维来提升优化的技能和水平,首先需要的就是打牢基础,做到熟练 掌握基本的 SEO 技能,这其中包括以下几个方面:        如何确定网站的关键词,分为主关键词、热门关键词和长尾关键词         如何编写网站的 Title、Dercription、Meta Keyword、Tag 等         如何选定推广平台构建网站的外链        …

Apr 04, 2012 PHP

关键词的选择

一、海选        (1)、圈定能高度概括你网站主题或所提供服务的1至3个关键词。如提供二手房产交易的网站可能圈定的关键词是:“二手房”;“北京二手房”;“房产中介”等。        (2)、 找出你圈定的关键词的同义词:如网站的主题是“旅游”,相应的同义词可能有“旅行”“自由行”“自助游”等,可以根据你网站可提供的服务和内容来确定。        (3)、找出你网站主题或产品或服务所属领域的上一级类别关键词。并不是所有网站都可以找出上一级类别关键词,不必强求。(可以通过行业协会网站,观察他们在讨论类似内容时使用何种关键词)。如一些中小企业网站,生产插种机的小企业网站,上一级类别的关键词会是“农业机械”等。        (4)、列出网站内的所有产品词或品牌词或服务词。        (5)、找出用户在浏览你网站时的潜在需求及相关关键词。如境外旅游网站,用户在浏览的同时,很多情况下也是有外币汇率需求的。        (6)、尽可能地寻找与上述关键词有关的长尾关键词。        (7)、考虑一下搜索引擎用户会通过怎样的关键词去查询你网站能提供的信息,即从潜在用户的搜索习惯上找到关键词。二、筛选        海选阶段会产生很多关键词,不可能全部放在网站中,需要筛选出有 SEO 价值的部分。        (1)、 确保关键词有搜索量,简单的说,就是确保关键词是真的有用户在搜索,且搜索量能达到一定水平。可以通过百度指数来解决这个问题。        (2)、确保网站可以产出与关键词相关的内容,用户通过该关键词进入到你的网站后,会有诸如继续点击阅读、注册、下单等行为,即转化率——这一点搜索引擎是极为看重的。        (3)、考虑内容制作的难易程度是否在自己控制范围内,如上述所说的境多旅游用户的需求,外币汇率比较好解决,但还有诸多细节需求对于小型网站来说,满足起来难度较大。三、重要注意事项        (1)、关键词所属领域应该与网站所属领域相关:如健康网站内可以有一些医学内容,而娱乐内容明显不合适。        (2)、选择可以获得有效、安全的关键词:有些网站紧盯百度首页推荐的热词,再通过采集把大量内容填充进自己的网站,不仅对网站自身用户造成伤害,对提升转化率没有任何好处,也很容易被搜索引擎当垃圾内容进行惩罚。        (3)、避免过度重视通用词:在海选中,我们确认网站内容主题服务主题的关键词,还要找上一级类别关键词,但这些关键词往往过于宽泛,建议网站还是抓住几个重点进行内容建设        (4)、重视长尾关键词:在海选第 6 条我们提到应该寻找一些长尾关键词,但长尾关键词的检索量往往比通用词或非长尾要低许多,有些网站认为没有价值就放弃了。其实长尾关键词包含了用户更精准的信息,转化效果更好,SEO 竞争也更小,值得站长下一番工夫。

Mar 06, 2012 PHP

SEO 优化基本要点

        定义网站的名字,选择与网站名字相关的域名注册查询以保障网站的安全运行         分析围绕网站核心的内容,定义相应的栏目,定制栏目菜单导航         根据网站栏目,收集信息内容、整理、修改、创作、添加         选择稳定安全服务器,保证网站 24 小时能正常打开,网速稳定         分析网站相关长尾关键词,合理的添加到内容中         网站程序采用 DIV+CSS 构造,符合 w3c 网页标准,全站生成静态网页         合理交换网站相关的友情链接,不能与搜索引擎惩罚的与行业不相关的网站交换链接         制作生成 XML 与 HTML 的地图,便于搜索引擎对网站内容的抓取         为每个网页定义 TITLE、META 标签,标题简洁,META 围绕主题关键词         网站经常更新相关信息内容,禁用采集,手工添置,原创为佳         放置网站统计计算器,分析网站流量是通过什么来的,用户关注什么内容,根据用户的需求,修改、添加,增加用户体验         网站设计美观大方,菜单清晰,网站色彩搭配合理         合理的 SEO…

Feb 02, 2012 PHP

SEO 常见现象-快照回档-沙盒等

        SEO 策略中的几个常见现象  一、沙盒        什么是沙盒? 沙盒的意思是通常指新网站在前期很难在 Google 有好的排名,一般时间限制在 6 个月左右。为什么进入沙盒? 一般进入沙盒的原因是网站突然增加了大量的外部连接。二、 炸弹        什么是炸弹? 炸弹的意思是通过建立大量的外部连接,锚文本(连接文字)全部为关键字.致使网站强行上升排名。为什么会存在炸弹? 因为搜索引擎算法问题,大量的锚文本让引擎误认为某个网站是最符合搜索请求的页面.对于新站来说,定时定量的添加锚文本比一次性大量的添加锚文本更能增加 网站的权重。三、 幽灵        什么是幽灵? 幽灵指的是新站排名不稳定,忽高忽低的现象。为什么会出现幽灵? 这个主要是因为搜索引擎防止作弊造成的。还一个因素就是网站的权重问题。四、 连坐        什么是连坐? 连坐是古代一种刑法,在这里指的是被同服务器或 IP 地址的其他网站牵连。同样也是搜索引擎防止作弊,为了避免链接工厂的泛滥。五、金三角        金三角指的是 google 抓取关键字重点位置一般分布在页面左上,呈三角形。六、快照回档        快照回档是指百度的快照被退回到之前日期的快照。 形成原因: 主机空间不稳定,网站首页的改动,友链链接异常,百度算法的调整,优化过度,使用 seo 作弊手法。七、解决办法        稳定地维护、更新站内的文章,持之以恒地排查和及时更新调整站外外链,友情链接!

Jan 08, 2012 PHP

SEO简介

一、概述         搜索引擎优化(Search Engine Optimization,简称 SEO)直观理解是一种利用搜索引擎的搜索规则来提高目的网站在有关搜索引擎内的排名的方式。深刻理解是:通过 SEO 这样一套基于搜索引擎的营销思路,为网站提供生态式的自我营销解决方案,让网站在行业内占据领先地位,从而获得品牌收益。研究发现,搜索引擎的用户往往只会留意搜索结果最前面的几个条目,所以不少网站都希望通过各种形式来影响搜索引擎的排序。其中尤以各种依靠广告维生的网站为甚。所谓“针对搜索引擎作最佳化的处理”,是指为了要让网站更容易被搜索引擎接受。         SEO 简言之即指通过采用易于搜索引擎索引的合理手段,使网站各项基本要素适合搜索引擎检索原则并且对用户更友好(Search Engine Friendly),从而更容易被搜索引擎收录及优先排序,从属于 SEM(搜索引擎营销)。         SEO 的中文意思是搜索引擎优化。通俗理解是:通过总结搜索引擎的排名规律,对网站进行合理优化,使你的网站在百度和 Google 的排名提高,让搜索引擎给你带来客户。深刻理解是:通过 SEO 这样一套基于搜索引擎的营销思路,为网站提供生态式的自我营销解决方案,让网站在行业内占据领先地位,从而获得品牌收益。         搜索引擎根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。学习搜索引擎优化 SEO,必须先了解什么是搜索引擎以及搜索引擎原理。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。         在国外,SEO 开展较早,那些专门从事 SEO 的技术人员被 Google 称之为“Search Engine Optimizers”,简称 SEOers。由于 Google 是世界最大搜索引擎提供商,所以 Google 也成为了全世界 SEOers 的主要研究对像,为此…

Apr 07, 2011 PHP

深入剖析网站权重的价值

        网站权重是体现网站在搜索引擎中价值的表现形式,提升网站权重更是日常优化中的主要组成部分。你果真了解网站权重有哪些价值吗?下面开始深入剖析网站权重的价值到底有多少。 一、排名只是网站权重的表现形式      权重越高,网站排名就越高,由此排名在搜索引擎前列的文章也一定是在同行中具有着较强竞争力的网站。但网站排名是权重的表现形式,反过来说,权重就一定是决定网站排名的要素吗?有些网站即使权重相对比较低,但仍旧有一个良好的排名,原因为何呢?权重只是网站排名的一个重要组成优势,而决定网站排名的原因还应有网站内部的优化,如:“发展方向,结构的优化”。故而欲取高名次,二者皆不可抛。     二、秒收只是网站权重的先前条件      文章秒收,是所有站长共同追求的最佳优化效果。快人一步得到的可能是流量的天堂,慢人一步文章便可能被取而代之,使努力付诸东流。对于一个网站来说,权重高的话内容便可理所当然地被秒收,因此为了内容的收录速度,为了先发制人,权重成了所有站长追求的对象。然而若无网站权重,内容就一定不能秒收吗?答案是否定的,事实证明在诸多的网站优化实例中已经有着不少网站,甚至刚建不久之后便可达到秒收的效果。在这里我们姑且不论新站为何可以秒收,但对于一个新站来说,必然是没有什么权重的。因此秒收只是网站权重的先前条件,但权重却不是网站秒收的决定性因素。     三、网站权重可抵消优化的“负面影响”      在网站优化过程中,网站改版是在所难免的,即使不是因为定位的不够精准,发展过程中也免不了更换着几次的模板。我们为什么强调,新站不要频繁的改动自身的网站呢?原因便在于“权重”,新站不具备着多少的网站权重。由于是一个新站,本身便不具备着多少搜索引擎给予的权重,如冒然改版轻则陷入较长时间的观察期,重的直接被降权都是极易出现的。然而对于一个拥有着较高权重的网站来说,进行网站的改版后,这个影响是要小的多的。权重越高,所处的观察期便越短,甚至改版得当,还可以迅速的提升网站的排名以及权重。由此我们分析认为,网站权重可抵消优化中产生的负面影响。另外诸如,更换服务器、被流量攻击而短暂挂掉的网站,本身权重足够高,仍可消除其出现的负面优化效果。     四、权重为搜索引擎更新的动荡护航      对于中小网站来说,最为关注的是每周更新后的排名与收录、外链的变化。原因为何呢?追其原因,更多的是由于网站权重偏低的原因。在一个有着足够权重的网站中,从来不会关注搜索引擎的更新是否会为自己的排名带来多少的波动。提升网站权重,便是为随时可能发生的风波做一扇坚实的大门。没有网站权重,内容秒收又如何?效果随时可能覆灭。想要恒久的网站排名,还是应踏实做好网站权重优化。