SEO培训_网站优化培训_百度关键词排名_海瑶SEO学堂

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 371|回复: 0

李彦宏的百度SEO搜索引擎是怎么来的

[复制链接]

567

主题

577

帖子

6469

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
6469
QQ
发表于 2016-2-17 21:30:53 | 显示全部楼层 |阅读模式
李彦宏的百度SEO是怎么来的
12.png


一、1997年超链文件检索算法与百度的创立

1997年夏,李彦宏工资已经涨到了年薪8万美元,但他总是觉得没意思。一次学术会议上,李彦宏遇到了Infoseek CTO(首席技术官) 威廉·张。李彦宏拉威廉·张看ranklink. com。微软、雅虎的人也在场。李彦宏输入chinatimes,排在第一位的就是中国时报的网站,再搜IBM,IBM官方网站排在第一。“当时任何一个流行的搜索引擎都做不到。”威廉·张立即给李彦宏开了更高的工资,邀请他加入Infoseek,李彦宏欣然接受,离开华尔街来到硅谷,出任Infoseek主任工程师。这其实就是现实生活中类似于链接关系的应用。要判断哪个页面最具权威性,不能光看页面自己怎么说,还要看其他页面怎么评价。

李彦宏1997年就提交了一份名为“超链文件检索系统和方法”的专利申请,这比GOOGLE创始人发明PR要早得多,不得不说这是非常具有前瞻性的研究工作。在这份专利中,李彦宏提出了与传统信息检索系统不同的基于链接的排名方法。

超链文件检索算法的出现,在用户搜索时,将得到的基于链接的相关性与基于关键词匹配的传统相关性综合使用,得到更准确的排名。

在今天看来,这种基于链接的相关性计算是搜索引擎的常态,每个SEO人员都知道。但是在十三四年前,这无疑是非常创新的概念。当然现在的搜索引擎算法对链接的考虑,已经不仅仅是锚文字,实际上要复杂的多。这份专利所有人是李彦宏当时所在的公司,发明人是李彦宏本人。

2000年1月由李彦宏创立于北京中关村,致力于向人们提供“简单,可依赖”的信息获取方式。“百度”二字源于中国宋朝词人辛弃疾的《青玉案·元夕》词句“众里寻他千百度”,象征着百度对中文信息检索技术的执著追求。

  二、1997年—2000年超链文件检索算法优化与完善

在1997至2000年间,李彦宏对自己的超链理论也通过论文著作逐步解析和完善,先后在IEEE(美国电气与电子工程师协会)刊物上发表,并不断在互联网搜索领域研究新的解决方案,随后李彦宏的新技术发明又申请了数项专利。

  三、2011年百度站长平台开放

「5月20日」 百度大更新

官方(LEE)首次回复与更新有关问题:我们的系统在更新数据的过程中出了点状况,问题被及时发现后,已经于5月20日中午修复,目前还有部分内容由于缓存等原因正在更新中,很快就会恢复正常。

事件背景: 早上一查,什么排名都没了,立马看了下别人的站怎么样了,上一些seo论坛看了下大家反映的情况,总结下来基本情况是:独立小站企业站全军覆没,门户站,分类信息,博客,供求信息等热门网站都上来了.目前情况未明,对策就是一边照常维护,一边观察情况,淡定.

「8月27日」 百度发布SEO优化指南2.0

这份《百度搜索引擎优化指南2.0》对从事网站SEO的朋友有很好的指导意义。

背景:2010-08-18 百度发布搜索引擎优化1.0

「9月16日」 百度站长平台开放

里程碑的事件,标志着百度对待站长的态度越来越开放!

  2012年

「11月05日」 打击交易平台的买卖链接行为

国内有几家知名度非常高的链接买卖站,例如站长交易、阿里微微等,都已成为百度监控对象,并形成一套相对网站的数据库,而且也注册了一系列潜伏的帐号来判断那些网站是链接买卖的活跃帐号,通过人工+技术的方式进行判断。

「10月23日」 百度打击超链作弊的算法升级

主要对象为意图通过超链作弊的方式操纵网站在百度搜索结果中排名的行为。

「8月22日」 百度预警:打击采集作弊网站

在站长的反击声中,百度方面做出了让步,这是第一次网页更新时,通知了广大站长!

「7月2日」 【里程碑】6.22和6.28百度K站事件

针对百度大规模K站事件引起了站长的公愤,反百度联盟在各大站长类论坛呼声渐高,百度竞价恶意点击凤巢正在启动。数10万草根站长发起恶意点击百度竞价行为。正因此事件,迫使百度首次回应K站问题,也使大部分网站的收录量恢复提升,同时促使了百度在未来的每次大更新时都会发布公告。

「5月25日」 百度惩罚发布的低质新闻的网站

如果发现新闻站点为了获取商业利益过度SEO/发布商业广告/恶意导流/堆砌关键词等,伤害普通用户的搜索体验,影响新闻产品专业权威形象的,百度会将其视为低质新闻站。

「5月2日」 百度发布Web2.0反垃圾攻略

为了扼制Web2.0页面越来越严重的垃圾信息、群发信息,以及不断蔓延的在Web2.0页面做外链、做SEO的趋势,百度站长平台发布了Web2.0反垃圾详细攻略。

「4月28日」 百度进行大规模的算法升级和改版

百度搜索失灵问题还上了CCTV4新闻

「4月11日」 百度调整移动搜索排序算法

鼓励网站运营者与站长进行手机页的优化,同时新规则还将提升手机APP的排名。

  2013年

「2月19日」 百度绿萝算法上线

这一次百度算法终于有了名字!三个类型网站将会受到不同程度的影响:1、超链中介,2、出卖链接的网站,3、购买链接的网站。

「5月13日」 百度异常提醒工具即将上线

超链作弊,内容作弊、内容采集、网站被黑、网站被拔毛或是竞争对手恶意做的“垃圾外链”,都会收到通知。旨在帮助站长意识到哪些行为不是网站正常运营的手段,从而帮助站长及时的纠正运营问题,避免网站因作弊行为而被搜索引擎惩罚。

「5月15日」 百度星火计划上线

百度建立了一个“原创联盟”,这个联盟的作用不仅仅是展现新闻媒体,另外也可能会签署某些协议来人工提示那些是原创文章,以避免出现文章版权纷争。

「5月17日」 百度发布“起源”算法

百度已经抽调大量人员组成原创项目组,致力构建原创环境,推动中文互联网的前进。同时,百度披露了原创识别系统-“起源”算法的部分细节。

「5月17日」 百度石榴算法上线

本次算法主要针对弹出大量低质弹窗广告,混淆页面主体内容的垃圾广告页面为代表。这类行业站要注意了:大量低质弹窗广告主要居中在游戏站、娱乐站、电影站、医疗行业等网站上,而广告与内容混淆主要集中在下载站上。含有恶劣弹窗、大量混淆页面主体内容等垃圾广告的页面排序会大幅下降。

「7月05日」 百度绿萝算法2.0更新

打击明显推广的软文,百度将加大过滤软文外链的力度,对长期发软文的目标站点进行惩罚,和对这些发软文的平台(网站)进行惩罚,两方面双管齐下,这将直接影响到软文代发行业和一些门户站编辑。

「7月20日」 出售二级域名或目录用于作弊将株连整站

这次是点名道姓了太原新闻网,它出售了二级目录,并用于淘宝客导购行为。如果这些行业站站长还不注意的话,要么就被K站,要么就直接清理出新闻源。

「7月27日」 百度突然减少大量网站收录与外链

据博友观察,个人博客形势严峻。后来查了下SEO数据风向标,发现今天的百度的数据风向标全部下滑。从图中可以看出,百度的收录、反链几乎全线下降。

「8月29日」百度说不存在所谓的大规模“k站”百度在官方论坛发布声明:1.并不存在所谓大规模“k站”,请站长朋友们安心;2.Site语法查询为估算值,精确度有限,请站长以百度站长平台索引量工具的数据为准。

「9月6日」百度将严厉处罚不相关的静态搜索结果针对一部分网站利用热门热门关键词生成大量的站内搜索结果页来获取搜索引擎流量,其中存在大量的不相关内容严重损害了搜索引擎的用户体验,并且侵占了相应领域的优质网站收益。对于此类网站百度将做出严厉的处理。

「12月5日」百度将从12月中旬开始,逐步淘汰“不具备唯一价值”的pc页鼓励站长建设移动化资源,以优化移动用户搜索体验。这就意味着以后在手机上用百度搜索大量的PC页面将消失,取而代之的是移动版的页面。

  【 2014年 】

1.对买**链接进行了严厉的处罚,对导出链接超过40个(一些知名站点不受影响)的网站,如链接工厂、垃圾站、半年以内的站所导出的链接全部没有权重,对于不相关友链全部降权十分之一左右。

2.增加了对隐藏链接的识别,现在网站上的那些隐藏链接一律没有权重了。

3.针对购买GVM、教育机构、事业单位链接的行为进行了严厉打击,百度已经建设了GVM、教育机构、事业单位数据库,对此类网站给予专门的排名,同时此类网站导出的链接一律不给与权重。

4.对于针对百度产品进行优化的行为进行打击,百度产品所导出的外链一律没有权重。

5.百度对在友链平台**友链的网站所导出链接全部不给予权重,百度已经建设了一个友链平台的特征库,比如在chinaz通过了的网站,阿里微微的网站,阿里微微自动挂链的网站,百度的系统都能自动监控到,发现了以后将这些网站加入**链接的网站数据库,这个数据库内的网站导出的链接都是没有用的。

6.百度实现了对论坛发帖和回帖用户的识别,被系统认为是垃圾贴和垃圾回复的(百度根据一些自动顶贴机的顶贴原理和一些万能回复(就是很常见的回复)搞了一个特征库,符合这个特征的就会被认为是垃圾链接内容)不给予权重,非原创(识别原理和识别原创文章的原理一样)的回复,同一用户重复发表的同样内容的帖子或回复不给予权重。

7.百度会对国外空间和未备案网站加大检查力度。

8.百度又根据了常见的采集软件的伪原创方法增强了检查伪原创的算法,像打乱段落,关键词替换,截取一部分等方法百度现在都能检测到,百度会针对网站伪原创和垃圾内容所占内容的比例进行处理(具体数额我不知道)而且会把伪原创的内容全部剔除。

9.百度对采集的内容收录有一个数量限制(具体不知,但是大站没有影响),达到数量以后就不收录了。

10.百度对导出链接基本没有但导入链接很多的网站加入疑似购买链接的数据库,进行重点监控和人工排查,对于该网站的导入链接加入疑似**链接的数据库进行监控和排查。

11.百度降低了外链对网站排名的影响,但降到了多大不知道。

12.百度对长时间原创的网站给予高权重。

13.百度分享的权重大大减少(很有可能直接没了),因为刷百度分享的太多,百度没有一个有效的解决方法,所以百度分享权重被大大减少,不过等到百度有了一个好的防作弊方法以后,百度分享权重一定很大。

14.仅对高质量博文给予高权重。

ps:高质量认定标准:字数,原创性,非垃圾内容,评论量(同用户多次发布评论现在百度已经能识别了)。

15.除高质量博文导出链接外,其他全部不给予权重。

16.对于堆积字符,词语等所生成无意义内容百度已经能识别,百度会认为这些内容是垃圾内容,进行惩罚。

17.一些在知名网站发外链的方法已经失效(比如通过书签等等)。

18.百度将以上不给予权重的外链行为,视为作弊行为,百度会将这些外链加入到以疑似作弊网站数据库,进行重点监控和人工排查。

  2015年

超链算法升级,外链拒绝功能下线,百度自动识别垃圾外链(评论、视频标题外链、垃圾博客外链、标签外链等)。

百度进一步提高了自身产物关头字排名的位次,搜罗百度百科百度地图.百度知道.百度贴吧等属于百度自己的产品。还有就是和百度合作的网站权重也相应提高了。

百度对信息越真实的网站排名会给予更好的排名。公司性质的网站要比中小个人网站排名更有优势。

对于一些垃圾站点,剽窃网站.模拟网站一律不给予排名。

网站有弹窗广告这样的站点,百度给予降权。

介入D联盟站点的给予适当降权。

网站页面.站点里面有大量JS代码内容的给于适当降权处置赏罚。

导出的单向链接过多,给予降权处理针对链接的站点。

友情连接过多的站点,或者是不美观站点友情连接网站的,给予降权处理。

博客评论和论坛签名百度目前已经不给予外链权重。

对大型门户网站的外链权重有必然的增强,对门户网站的外链权重算法也做出了调整。

新站收录几乎不需要有什么外部链接,只要有内容就行了。

更新时间:天天更新是7-9点调整为5-6点,晚上10-12点。周三大更新,调整为每周四大概凌晨4点更新。每月大更新的时间是11号和26号,尤其是26号,更新幅度最大,K站也是最多的。企业站内容较少的话,建议每周四前更新一下内容,内容多的话,最好是天天更新3篇。

百度对于分歧地域.不同城市.不同收集排名位置也有所改变,例如湖南与广东长沙与深圳电信与网通等排名位置都不尽相同。

公司网站排名较之个人网站排名有优先权。这可能是百度对清理网站低俗内容专项的一种行动,又或者是百度对个人站不安心的缘故所致!

百度认为是垃圾站的排名也欠好。因为有个体网站为了省时.省事.省心,就使用了不异的模板,功效百度调整之后,百度流量就根基上缺失,以至于有些站基本上就没有什么流量。

权重高网站要比权重低的网站好很多。对于权重高的网站,在此次调整中不单没有泛起关键词排名降低,相反获得了晋升。这可能就是站长日精于勤的缘故吧。

百度对搜素引擎的人工干预进一步加强:如你的网站关键词排名很高,而内容简单,无更新。虽然从百度获得的流量很大,假如百度就有可能经由过程人工干预,给你网站关键词降权甚至百度收录中剔除去。

百度对站点一再的SPM内容进行降权。百度对于网站的原创性要求更高,对文章的质量要求更高。在自己的网站上发布的文章,但文章标题百度更新收录规则和内容一定要百度下搜索不到的,然后在去各大论坛投稿一样的。过一会再去百度下搜索看,只如果原创的基本上能排在第一位。还有一些网络营销专业人士认为,百度算法调整后,对新站的关爱水平比原来有所加强。

对门户站的权重比较垂青,这是算法调整最直接得默认。追踪一些关键词可以看到的一个普遍现象:排名前两名大部门依然是自力站点,从第三名起都是门户页面,直到第二页起头恢复独立站。

百度针对论坛和博客站点导入链接降权,论坛签名已经对百度失效.百度重点提升了自身产品百科.贴吧.知道.辞书.有啊.经验.文库等相关内容页面的权重,现在百度这些产品的内容在第一页都有浮现,一般都是百度百科和百度文库。

[3月6日]为了满足百度用户的时效性需求,让用户更加方便快速地找到所求,百度网页搜索结果中目前已上线内容发布时间,替代之前的快照时间。将网页内容的产生时间更精准的告知用户,降低用户选择成本,提升点击效率,同时也能够提升网站的转化率。注意:对于搜索结果页、列表页、广告页这类页面,搜索结果中将暂时不展示发布时间。

3月19日【移动搜索】百度LEE漫谈移动化

从流量角度讲2014年可以说是移动流量爆发式增长的一年。另外我可以告诉大家,有很多行业,移动搜索上的检索量比PC搜索已经高出很多。当然不同行业并不一样,大家可以分析一下你们的目标用户,来决定主要朝哪个方向发力,当然另一个方向也要去做,不要把任何一边浪费掉。

再有最重要的一点就是,今年百度站长平台增加了重要工作方向,就是支持移动搜索领域,目前百度站长平台内的工具,仅改版和闭站保护未对移动站点开放,我们还计划开发一些专门针对移动站点的工具,包括我们在线上看到的官网图标等等,之后移动端都会在站长平台有一个对接。

5月26日从百度取消referer关键词说起

5月26百度站长平台消息.为了提高网络环境的平安.百度即将取消refer显示.关于什么是refer设置.不了解的朋友可以去百度一下.取消refer后将有利于防止第三方窃取流量关键词.对于seo行业或站长领域来说.这不算是什么好消息.同时也意味着“百度权重”这个SEO参考的规范将不复存在而像站长工具.爱站等关键词工具也很难生存下去.

估计SEO从业者每天都会使用站长工具.用以检查关键词排名.外链等基本SEO数据.实际上站长工具的数据来源都是百度.也就是采集百度搜索结果的相关数据.例如:某个关键词前三页的排名等.如果百度取消refer显示.那么站长工具就很难再采集到更多的SEO数据了这会给SEO人员和个人站长带来很多的方便.确实自己的网站数据变得更安全了但这明显是一把双刃剑.

操作SEO经常要分析竞争对手.记得自从谷歌取消了雅虎外链后.搞英文SEO朋友就抱怨.以后再也不能检查竞争对手的外链数据了百度在技术方面一直在效仿谷歌.其实谷歌早已推行了http技术.采集谷歌的数据比百度要更加困难.而如今百度也来这招.估计以后只能检查自己网站的SEO数据了那个时候SEO会变得更加难做.因为我失去了大量珍贵的数据.没有数据分析做网站优化就如同盲人摸象.

6月5日为何适配移动站点收录量如此少

负责PC、移动站点适配的SEOer有没有被老板责问“为什么适配工作做了这么久,移动收录量怎么还这么低”?同行在一起有没有讨论过“百度是不是不待见PC移动适配这种方式?所以收录那么差”?好了,在杭州的VIP大讲堂上我们有了答案,内容整理如下:

1,PC、移动适配现在有了新名字,叫跳转适配,即利用单独的网址向每种设备提供不同的代码。这种配置会尝试检测用户所使用的设备或ua,然后使用 HTTP 重定向和 Vary HTTP标头重定向到相应的页面。

2,对于跳转适配中的PC和移动页面,百度收录了PC页面等同于收录了移动页面,等同收录的移动页面不会体现在索引量工具的数据中。也就是说,你在索引量工具中查到的跳转适配移动站收录量是偏低的。

3,目前跳转适配是主流的移动化技术手段之一,百度持全力支持的态度,后续会加大力度提升数据的准确性。

6月8日百度眼中的优质移动站点什么样

1.HTML5建站

1.1百度移动搜索欢迎一切适合移动化设备浏览的网页,但目前HTML5是最先进的语言,强烈建议使用,能为后面的适配等工作加分不少。

1.2域名设置上尽量简短,移动站点推荐以m、wap做为二级域名名称

1.3URL结构上尽量简短且能够表达页面主意,目前动态url对PC搜索已不构成困难,但在移动端,咱们还是先做一段静态化的工作吧

1.4移动化页面特征尽量明显。关于这个问题等待站长学院的相关文章吧,听说已经有技术大牛在撰写了。

1.5正确适配,或正确填写sitemap,或正确标注applicable-device。

2.访问速度

2.1培训现场刘院长直接说“3秒以上死”,听起来很可怕,足以见得响应速度对移动站点是多么的重要。这个3秒包括网络时间、服务器处理时间、页面渲染时间,千万别超呀!所以我们在选择服务器、空间的时候要充分考虑速度的因素了。

2.2还有一点培训上没有讲到,我觉认为非常重要,就是访问的稳定性,这和PC端是一样的。我关注过去年广州沙龙时孙权老师提到的,网站服务器宕机一天对站点的整体排名表现都会有很长时间的影响。

3.死链率

3.1百度站长平台上上周发了《百度搜索标准死链官方文档》,最近也反复说这个问题,看来是非常重视的,想想看,用户在马路上使用百度移动搜索,点开的结果是死链,或者显示“此内容已过期”也真是够恶心的——院长说这就属于死链影响搜索用户体验,发生这种事情百度会很不开心。

3.2百度这么重视死链,也一直让我们提交死链,搞得我们很紧张,我曾经一度认为只要是报过404的页面都需要进行提交。后面问了一下刘院长,给我的解释是这样的:1,只提交百度收录的死链即可,即以前页面正常的,被百度收录后变成404的页面。2,除了404死链,内容死链和跳转死链也必须提交。

4.可访问性

4.1跟《百度搜索网页质量白皮书》里说的差不多,网页不能是死链(包括协议死链和跳转死链),不能是必须有权限或必须登录才能访问的页面。

4.2不能强迫用户,这个应该是目前百度比较重视的问题,包括不能要求用户下载APP才能看到网页内容等——冰桶算法有一部分就是打击这种行为的,相信百度后续会加大对这种手法的打击。

4.3现阶段百度还未公开宣传可以读懂FLASH、JS、图片,所以不要将链接和文本通过上述方式输出或表现(这点培训中没有讲,但是结合现场其它内容,感觉应该加进来提醒大家)。

5.使用体验

5.1减少用户获取内容的成本,一般移动站点使用树形结构的话,可以控制在三层,即首页-频道-内容页。

5.2尽量减少使用大屏广告的行为,小心被冰桶掉。

5.3移动网页面积有限,要在有限的空间里做大量交互行为是一件很难的事情,这就要看站点的功力了,刘院长在培训时着重讲了交互要爽,大家尽量去看视频吧。

6.内容价值

6.1百度对移动内容价值的判断,绝大多数同《百度搜索网页质量白皮书》里讲的一样,尤其是内容质量那个篇章,做网站的不几遍这个白皮书都不好意思跟同行打招呼。

6.2刘院长在培训现场还强调了一个例子,就是网页标题上写的是XXX全剧剧情,但实际页面上是XXX演员介绍——之前感觉这样的内容还可以,毕竟都是跟同一个电视剧相关的。私下问了一下刘院长,刘院长说这种情况在百度内部是不允许的,属于作弊,会被狠狠打压,大家还是避免为妙。

7月7日 百度移动搜索结果排序倾斜策略简析

百度之所以一直大力倡导大家对PC站点进行移动化处理,是因为在移动端排序上存在着向移动页面、适配页面倾斜的策略,后续这种策略的力度会更大,转码页和PC页的展现空间将更小。所以提倡大家提高PC页移动化比例,减少移动流量损失。

10月 百度收录排名周期更新

百度排名顺序由原本的每周调整1次排名,现在1天都有可能3-4次的排名调整。

百度对新站的收录时间缩短,从以前的半个月到一个月时间,缩短到而今的一到两周。

新的站点,几乎不需要去注重外部链接数目及质量了,只需要你尽量做好站内内容的质量和经常更新即可。

百度网页的大更新是以前的星期三更新,更改为每一日更新。

网站收录页面有所增加。



转载文章请注明:SEO培训教程

本文地址:SEO培训http://seo.cao4.net/thread-825-1-1.html

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

免费诊断网站
在线咨询
咨询热线
15859578444
微信扫一扫
直接访问本页内容

QQ|手机版|小黑屋|SEO学堂

GMT+8, 2017-8-22 22:54 , Processed in 0.986302 second(s), 36 queries .

Powered by SEO教程 X3.2 SEO培训 网站优化排名 网站优化①群:434931228 百度快速排名②群:199706487 本站业务:百度SEO培训,关键词排名服务,网站降权诊断,SEO教程视频分享

© 2001-2013 海瑶SEO学堂

快速回复 返回顶部 返回列表