我的一个电影站前一段时间改版之后发现流量掉的厉害,查看几个词,发现百度的分词功能把网页分成了XXXX全集+观看,实际上网页里 XXXX全集只出现了一次,自然密度比较小,排名下降。为什么出现这种情况,看来我对百度的分词要进行进一步的学习。看了相关书籍,再分析了百度里的排名,得到了如下内容,整理出来供大家参考,西红柿臭鸡蛋尽管仍过来吧。
一百度会把一些高频词忽略掉,如下载,视频,观看,这些词在百度里的索引量已经达到了最高1亿个,他们的权重有时候会忽略不计。
二百度的词库非常大,他会随时更新一些新词语,他一般采用混合分词的方式进行分词,所以分词方案非常多。而GG的词库相对较小,智能化比较低,很多时候是把词语拆成一个个字或者相连的词。所以分词方案比较单一
如功夫之王在线观看在GOOGLE里被分成功夫+王+在线+观看,在这里之被当作停止词而忽略掉拉。
而在百度里则有以下9种方案,可以看到一些高频词有可能被忽略掉,如在线,观看。其实这种情况在GOOGLE里也存在,只是因为GOOGLE里只显示前80几页,后面的结果看不到。
1功夫之王+在线观看
2功夫之王+在线+观看
3功夫之王在线+观看
4功夫之王在线+在线观看
5功夫之王在线
6功夫之王+在线
7功夫之王观看
8功夫之王+观看
9功夫之王
这里由引申出一个问题,既然搜索功夫之王在线观看和功夫之王都是把功夫之王%26lsquo;当成必须要有的内容,
是不是说搜索功夫之王和搜索功夫之王在线观看,所参与排名的网页是一样的呢,我门查看以下发现功夫之王在线观看是732W,而功夫之王是 1600W,看来不一样。实际显示都是76页,是不是巧合呢,再试一下黄石的孩子,发现也是76页,原来百度只显示76页的内容。到底这两个要害词参与排名的网页是否一样,不能确定,但我猜测功夫之王在线观看结果比功夫之王小很多的原因百度会把功夫之王再切分,把那些非电影的资源也放进去。到底如何留给高手来解答吧。GOOGLE的表现呢,搜索功夫之王到64页出现为了提供最相关的结果,我们省略了与已显示的 615 个类似的条目
可以看出百度和GOOGLE都有类似的设置,就是只显示搜索的部分结果,为什么要这样,1这样的话速度比较快,2根据统计往后的数据人们一般不会查看。
既然功夫之王在线观看在百度里有多达9种分词方案
可以肯定的是这9种方案相对之间也是有权重高低的,根据百度的原则,我认为越匹配权重越高,匹配词语越靠前权重越高。高频词可以忽略。因此1-9就是权重逐步降低的大致顺序。那如何根据这样的分词原则如何做才能最大程度的排名靠前呢。
1尽量在标题上全字匹配
2尽量在顺序上匹配
3 网页可能按照这9种方案的任意一种分词,我们要控制百度让他按照1或者2来分词,为什么在全字匹配的情况下尽量选择这两个分词方法来安排网页要害词布局呢,因为假如按照第3或者第4个方案,把功夫之王在线当成一个词语,它会忽略这个网页中功夫之王的存在,那很显然功夫之王在线这个词在网页出现的几率是比较小的,除非你是百度视频和新浪这些可以随意堆砌。否则很难有好的排名。
4如何让百度按照我们设想的来进行分词,就牵扯到网页要害词布局问题,不要把功夫之王在线放在网页的任何一个地方就可以拉。
写的有点乱,不过我研究了一上午,只出来这些东西,预备好西红柿臭鸡蛋的可以开仍啦。
文章地址: http://www.xinasp.com/html/wangzhanyunying/sousuoyouhua/20080512/31206.shtml
tag:排名 下降 分词 研究


RSS订阅
评论加载中…



