夜息:TF-IDF与关键词排名问题

 今天看到zero发的关于TF-IDF的关键词排名问题 http://semwatch.org/2012/03/tf-idf/

想到自己在N久前写过一篇未发表的草稿,里面提了提做SEO需要 “理解tf-idf的原理”。只是当时没写完,也没发出来。

其实TF-IDF可以解决很多SEO的基础问题。

例如,拿京东商城为例,关于京东商城我观察了很久。从去年开始京东的SEO开始发力,制作了/series/频道。之后改版过几次。

(不幸打不开京东网页,没法截图做例子,这个series频道猜测应该是学的zol)

series作为一个主题页面系列,从刚开始单页面,后来在某次改版后分拆成了多个页面。

 

例如,原来有一个主题页面,叫做 “飞利浦F073剃须刀”

改版成变成了

 

飞利浦F073剃须刀 图片

 

飞利浦F073剃须刀 评论

 

飞利浦F073剃须刀 问答

 

飞利浦F073剃须刀 XX

 

等N个页面。

 

意图很明显,想要获取大量的产品+附加词的长尾流量。

 

但是事实上,类似“飞利浦F073剃须刀 图片”这样的关键词,想用一个如此深层页面获取的排名的可能性非常低,此类“长尾”页面获取的链接资源仅仅是一个主题页上获取。分拆如此多的页面,还非常容易出现空白内容的页面,对搜索引擎不是一个好的体验。

 

通过TF-IDF原理,”飞利浦F073剃须刀 图片”这样的词,仅仅需要关注“飞利浦F073剃须刀”这个词的排名即可,“图片”这个词的IDF值实在是太低了。仅仅需要在title上匹配一下,可能就能出排名,甚至只需要在页面上出现一下,就可以了。

 

之前说,这个频道应该是学的zol,zol也做了分拆,但是zol解决了上面的部分SEO问题

 

1.它拥有大量的内容,哪怕图片,测评都是很满的页面,一定程度上避免了空白页面

2.zol的外链策略导致它的series页面的主词权重非常高(有兴趣可以去研究下),其导出链接质量也很不错。

 

没有解决的问题是,大量类似主题的页面导致内部竞争,权重还是不够聚集,需要大量的外部资源。

这类大网站有着丰富的资源,可以去这么做。因为zol完全是靠流量吃饭的站,SEO可以作为运营的主力。而一些中型网站,电商网站,SEO未必会是企业内资源最多的部门。这么随意模仿大型网站的做法,是会出问题的。

 

还是引用下百度的官方推荐

“SEO可以帮你将网站中的高质量内容更好的呈现给搜索引擎,获取更多流量”

 

SEO的前提是你网站中有高质量的内容,而不是一味得去呈现:)