首页 | 站长免费中心 | 新手上路 | 网站运营 | 网页制作 | 图片设计 | 动画设计 | 网页编程 | 网页特效 | 本站专题 | 虚拟主机 | 域名注册 | 网站建设 | 程序下载
       免费空间资源 | 新闻咨询 | 免费域名 | 免费网盘 | 网站推广 | 网站策划 | 建站经验 | 网站优化 | 网页代码 | 源码下载 | 音乐小偷 | 网络赚钱 | 论坛交流
网站建设
网站建设
虚拟主机
虚拟主机
域名注册
域名注册
711网络首页
站长工具
站长工具
网站源码
网站源码
站长论坛
站长论坛

 711网络 网站运营seo优化

搜索引擎的分词技术的简单测试

来源: 互联网    日期:2008-12-19
 

因为种种原因,已经有很长时间没有发过东西了。天刃今天抽时间,把大家最近反应最多的问题整理下,和大家聊聊。

第一个问题就是百度最近算法调整的影响,让很多朋友都没有了头绪。其实这次最大的调整在分词上,很多朋友也都注意到了。就像前几天说的,原来大家只要把干词做好,周围辅助做好长尾词就OK了,不管你用什么词搜,排名就像百度竞价一样牢牢不可动摇。但是貌似这次百度算法调整后就不是这么回事了,你做的主词还一样可以排好,但那些长尾词却很少可以搜到了……

那么这次的分词算法改在哪儿呢?天刃就拿最基本的TITLE撰写来给大家说明一下。百度31汉字的TITLE里,相信SEOER们都会充分利用的。朋友们都知道,在TITLE里将关键词隔开我们常会用到英文半角的逗号,或是“|”来区分,而百度这次分词算法调整之后,虽然还是会把这些认为是分隔符,但用法已经没有原来那么规范了。原因很简单,百度对它的分词越来越自信,已经慢慢放弃或减轻对传统分隔符的依赖了。

现在的百度,可以很容易的识别整个句子中的特定分词,而刻意的将我们想要的关键词用分隔符进行强调有的时候收到的效果是相反的,一个很明显的现象就是,你的TITLE里将你想要的各个关键词用分隔符清清楚楚的列出来,但最后你在搜索结果看到的情况却是:明明这个句子里很明显的有这个分词(两个分开的关键词),但却没有给你加红。也就是说百度根本没有认出你这个句子里的关键词。

这是怎么回事呢?不是百度分词技术垃圾,而是百度放弃了这个句子。(说到这里可能朋友们有些晕了,那我就简单的举个例子。关键词“AAABBB”其中“AAA”“BBB”分别是百度分词库里的独立关键词,而这个时候,你的TITLE这样写:“AAA长尾BBB长尾,AAABBB长尾”,结果你搜索“AAABBB”时,百度的搜索结果里有时竟是:“AAA长尾BBB长尾,AAABBB长尾”,前面句子里的AAA和BBB并没有被百度认为是关键词。)

当然,百度并没有自大到否认一切分隔符,而是根据中文的使用习惯对不符合中文撰写习惯的作法进行淘汰。或者也可以从另一个角度去理解,百度这个更改有针对SEO的原因,一个中英文混写的TITLE,避免不了优化的嫌疑。(也就是很多SEOER朋友开玩笑时说的,百度有的时候允许你作弊,但也不会允许你优化)

那么,现在我们该如何来撰写TITLE呢?天刃通过最近一段时间的琢磨,TITLE的撰写,我们要放弃原来为了给仅有的31个汉字节省字符来刻意使用英文符号的作法,这种作法虽还没有完全被百度摈弃,但这个趋势朋友们应该可以看的出来。“英文半角逗号,英文中间杠(占半个字符)”,这些符号可以换成中文的符号,哪怕损失了放长尾词的字符也是值得的。“|”这个分隔符现在 已经介乎字符与分隔符之间了,所以这个符号现在应该完全的淘汰了。难道我们以后TITLE的分隔符就没有合适的了吗?当然不是。通过对百度自身产品以及新浪的观察,现在最合适的分隔符是只占半个字符的“_”下杠,以后大家可以试着考虑用下这个。当然,必须要照顾中文句子的语法。

关于分词,这里就说下TITLE的撰写,其他的就不一一细说了。TITLE的分词算法绝对不适用用其他元素,这点大家不要混淆。



更多的搜索引擎的分词技术的简单测试请到论坛查看: http://BBS.TC711.COM



【 双击滚屏 】 【 评论 】 【 收藏 】 【 打印 】 【 关闭 】 来源: 互联网    日期:2008-12-19   

发 表 评 论
查看评论

  您的大名:
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款
认证编码: 刷新验证码
点评内容: 字数0
  精品推荐  
  本月推荐  
  友情赞助  

关于我们 | 联系我们 | 广告投放 | 留言反馈 | 免费程序 | 虚拟主机 | 网站建设 |  网站推广 |  google_sitemap baidu_sitemap RSS订阅
本站所有资源均来自互联网,如有侵犯您的版权或其他问题,请通知管理员,我们会在最短的时间回复您
Copyright © 2005-2015 Tc711.Com All Rights Reserved 版权所有·711网络   蜀ICP备05021915号
110网监备案 信息产业备案 不良信息举报