无论你是否对网站进行优化操作,网页本身质量的提升始终是最基础的,无论是搜索引擎的爬虫程序还是普通用户,也无论是通过搜索引擎还是其他推广方式,首先是先进入你的网站,网页页面质量判断是第一印象,接着才会是用户评价及内容推荐,所以网页本身的质量是最基础,也是最重要的工作,目前也将SEO工作的最大难点。' i: d5 V2 B4 W; d
百度设立19项创新研究方向百度校园大规模机器学习与数据挖掘主题研究项目总共收到了来自全国各大高校及学术机构的数十份研究方案,经过百度公司由资深技术专家构成的专家委员对所有方案进行的认真,仔细的讨论及评审后,评选出具有创新性的19项研究方案:
5 a' r3 v+ E; L, _* i5 ^- N 百度评选出具有创新性的19项研究方案(来源:百度爱好者)
2 s* d2 n/ v' o, H: u6 D7 b 据悉,百度公司将与获得创新性研究方案的研究团队建立合作项目并提供一定的合作资金用于研究项目的开展。另外,百度公司还将邀请创新性研究方案的案团队派遣研究生作为 “ 访问研究员 ” 造访百度公司进行为期 6 个月的研究工作,百度公司将为其指定资深技术专家作为导师,提供研究方面的专业指导,并提供研究所需的适当数据和计算资源。" X& A6 X8 Y; o
百度创新性的19项研究方案文字提取:
3 K0 v) E+ A" I, y" c 1.主动学习结合半监督学习在大规模网页/网站分类中的应用研究
9 @1 X9 `8 o% g! v/ K 2.基于Web数据的结构化语义关系挖掘+ v& e+ G4 ]4 b8 r$ w+ k
3.基于海量文本的主题自动分割技术研究
; M+ q) l; [& J 4.基于主题模型事件-情感互动关系研究及事件演化分析3 x& l/ U1 j- `& p" m
5.基于协同过滤的文档话题提取与建模/ o- V7 H# k* u0 u. H$ O
6.大规模社会网络环境下的情感挖掘研究
P l, n- Q: k9 Z1 Z) g7 v; ] 7.高性能信息推荐算法设计9 l6 [0 f/ W1 B1 ~
8.基于规则与机器学习融合的用户搜索行为建模极其原型系统
) O9 u% V' D/ l$ G' i4 h8 w 9.社交商务中基于用户评价的广告模型研究
/ U8 J5 [- G3 v+ U* p0 Y" p 10.融合规则和机器学习的双语术语对自动抽取研究
- [; X6 J, v7 b4 E: [8 i) K. P* u 11.基于协同过滤的广告关键词推荐算法' F! j# E! R/ d) A- r, j
12.针对大规模稀疏、强临时性数据的个性化推荐系统算法设计
; f* K* X) ^2 y$ g 13.海量特征设计:一种适合于Naive Bayes的大规模在线特征选择及组合方法8 P9 `: M$ q: C+ i5 T
14.面向复杂互联网数据的安全半监督学习和主动学习方法的研究! I: I' ]$ o1 Z+ a; _
15.图像和文本数据的多标记学习研究) }6 ~5 d& k' C" H$ N% B' Y
16.大规模网络文本复制件检测系统研究! y4 S% V L$ S# {) u: H' |- c
17.基于用户领域只是和网络数据动力分析研究
. z- G" J7 Y6 P* A8 ] 18.Web页面的分面分类模型与算法; x3 n8 I. \8 S( `8 s [5 y
19.海量数据主题建模的快速学习算法研究与应用* l6 ]' _/ e6 [ R( G+ x
从上面的19项研究方向可以看出,很多研究是百度搜索引擎一直在做的,投资这些创新研究无疑是提升机器工作性能和改善自身搜索的用户体验,对于网页质量的要求也越来越高,对于SEO这个特殊行业来讲,站内SEO优化逐渐成为重点及难点。9 \0 j7 u- @ Y
谷歌在网站站长指南中明确提到了如何提升页面质量,而且提供了一些非常实用的工具,例如Lynx、Page Speed、robots.txt检测工具等等,对于网页质量上的提升还是不错的,也提到了一些平常在工作中应该注意的一些问题,如隐藏文字及链接、欺骗性重定向、重复性网页等,当搜索引擎判断页面存在这些情况,在页面质量得分上会降低很多,SEO人员在平时工作中应该特别注意。 |