互联网网页资源现状

百度搜索引擎网页质量白皮书,多项举措提升网站价值

  搜索引擎相对比较封闭,站长需要通过不断摸索,从而发现搜索引擎对网页的判断标准,指导站点内容建设。此次《白皮书》的推出,目的是开放百度在网页质量方面的判断标准,给站长提供参考,希望有更多、更优质的内容产生,满足搜索引擎用户的需求,同时为站长带来流量,实现共赢。围绕网页质量,百度站长平台站长学院也将陆续开展“网站建设”、“内容建设”等主题的培训课程,切实帮助网站提升价值。借助《白皮书》的上线,百度站长平台新闻源也力推“拾柴计划”。这是继世界杯期间,百度站长平台大力清理新闻源之后,希望重新吸纳优秀的新闻资讯类网站加入到百度新闻源中。而《白皮书》对于衡量网站是否符合新闻源具有重要指导意义。

  CNNIC2014年年初发布的《中国互联网络发展状况统计报告》中称:截至2013年12月,中国网页数据为1500亿,相比2012年同期增长了22.2%。2013年中国单个网站的平均网页数和单个网页的平均字节数均维持增长,显示出中国互联网上的内容更为丰富:平均网站的网页数达到4.69万个,较去年同期增长2.3%。

  为了保证搜索质量、提高用户使用满意度,百度搜索引擎每周都会进行网页质量抽样评估。然而从近一年的评估数据中我们发现,优质网页的绝对数量非常少,且几乎没有增长;普通网页的占比在下降,相应的,质差网页的比例却有明显上涨。截至2014年5月,统计数据显示,在百度网页搜索发现的海量网页中,优质网页仅占7.4%,质差网页高达21%,其余普通网页为71.6%。

3.jpg

  百度网页搜索通过一系列筛选、识别、分析、赋权等工作,努力将更多优质网页呈现在 用户面前,每天约打击上万质量差网站,涉及网页达百万量级,尽可能减少质量差网页给用户带来的干扰。从下图2014年5月的网页展现分析数据显示,目前展现在用户面前的网页质量分布中,优质网页占比为40%,质量差网页降为11%——虽然这个变化已经非常明显,但百度网页搜索还是希望能和广大站长一起努力,将质量差占比降到更低。

3.1.jpg

  上述质量差网页包括低质网页和垃圾网页两部分,低质网页问题分布如下图所示:

3.2.jpg

  从上图我们看出,目前低质网页中最严重的问题即因广告过多、占据网页主要位置以及超预期弹窗带来的浏览体验差,内容空短、网页需要权限才能获取资源和过期信息也是低质网页的重要组成部分。

质量差网页中除了低质网页外,无任何质量可言的垃圾页面的问题分布如下图所示:

3.3.jpg

  死链对用户、网站和搜索引擎来说都已没有存在的意义,垃圾网页中占比最大。其次是 对用户和搜索引擎伤害巨大的作弊网页,资源无效、有问无答和不相关搜索结果页这些极大浪费用户时间的网页也是搜索引擎不希望呈现给用户的。


百度搜索引擎给站长的建议

  上面介绍了百度搜索引擎对网页质量的判定标准,与这些标准相应的,站长在实际工作中应该遵循几项原则:

  • 设计网页时主要考虑的是用户,而非搜索引擎

  • 永远将用户体验放在首位 ü 根据用户需求制作内容

  • 多考虑如何让自己的网站具有独特价值

  • 将目光放长远,滥放广告弊大于利

  • 及时删除低质内容

  • 不要企图用任何方式欺骗用户和搜索引擎


互联网网页资源现状相关百科