详解七大因素,什么正在影响百度搜索结果排序?

  • 发布日期:2018-11-01

我们先了解下百度搜索首页的结果通常是由什么信息组成的

1、 百度付费广告(竞价排名推广/展示广告)

2、 百度免费产品:百科、资讯流(原百度新闻)、熊掌号、百家号、知道、贴吧、百库、地图、图片、视频、音乐、电商聚合等

3、 机构/企业官网

4、 新闻网站发布的新闻资讯

5、 社交网站的UGC内容,包括微博、问答类网站(知乎)、论坛、博客、视频网站等

6、 招聘信息网站

7、 分类信息网站

8、 电商购物网站(包括OTA在线旅行预订)

9、 股市行情(上市公司)

10、 其它相关网页信息

PC和移动端搜索除了设备和展示形式上的不同之外,前几种类型的内容会依次占据PC+移动首页搜索结果,排序不会有太多本质差别。除了百度付费广告和其产品外,自然搜索结果的排序主要由以下方面因素影响:

1、用户相关度

搜索引擎首先需要确保呈现结果与用户的搜索需求紧密相关,这里的相关度包括关键词在网页中出现的位置、频次(密度)。比如,企业官网包含的品牌和产品关键词最多,对于搜索引擎来讲,就是相关度最高的自然搜索结果推荐。对于构成绝大多数自然搜索结果的资讯内容来说,关键词在正副标题、首段、正文中出现的位置、频次(合理的),对搜索引擎的相关度评判会有直接影响。在百度早期,内容与用户相关度的影响在搜索排序中的比重会占到七成。以沃尔玛这篇新闻稿为例,核心关键词“沃尔玛”和“陈文渊”在标题和首段中分别出现六次和三次,在搜索结果中,相关度更高的网页就会优先推荐给用户。再如,中国平安、华为、智慧城市为核心关键词,在标题和首段中的位置和频次得到保障,作为具有时效性的新闻事件,在百度网页和新闻搜索结果中推荐会更相关。

2、内容时效性

作为互联网动态更新的时效性内容源,搜索引擎会给予新闻网站以较高的权重。如果内容中带有比较明确的时间点信息(如新闻发生的具体时间),更有机会被搜索引擎作为新鲜的时效性内容抓取,再综合其它(下方)各项指标判定索引和推荐。如果内容紧贴热点,在百度新闻和网页时效性卡片中获得展示的机会越大。

3、内容质量

所谓内容质量,也就是内容能为用户产生的价值,近一年来非常明显的一个趋势是,百度正在网页和新闻搜索结果中过滤掉没有时效性,或被算法判定为营销内容的结果,即便是内容发布门户网站上,也不会受到靠前的搜索结果推荐。百度站方曾接受界面采访时提到,“我们有个部门在过去半年时间内一直在调教算法,针对所有百度抓取到的网页,教机器来判断时效性和内容质量,在前端展示上,一些软文会被过滤掉,其他的不会发生太大变化”。

4、用户参与度

所谓用户参与度,是指构成用户参与的行为有阅读、点击、转评赞等互动行为,这些指标也是构成百度资讯指数的基础。用户对网页内容的参与度越高,搜索引擎认为其重要程度和受欢迎程度越高,页面则更有机会展现给用户。一般来讲,社交类UGC内容如知乎、豆瓣等,招聘信息、分类信息、电商信息、股市行情等,通常更新频度高,点击量大,搜索结果会靠前,但基本上是非品牌公关目的的功能性作用,如招聘、销售等目的。新闻网站发布的资讯新闻,新闻价值决定用户参与度,看的人越多,搜索结果推荐越靠前,越靠前用户点击越多,累积循环,这也解释了为什么多年前的负面新闻一直沉淀在百度首页,这就是典型的马太效应。

5、相关网页数量

除了搜索直接访问外,用户可能从其它网页链接的点击访问到内容,通过其它网页产生的关联越多,则更有利于长期的搜索长尾。对于站点来讲,内外链的数量,尤其是外部网页指向页面的锚文本数量、质量等,仍是搜索引擎判定网页价值的指标之一。

6、网页质量

网页的质量包括内容质量、浏览体验、PC和移动端的访问速度,友好程度、能否满足用户的延展需求等。除了对站点的评价之外,百度逐渐强化内容质量的识别评判,综合为内容所在落地页的评价。尤其在百度取消新闻源数据库后,即使是门户等之前权威的新闻源站点,相同频道的不同质量的内容,获得百度新闻及网页收录的情况也明显不同,被算法综合评判为低质营销目的的软文(非时效性新闻),会被从结果中直接过滤或减少呈现。

7、关键词竞争度

关键词竞争度,是最容易被忽略和不被了解的因素,但恰恰是影响搜索结果排序最重要的隐藏方面。所谓关键词竞争度,也指关键词热度,指该关键词在百度搜索的热度和收录的相关网页、新闻数量。举个简单例子,某关键词被用户搜索的频次越高,热度就越高,相关网页,新闻收录的数量越大,竞争度越大,也同时意味着新发布的内容,影响百度搜索结果排序的难度就越大。