Google 诞生于 1996 年 1 月,当时作为加州斯坦福大学理学博士生的两位少年,Larry Page (拉里·佩奇)和 Sergey Brin(谢尔盖·布林)在研究一项关于搜索的项目,最后,两人共同开发了一个对网站之间的关系做精确分析的搜索引擎,两人将其命名为 「BackRub」,后来更改为 Google。

在 Google 搜索诞生的背后,其实是基于一个名叫 PageRank 的网页排名演算法运行的。

1998 年,创始人 Larry Page 和 Sergey Brin 在一篇学术论文中解释了 PageRank 的核心理念。其中提到,搜索结果来源于一种基于图论的数学演算法,它将万维网上所有的网页视作节点(node),而将超链接视作边(edge),每个节点的权重值表示对应的页面的重要度。如果一个网页被很多其他网页所链接,演算法会自动识别到,该链接可能受到大众的承认和依赖,那么它在 Google 搜索结果的排名就高。

早期,Google 将这种演算法用于评估指向网页的链接的质量和数量。得分从 0 至 10,在 Google 工具栏中显示。

按照 Google 官方说法,PageRank 本质上是一种以网页之间的超链接个数和质量作为主要因素粗略地分析网页重要性的演算法。用户需要的是答案,而不是数十亿个网页,因此, Google 排名系统会对 Google 搜索索引中的数千亿个网页进行筛选,以提供实用且相关的结果。

有趣的是,PageRank 演算法是以谷歌公司创始人之一的拉里·佩奇(Larry Page)的名字来命名,并不意为网页之意,此 Page 非彼 Page,所以 PageRank 又称为佩奇排名。

PageRank 演算法被认为是互联网搜索引擎演算法鼻祖,也是非常公平地网页排名技术,成为互联网演算法基石。

虽然,PageRank 演算法是 Google 创始人开发,也属于 Google 的商标,其技术亦已经申请专利,但是专利权归属于斯坦福大学,而非 Google 公司。

最初,PageRank 对外公开至 Google 工具栏当中,并将这些分数公开。直到 2016 年 4 月 15 日, Google 公司停止向公众开放 PageRank 数据,停止评分,并将 Google 工具栏移除。其背后的原因,其实是这种排名演算法存在一些缺点和矛盾,并不是十全十美的。

具体来说,PageRank 演算法存在 「旧的页面的排名往往会比新页面高」 这种现象,因为即使是质量很高的新页面,往往不会有很多外链,除非它是某个已经存在站点的子站点。这也是 PageRank 需要多项演算法结合以保证其结果准确性的主要原因。

例如,PageRank 似乎偏好百科、知乎等页面,在条目名称的搜索结果中,这类页面经常出现在第一页,甚至在所有页面当中的首位,导致此现象的主要原因,是这种网页中存在大量的内链,同时也有很多站点链入该链接,Google 搜索会判定该链接是优质的,可以给予更高的结果排名。

所以,这种排名演算法也伴随著一些恶意行为,有一些不正常的链接运营者通过刷新、代码刷链接等方式,干扰 Google 的搜索结果演算法。

目前,Google 已经做了相关规定,处罚恶意行为。至于其如何区分正常的链接和不正常的链接,这仍然是商业机密。但是在 Google 的链接规范中已清楚地说明,哪些是属于违反规范的行为。

与此同时,Google 推出了 Google Ads 广告服务,使用该服务,会干预 PageRank 演算法的排名。这两个原因,导致该演算法迅速停止对外公开。

非常可惜,PageRank 并没有在 Google 搜索中完全实现,Google 干预搜索排名的决定,也引发了现任总统特朗普不满。去年 8 月 28 日,美国总统特朗普在 Twitter 上发文指责 Google 公司操纵 「Trump News」 搜索结果,特意隐藏正面报道,只显示了「假」新闻的媒体报道(负面新闻)。

即便如此,这些问题都不会妨碍 Google 搜索仍是目前最好用的搜索引擎。

获取更多好玩有趣的科技新鲜资讯,请关注麻省理工科技评论APP头条号

https://www.toutiao.com/c/user/107934732372/#mid=1621894950147085


不知道问百度,google知道的太多了。


推荐阅读:
相关文章