主页 > W漫生活 >新一代搜寻引擎 >

新一代搜寻引擎

2020-07-13
阅读指数:552

新一代搜寻引擎
图片来源:unsplash,CC0 Licensed.

搜寻引擎里也有人工智慧?在很多人眼中,搜寻引擎是诞生于上个世纪的一项网路核心技术。谷歌创办人赖瑞•佩吉(Larry Page)和塞吉•布林(Sergey Brin)于1996 年提出的PageRank 演算法,大幅提升了搜寻引擎结果排序的準确性,但20余年过去了,搜寻引擎的技术、演算法,难道不是已经非常成熟了吗?还有人工智慧发挥的余地?

2016 年2 月,谷歌高级副总裁、46 岁的阿米特•辛格尔(Amit Singhal),宣布离开谷歌搜寻引擎核心团队负责人的位置,接替他领导世界上最大搜寻引擎的高级副总裁,是曾经主管谷歌知识图谱和机器学习两大核心研发团队的约翰•贾南德雷亚(John Giannandrea)。这起人事变动无论对谷歌内部或外界来说都意味深长,当时许多媒体都将此次人事更迭,解读为谷歌搜寻全面由传统演算法转向人工智慧演算法的讯号。当然,直到2017 年初,社会大众才知晓,辛格尔离职的更直接原因,是他捲入了一桩性骚扰案。但是,当时也许是被迫而为的高阶主管异动,却从实际结果上体现了谷歌搜寻技术方向的深刻变革。

辛格尔是谷歌搜寻引擎早期核心演算法,特别是网页排序演算法的最重要贡献者。简单地说,最传统的网页排序演算法,是找出所有影响网页结果排序的因数,然后根据每个因数对结果排序的重要程度,用一个人为定义、十分複杂的数学公式,将所有因数串联在一起,计算出每个特定网页在最终结果页面中的排名位置。

贾南德雷亚(在谷歌工作时,我们都亲切地用姓名首字母,称呼他为JG)曾主管过的知识图谱和机器学习两大研发团队,则是代表了谷歌在人工智慧领域的未来。其实,谷歌很早就开始运用机器学习技术,帮助搜寻引擎完成结果排序。此一思路和传统演算法不同,在机器学习的方向里,计算网页排序的数学模型及模型中的每一个参数,不完全是由人类预先定义的,而是由电脑在大数据的基础上,透过複杂的反覆运算过程自动习得的。影响结果排序的每一个因数(在机器学习领域,每个影响因数也被称为「特徵」)到底有多重要,或是如何参与最终的排名计算,主要是由人工智慧演算法透过自我学习确定。从2011 年起,随着深度学习技术的复兴和谷歌大脑(Google Brain)专案团队的成功建设,谷歌搜寻引擎使用的网页排序演算法,愈来愈依赖深度学习技术,网页结果的相关性和準确度,也因此大幅提升。到贾南德雷亚执掌谷歌搜寻团队时,可以毫不夸张地说,谷歌搜寻已是一个绝大部分由人工智慧技术支撑的新一代搜寻引擎了。

结果,排名还只是人工智慧技术在搜寻引擎中应用的冰山一角,打开谷歌或类似的主流搜寻引擎,人工智慧的魔力无处不在。今天,我们可以直接向谷歌搜寻引擎提出问题,它会聪明找出许多知识性问题的答案。

例如,我们直接向百度提问:「东野圭吾多大了?」百度在结果页面的最显着位置,直接给出「58 岁」(2016 年)的正确答案。我们甚至可以向谷歌提问:「在《哈利波特》的系列故事里,到底是谁杀了邓不利多校长?」谷歌不但直接给出杀害邓不利多的凶手名字,还显示了相关的电影剧照、故事情节、维基百科连结等。

利用近年来人工智慧技术在语音辨识、自然语言理解、知识图谱、个人化推荐、网页排序等领域的长足进步,谷歌、百度等主流搜寻引擎,正从单纯的网页搜寻和网页导航工具,变成世界上最大的知识引擎和个人助理—毫无疑问,人工智慧技术让搜寻引擎变得更聪明了。

【书籍资讯】

《人工智慧来了》

新一代搜寻引擎

相关阅读: