第17章 谷歌
如遇到章节错误,请关闭浏览器的阅读/畅读/小说模式并且关闭广告屏蔽过滤功能,稍后尝试刷新。
“谷歌的目標,就是在未来为任何人提供想要的任何信息的即时访问。在我看来现在的搜寻引擎不能称之为搜索,门户网站的逻辑更像是分类”。
恩斯特在礼堂的演讲刚结束,就收到了斯坦福计算机大拿斯內普教授的邀请。
来到对方的办公室,除了这位大拿,还有他的两个学生也在这里。
对於对方询问的谷歌將来的发展目標,恩斯特给出了自己的想法。
“恩斯特先生,能和我仔细的讲述一下你的谷歌算法吗?当然,如果涉及到商业机密,恕我唐突就当我没说”。
恩斯特微微一笑“没有什么商业机密直说,这就是一个概念,谁都可以研发商用”。
指了指自己的脑袋“不过要想成功,成为伟大,一个算法是不够的,要靠这里”。
“其实准確的来说,这不叫什么谷歌算法,我给它命名为pagerank算法”。
恩斯特清了清嗓子,也体会了一下装逼的感觉。
“pagerank算法基於两个核心假设,一是连结数量,另一个是连结质量,缺一不可”。
“一个网页被其他网页连结的次数越多,说明其越重要。来自高权重网页的连结比低权重网页的连结更有价值,这两点就是pagerank的核心”。
“简单来说,一个网页的pagerank值取决於指向它的所有网页的pagerank值之和,並且每个连结的贡献会根据源网页的总连结数进行归一化”。
“我们可以將网际网路看作一个有向图,每个网页是一个节点,连结是有向边。给每个网页赋予初始值,按照开发出来的叠代计算公式不断叠代更新每个网页的pagerank值,直到收敛”。
“就像是一个巨大的迷宫,每个网页是个小房间,连结就是房间之间的门,不断用叠代计算公式更新每个房间的重要值,直到结果稳定”。
內普教授听得眼睛瞪得像铜铃,惊嘆道“你说你不了解计算机,这专业名词说得让我產生质疑。你的一些想法,简直让人惊讶”。
哪有什么了解呀,不过是经过了资讯时代的轰炸罢了。
恩斯特现在能理解了,为什么那些成功人士创业都能成功了,商场本身最重要的就是信息战,还有什么人能比一个能预知未来的重生者更熟知未来的信息的吗。
“恩斯特先生的pagerank算法,是通过叠代计算保证收敛到唯一解,但对於大规模网页图来说,计算成本是不是太高了?”
“还有就是內容质量,pagerank算法不能直接评估网页內容的质量,如果有人刷取访问量,就会导致低质量但高连结的网页排名靠前”。
这时,斯內普教授带来的两个年轻人突然插话,恩斯特转头看向对方,刚才只顾著结交斯內普这个计算机大拿了,都忘记了这两个吉祥物的存在。
斯內普则猛拍额头“真是不好意思,恩斯特先生。实在是你的新颖想法让我很著迷,都忘记了介绍。这是我最得意的两位学生,谢尔盖·布林和拉里·佩奇”。
恩斯特心头巨震,没有想到李鬼遇到了李逵,见到真神了。
眼前这俩顶著中二捲髮的小伙,不就是未来谷歌的创始人吗。
自己的这套算法和理论,不就是两人研发出来的吗。
而现在自己,却可以像是对方的导师一样,为其答疑解惑。
“没错,这样的算法確实计算成本照比现在的网际网路模式成本较高,但它也有它的优点”。
“比如抗操纵性,相比简单的关键词匹配,pagerank算法更难被恶意操纵。在我看来,未来是信息化时代。信息化时代最重要的是什么?是信心安全”。
本章未完,点击下一页继续阅读。