ers…Lee)曾经提出这样的说法,认为信息饥渴的计算机用户可以点击突出显示的文本,从一个文件跳到另外一个文件。对一位富有远见的计算机专家而言,网络就是链接。
1996年慢慢过去,在此期间,佩奇和布林合作进行下载和分析网络链接的工作。获取数据的过程比佩奇预计的要长,而且他估计他们每放一个网络爬虫程序出去搜集整个网络,计算机科学系就得为此支付2万美元,但是他急于完成这项工作。他想要发现这些自动化的交叉指代的重要性。他的研究目的不但吸引了布林的注意,还吸引了布林的指导教师莫特万尼的注意。因为,这项工作有希望改进网络搜索。布林之所以加入这个项目,一是因为他很希望能够与佩奇一起工作,二是他一向对从大量随机数据中提取信息很感兴趣,而这个项目恰恰与此相关。如果布林想要发挥他数学和编程的优势,还有哪个舞台比互联网更广阔呢?
佩奇建立起了自己的理论模型——可以通过计算指向某个网站的链接的数量来确定这个网站的受欢迎程度。尽管受欢迎程度并不总是同价值相关,不过,他和布林都生长在学术世家,非常重视发表在学术期刊上引用了诸多相关文献的学术研究成果。而对佩奇来讲,在某种意义上,链接就像是文献引用。科学家会引用那些同自己的研究相关的已出版的文献,而这些引用可以帮助学术研究界确定某项研究成果的价值和影响力。“文献引用非常重要,”佩奇说,“事实证明,获得诺贝尔奖的科学家们引用了上万种不同的文献。”他还说,“如果你的成果在相关科学文献中被大量引用,就说明,你的工作非常重要,因为很多人都觉得它值得一提。”
而佩奇得出的结论是,同样的道理也适用于网站。他更进一步取得了概念上的突破:并非所有的链接都具有同样的价值,其中一些比另外一些更重要。佩奇赋予从重要的网站上发出的链接更高的权重。那么,他又如何确定哪些网站更重要呢?很简单,指向哪个网站的链接多,哪个网站就重要。换句话说,如果人气很旺的雅虎主页上有指向某个互联网网站的链接,那么这个网站马上就变得重要一些了。佩奇把自己的姓氏同自己正在处理的这些文件巧妙地结合在一起,为他的链接评级体系起名为“PageRank”(网页序列等级)。
佩奇的另外一位指导老师,斯坦福大学的特里·维诺格拉德(Terry Winograd)教授称,解决网页排序问题的学术出路,最终取决于弄明白通过追踪链接到底可以发现什么。“一开始,拉里的想法是进行随机的网络浏览,就像是在网络中漫无目的地漫步。这套算法(一系列数学方程式)是为普通的网络用户发明的。大部分时候,他们在某个网页上点击一个链接,就会到达网络上的某个目的地。对这个过程的提炼造就了PageRank。”
布林和佩奇相信,把PageRank算法应用于互联网,可以作为他们博士论文的研究方向。1997年初,佩奇打造了一个叫“BackRub”的简单的搜索引擎。这个搜索引擎之所以叫“BackRub”是因为它主要处理反向链接。佩奇一直善于精打细算,他把自己的左手平放在扫描仪上,将自己的手纹转化成了一种黑白的图片,而这就是BackRub网站的标志。布林、佩奇和莫特万尼都为这个正在形成的项目贡献了自己的创意。莫特万尼说,不久,他们就清楚地意识到,这个项目不仅仅是一个继续他们的学术研究的途径。尽管事先并没有想到,不过当这三个人把自己的排序方法应用于互联网的时候,却出其不意地解决了互联网信息搜索的一个关键问题。
txt小说上传分享
独特的PageRank技术(4)
“他们从来没有郑重其事地坐下来,然后说,‘让我们来发明下一个伟大的搜索引擎吧。’他们只是想要解决有趣的问题,又碰巧想到了一些不错的创意,”莫特万尼说,“拉里贡献了一些想法,谢尔盖贡献了一些想法,我也贡献了一些想法,我们都参与了项目的创意。渐渐我们发现自己正在建立一个完整的搜索引擎。”维诺格拉德也同意他们的想法是一天天逐渐发展成熟的,“他们一开始并没有想要成立一家公司,不过他们确实想要创造更优越的搜索方式。”
布林、佩奇和莫特万尼一起建立了一个复杂搜索引擎的雏形,供斯坦福大学内部使用。这个搜索引擎以传统的搜索引擎技术为基础,并引入了PageRank算法,因此,用它在互联网中搜索信息,得到的结果在相关性上比以往的引擎要优越得多。其他引擎主要依赖将搜索与句中的词语同网页上的词语进行比对来进行搜索,而PageRank则更进一步,将搜索结果以逻辑形式排序之后再呈现给搜索用户。这是第一次,人们可以迅速地在互联网中进行搜索并迅速地找到有用的结果。
1997年秋天,布林和佩奇决定给BackRub起一个新的名字。佩奇绞尽脑汁却还是想不出一个从来没有人用过,而且容易引起人们注意的名字,所以他请同一办公室的肖恩 · 安德森来帮忙想一个。“所以,我就走到白色书写板前面开始进行头脑风暴,写下一个又一个名字,而他不停地说‘不行,不好’。”安德森回忆说。这种情况持续了几天。“他几乎绝望了,所以我们又进行了一次头脑风暴。我坐在白色书写板前面,提出一个又一个创意,最后我问,‘Googleplex怎么样?你们不是要建立一个通过搜索和索引巨大的数据库来使人们对信息进行组织的公司。Googleplex是一个巨大的数字。’他很喜欢这个名字,说,‘那么,我们就用Google怎么样?’因为他喜欢短一点的。我在我的工作站中键入G…o…o…g…l…e,不过我把这个词拼错了,而这个词还没有被注册。拉里认为这个名字可以接受,于是当天晚上我们就用这个名字注了册,并在白板上写道:Google?郾。同雅虎和亚马逊一样,这个名字很有互联网公司的气质。第二天我一进办公室就发现塔玛拉留了一个条子说:‘你们拼错了。正确的拼写是G…o…o…g…o…l。’可是,注册已经被接受了。”
1997年,这个引擎以google?郾stanford?郾edu的网址为斯坦福大学内部的学生、教师和管理人员使用。在校园里,人们对这个引擎的性能有口皆碑,它很快就流行起来。大学的技术认证中心开始为这项技术申请专利。斯坦福的教授和学生都开始用它来在网络中搜索信息。“它很快就成为我唯一使用的搜索引擎。”斯坦福的丹尼斯 · 阿利森说。“Google很快就成为我系统默认的搜索引擎,”维诺格拉德补充说,“它很快就在斯坦福流行起来了。”
他们没有钱雇用设计师和艺术人才来设计精致的页面,所以Google的主页一直很简单。不过,从刚开始的时候起,Google干净、清新的外表就得到了寻找信息的互联网用户的青睐。Google主页以白色为背景,只使用最基本的色彩,它的纯净在这个杂乱无章的世界上具有广泛的吸引力。它简单清新的形象与大量拥挤不堪的网页形成了鲜明的对比,那些网页上到处都是闪烁的广告,塞满了图形和各种形式的文字。Google并不在其主页上兜售任何东西,所以人们自然而然地感觉到Google是他们自己的,也非常乐意使用它。“以这种方式设计主页,实在是个明智的选择。”阿利森说道,“如果你去一家网页设计公司,要求他们为你的搜索引擎设计主页的话,你肯定不会拿到这样的设计。页面上没有动画效果,没有金属质感的色彩,也没有声音和光影。它的设计直接挑战了这样一个人们普遍相信的说法:人们喜欢在一片嘈杂声中找寻自己的方向。”
随着数据库规模越来越大,用户数量越来越多,布林和佩奇的计算机不够用了。但是,他们没有足够的现金,所以他们千方百计地省钱,自己购买零部件组装机器,还在仓库里翻找没有人认领的计算机。“我们猜想,如果一台计算机的主人没有马上把它们拿走,就证明他们不急用,我们就先借来用用。”布林说。他们的导师们在得知他们到处搜寻可用之物的窘境之后,从斯坦福的数字化图书馆计划中拿出1万美元资助他们。他们在盖茨楼360室塞满了计算机之后,又把佩奇的宿舍变成了数据中心。“我们收集了一大堆五花八门的零部件。”布林说。同时,他还特别提到,他们学到了非常有益的一课:通过集成和连接便宜的个人电脑部件可以做出性能优越的计算机处理系统。“为了节省一分钱,拉里愿意搜遍整个世界。”斯坦福大学计算机系统负责人查利·奥吉斯(Charlie Orgish)这样说道。
txt电子书分享平台
独特的PageRank技术(5)
1998年3月,坐在帕洛阿尔托的一家叫做东方美食家(Mandarin Gourmet)的中国餐馆里,佩奇和布林打算向保罗·弗莱厄蒂(Paul Flaherty)介绍自己这种性能更好的搜索引擎的优点。弗莱厄蒂在斯坦福拿到博士学位,是AltaVista的设计者之一。布林和佩奇希望AltaVista公司能够付100万美元购买即将获得专利的PageRank系统。毕竟,这个算法可以改进他们的搜索结果,而AltaVista占据了整个搜索市场份额的54%,所以,从逻辑上推断,这家公司应该对吸收最优越的技术感兴趣。而布林和佩奇也可以在售出专利之后,继续他们在斯坦福的学业。
在听完弗莱厄蒂对AltaVista工作原理的解释之后,这两个Google发明人知道自己的系统比他们的更优越。弗莱厄蒂说的另外一件事也让他们印象深刻:整个AltaVista的数据库全部打印出来的话,要堆9 650米高,而这个搜索引擎可以在不到半秒钟的时间内从这个数据海洋中找出任何一个词。这种描绘使他们久久难以忘怀。这场晚宴的主人是丹尼斯 · 阿利森,内有预测运气的小纸条的甜饼还没有上桌,他就开始担心这次会面的前景了,不知道它会变成激烈的争执,还是能够以友好的气氛结束,因为布林和佩奇说话的方式太激烈了。
他们说,AltaVista只是一个开端,而未来属于Google。弗莱厄蒂也认为他们的创意很酷。“我感觉他们以链接为基础的页面排序方式一定会大有作为,而且它刚好可以弥补AltaVista的不足。”弗莱厄蒂说道。但是,他还是提醒他们,一旦他们的创意在互联网上流行起来,问题和烦恼也会随之而来。人们会试图闯入你的系统,攻击你的网站,还会恶意操纵你的搜索结果。不过,布林和佩奇并没有被吓倒,恰恰相反,他们信心十足,希望他们的技术可以为更多的人所用。“他们对自己能够做到的一切感到兴奋。”阿利森说,“他们急着同大家分享自己的成果。从根本上讲,他们只是用比较礼貌的方式说,‘AltaVista已经过气了。它没有满足人们的需求。’而这两个家伙手中掌握着PageRank这个法宝。”
在中国餐馆就餐几周之后,布林和佩奇得到了弗莱厄蒂的回音,他说AltaVista最终还是决定放弃Google。因为AltaVista的母公司数字设备公司(DEC)不希望在技术上仰仗外人。“那些管理工程技术部门的人不太愿意从外部引进技术,”弗莱厄蒂说,“他们有着非常强烈的‘不是在这里研发’的门户之见。”让事态更加复杂化的一个因素是,当时DEC正在进行同康柏电脑公司的合并案。搜索引擎并非他们的重心,也不是优先考虑的部分。尤其是,当时AltaVista正在成为一站式目标网站,希望吸引用户将它的网站作为其使用网络的起点。搜索只是AltaVista提供给互联网用户的众多服务中的一种,它还提供新闻、购物、电邮和其他一些服务。
之后,斯坦福的教授们和大学的技术认证办公室还帮助布林和佩奇同Excite以及其他一些搜索引擎进行接洽,可是,这些公司都没有买下Google。对这些公司来说,是否拥有更好的搜索技术是无关紧要的。看起来,他们的重心都放在出售尽可能多的广告,并尽可能迅速赢得最多收入上。维诺格拉德陪着他们拜访了一家沙丘路的风险投资公司,但是没有人对为“搜索”提供资金感兴趣。尽管拉里和谢尔盖相信,对于在互联网上搜寻信息的用户们来讲,搜索引擎对于他们的网络使用经验作用特殊且重要,但是,对于其他人来讲,搜索引擎则是替补队员,只是在一系列五花八门的服务中的一种。不过,他们两个并没有放弃。“他们或多或少对权威持有怀疑的态度,”维诺格拉德说,“如果他们看到全世界都往某个方向移动,而他们相信应该往另一个方向移动,则他们更有可能说,‘这个世界上的其他人都错了’,而不是说,‘也许我们应该再重新考虑一下’。他们对自己的方法非常有信心,他们会告诉你其他的人都错了。”
表面上看,雅虎应该愿意买下他们的技术,因为它主要依靠人工编辑的地址目录来搜索网络,而缺乏快速搜索的办法。可是,它也拒绝购买Google技术或者其使用许可。在一定程度上,雅虎拒绝这个搜索引擎是因为它希望计算机用户花更多的时间在它自己的网站上。而Google搜索引擎创造出来,是为人们提供快捷的答案,使他们可以迅速到达最相关的网站的。而雅虎的地址目录即可以回答问题,又能够将用户留在雅虎网站上,购物、看广告、查邮件、打游戏,使人们在雅虎网站上花更多时间和金钱,而不是更少。雅虎的创办人之一大卫 · 费罗给布林和佩奇的建议是:如果他们真的相信自己的搜索引擎独一无二,并愿意挖掘它的潜力,最好的选择是暂停在斯坦福大学博士阶段的学习,创办自己的公司。他说,这样,他们就能创造出适合他们搜索引擎的经营模式。如果这个引擎像他们所宣传的那样好的话,它就一定会很快站稳脚跟,因为,互联网成长速度惊人,而用户总是被吸引到最棒的服务和网站上。
电子书 分享网站
独特的PageRank技术(6)
不断遭到拒绝使拉里和谢尔盖备受打击,不过也使他们的信念更加坚定。他们不知道该怎么办。“他们面临两难的选择:‘我们要离开学校吗?或者我们把它作为一项课外项目进行?’”维诺格拉德说。在遭到一系列拒绝之后几个月,他们决定,至少目前他们的重点是为斯坦福大学的用户们改进自己的服务,以后再做出更重大的决定。有一天,在不熟练地摆弄一个叫做GIMP的图形软件的时候,谢尔盖仿照雅虎的标志,为Google的每个字母填充了颜色还在它们的后面添了一个感叹号。他似乎对自己做出的新标志非常满意,尽管它只不过是几个幼稚园风格的填充着基色的印刷体字母,而且还是放在纯白的背景之上的。不过,对谢尔盖最有意义的不是新标志的样子,令他得意的是,通过自学,他学会了使用GIMP,这个免费的图形软件并不很容易操作。
1998年春天,布林和佩奇向许多被他们称为Google的朋友的人发送电邮版新闻通讯,希望他们帮助自己传播信息。他们写道:“Google目前的数据库已经投入运行一个多月了,我们希望能够得到你的反馈——”“你对搜索结果还满意吗?对于新的标志和格式你有什么意见?我们提供的新服务对你有用处吗?如果有评论、批评或创意,或者发现其中的bug,都欢迎你提出来。此致!——拉里和谢尔盖。”
7月的时候,他们在每个
https://www.cwzww.com https://www.du8.org https://www.shuhuangxs.com www.baquge.cc