谷歌這些年的一系列舉動,從Android到Chrome,從語音搜索到谷歌TV,都是其對未來搜索認識的投影。
許多人曾經(jīng)懷疑,搜索技術(shù)還能走多遠,甚至前幾年,還有人說,搜索能夠做的90%的事情都已經(jīng)做完了。但谷歌里的極客們認為,這種觀點是固守杜威分類時代傳統(tǒng)思維的短視和淺薄之見。谷歌的極客們有資格不屑于這種觀點,因為他們最了解搜索的科學!八阉魇且粋可以不斷發(fā)展幾百年的科學”,谷歌副總裁瑪麗薩·梅耶爾曾說。谷歌也不止一次對外宣稱,搜索的最終目標是理解人的“意思”,即人工智能。如同谷歌創(chuàng)始人謝爾蓋·布林曾經(jīng)提到過的“搜索直接連接大腦”的概念。
搜索的科學
布林關(guān)于“搜索直接連接大腦”的概念如果換成不那么“理工男”的浪漫一點的說法,就是人類的知識最終會由激情來分類:信息流的任何一個結(jié)點、神經(jīng)元活動中的任何一波電子火花都能成為一個知識分類的標簽,《新數(shù)字秩序的革命》一書的作者戴維·溫伯格就持此觀點。
這并非幻想,而的確是科學,至少谷歌信仰這種科學,而且已經(jīng)有了發(fā)展這一科學的方法論和路線圖。谷歌的首席研究員阿密特·辛格是谷歌中少數(shù)幾個有資格談?wù)摴雀璺椒ㄕ摵吐肪圖的人,他在2001年重寫了谷歌搜索引擎的算法。他是把這套方法論變得更系統(tǒng)、可執(zhí)行的一位提煉者,同時他也在制定和推動谷歌搜索路線圖前進的每一步。 簡單講,阿密特講述的搜索科學的方法論就是,算法和工具的雙螺旋循環(huán)。 首先是工具,阿密特認為,人類智能的發(fā)展是一個不斷發(fā)明和改進工具的過程,“針對每一種工作都有其工具,我們將愈發(fā)精雕細琢!卑⒚芴亍ば粮駥τ浾哒f。他說的并不是模糊的宏大趨勢,這恰恰就是搜索科學的基礎(chǔ)!爸钡斤@微鏡和望遠鏡被發(fā)明出來,長期在黑暗中探索的生物學和物理學才有了實質(zhì)性的突破。所以,搜索的真正偉大的階段其實并沒有到來。”瑪麗薩·梅耶爾用生物學和物理學在15、16世紀的例子來形容今天的搜索科學。谷歌在不斷為云端和各種接地設(shè)備提供新產(chǎn)品,因為谷歌認為這些應(yīng)用工具就是搜索科學的顯微鏡和望遠鏡,能照亮搜索通向大腦和世界的未來之路,源源不斷搜集數(shù)據(jù)。
秘密配方
算法的改進所依賴的正是這些數(shù)據(jù)。算法一直是谷歌的“神秘配方”,實際上,谷歌的搜索引擎在2001年后進行了多次重大改造,其中就包括阿密特·辛格2001年的算法重寫。谷歌機器人做的工作首先是對數(shù)據(jù)進行抽取、分類和結(jié)構(gòu)化(通過文字進行組織,就像書本的目錄),難點在于排序,這像是讓一個機器人表演同時拋起200個瓶子的高難度雜技。機器人程序的編寫者更像一位藝術(shù)家,他要讓機器人理解數(shù)據(jù)的上下文,“所有搜索引擎都會引入上下文,但沒有一個像谷歌引入得那樣多、應(yīng)用那樣自如。PageRank(網(wǎng)頁級別)本身也是一個信號,同時也是頁面的一個屬性(指其相對于其他網(wǎng)頁的重要性),該屬性可以幫助確定其與查詢內(nèi)容的相關(guān)性”,《連線》雜志在今年2月的文章中介紹。 標題通常被予以特別關(guān)注,錨文本可以通俗理解為超鏈接,對于用戶可能沒有看到,但對于谷歌機器人,它是非常重要的指標。隨著網(wǎng)頁功能日益復(fù)雜化、智能化,機器人對網(wǎng)頁數(shù)據(jù)的抽取和結(jié)構(gòu)化也日益復(fù)雜。新鮮度(對于一些查詢,新近的頁面比較早的頁面更有價值)和地理位置(谷歌知道搜索者的大致地理坐標,會將本地信息排在前面)成為越來越重要的信號!肮雀枘壳笆褂200多種信號來幫助確定搜索結(jié)果的排序!薄哆B線》雜志說。同時,阿密特·辛格還指出,用戶在搜索過程中產(chǎn)生的數(shù)據(jù)被證明同樣很有價值,這些數(shù)據(jù)包括他們點擊哪些結(jié)果、不滿意時對關(guān)鍵詞的更改、查詢關(guān)鍵詞與所處地理位置的關(guān)系等。總之,機器人可以從200多個維度來理解用戶的搜索意圖,可能是用戶所處的情景模式,旅游或是購物;也可能是用戶希望要的媒體形式——文字、圖片、聲音或者動態(tài)的實時資訊;也可能是用戶所屬的國家、地理位置或者使用的語言;還有用戶的社交圈(需要登錄谷歌個人賬戶)——機器人能夠理解用戶敲入關(guān)鍵詞背后的復(fù)雜意圖,提供個性化搜索。
重要的進展
據(jù)說今年谷歌對搜索引擎的改進多達500項,這些改進被阿密特·辛格形容為給高度3萬英尺、速度每小時1000英里的飛機改進引擎。每年,我們能從兩個會議上看到谷歌“亞歷山大圖書館”浩大工程的進展,一個是谷歌的I/O大會,針對外部的開發(fā)者群體;另一個是“搜索的科學”大會,可以窺見谷歌搜索引擎的進展。2010年在東京舉辦的谷歌“搜索的科學”大會上,谷歌展示了它的重要進展。
“搜索的科學”大會的一個亮點是Chrome to Phone。Chrome to Phone就好像Chrome OS在手機上的一個切入點,它可以同步桌面互聯(lián)網(wǎng)上的視頻、地圖等信息,比如用戶在家的電腦上未看完的世界杯比賽視頻或者約會位置的地圖信息需要攜帶出門,完全可以通過同步到Chrome to Phone,在Android手機上實現(xiàn)。第二個亮點是谷歌TV。它是一個電視的操作系統(tǒng),內(nèi)嵌在機頂盒、藍光播放機等器材之內(nèi),用戶只需單一平臺,在能看電視、影碟之余,更可以搜索比如在YouTube,CNN新聞等成千上萬網(wǎng)上頻道的節(jié)目;甚至通過無線網(wǎng)絡(luò)用Android手機操作,或用語音搜尋;更支持邊看電視邊上網(wǎng)找資料的畫中畫功能。谷歌公司透露谷歌TV將于明年初正式面世。
為什么谷歌會做如此多看似與搜索不相關(guān)的應(yīng)用?其實,這些應(yīng)用就是搜索的未來。阿密特·辛格認為搜索引擎最終會成為用戶的個人助理,無論用戶是誰、身在何時、何地,都能提供他們最需要的信息。辛格對搜索引擎抱有的幾大夢想正在一一實現(xiàn):比如超越文本的搜索(用聲音、圖像和視頻來搜索);超越語言的搜索(搜索時自動翻譯,并結(jié)合所屬語種的語境上下文);搜索社交網(wǎng)絡(luò)里的信息(用戶的朋友對某一問題的看法);搜索這一秒鐘的世界(實時搜索);搜索離用戶最近的信息(比如最近的便利店、加油站等位置信息)。
谷歌最終夢想是不需要搜索的搜索,也就是連接人類的大腦和世界的機器。 |