搜索引擎發(fā)展趨勢
1、社會化搜索
社交網(wǎng)絡平臺和應用占據(jù)了互聯(lián)網(wǎng)的主流,社交網(wǎng)絡平臺強調(diào)用戶之間的聯(lián)系和交互,這對傳統(tǒng)的搜索技術提出了新的挑戰(zhàn)。
傳統(tǒng)搜索技術強調(diào)搜索結(jié)果和用戶需求的相關性,社會化搜索除了相關性外,還額外增加了一個維度,即搜索結(jié)果的可信賴性。對某個搜索結(jié)果,傳統(tǒng)的結(jié)果可能成千上萬,但如果處于用戶社交網(wǎng)絡內(nèi)其他用戶發(fā)布的信息、點評或驗證過的信息則更容易信賴,這是與用戶的心里密切相關的。社會化搜索為用戶提供更準確、更值得信任的搜索結(jié)果。
2、實時搜索
對搜索引擎的實時性要求日益增高,這也是搜索引擎未來的一個發(fā)展方向。
實時搜索最突出的特點是時效性強,越來越多的突發(fā)事件首次發(fā)布在微博上,實時搜索核心強調(diào)的就是“快”,用戶發(fā)布的信息第一時間能被搜索引擎搜索到。不過在國內(nèi),實時搜索由于各方面的原因無法普及使用,比如Google的實時搜索是被重置的,百度也沒有明顯的實時搜索入口。
3、移動搜索
隨著智能手機的快速發(fā)展,基于手機的移動設備搜索日益流行,但移動設備有很大的局限性,比如屏幕太小,可顯示的區(qū)域不多,計算資源能力有限,打開網(wǎng)頁速度很慢,手機輸入繁瑣等問題都需要解決。
目前,隨著智能手機的快速普及,移動搜索一定會更加快速的發(fā)展,所以移動搜索的市場占有率會逐步上升,而對于沒有移動版的網(wǎng)站來說,百度也提供了“百度移動開放平臺”來彌補這個缺失。
4、個性化搜索
個性化搜索主要面臨兩個問題:如何建立用戶的個人興趣模型?在搜索引擎里如何使用這種個人興趣模型?
個性化搜索的核心是根據(jù)用戶的網(wǎng)絡行為,建立一套準確的個人興趣模型。而建立這樣一套模型,就要全民收集與用戶相關的信息,包括用戶搜索歷史、點擊記錄、瀏覽過的網(wǎng)頁、用戶E-mail信息、收藏夾信息、用戶發(fā)布過的信息、博客、微博等內(nèi)容。比較常見的是從這些信息中提取出關鍵詞及其權重。為不同用戶提供個性化的搜索結(jié)果,是搜索引擎總的發(fā)展趨勢,但現(xiàn)有技術有很多問題,比如個人隱私的泄露,而且用戶的興趣會不斷變化,太依賴歷史信息,可能無法反映用戶的興趣變化。
5、地理位置感知搜索
目前,很多手機已經(jīng)有GPS的應用了,這是基于地理位置感知的搜索,而且可以通過陀螺儀等設備感知用戶的朝向,基于這種信息,可以為用戶提供準確的地理位置服務以及相關搜索服務。目前,此類應用已經(jīng)大行其道,比如手機地圖APP。
6、跨語言搜索
如何將中文的用戶查詢翻譯為英文查詢,目前主流的方法有3種:機器翻譯、雙語詞典查詢和雙語語料挖掘。對于一個全球性的搜索引擎來說,具備跨語言搜索功能是必然的發(fā)展趨勢,而其基本的技術路線一般會采用查詢翻譯加上網(wǎng)頁的機器翻譯這兩種技術手段。
7、多媒體搜索
目前,搜索引擎的查詢還是基于文字的,即使是圖片和視頻搜索也是基于文本方式。那么未來的多媒體搜索技術則會彌補查詢這一缺失。多媒體形式除了文字,主要包括圖片、音頻、視頻。多媒體搜索比純文本搜索要復雜許多,一般多媒體搜索包含4個主要步驟:多媒體特征提取、多媒體數(shù)據(jù)流分割、多媒體數(shù)據(jù)分類和多媒體數(shù)據(jù)搜索引擎。
8、情境搜索
情境搜索是融合了多項技術的產(chǎn)品,上面介紹的社會化搜索、個性化搜索、地點感知搜索等都是支持情境搜索的,目前Google在大力提倡這一概念。所謂情境搜索,就是能夠感知人與人所處的環(huán)境,針對“此時此地此人”來建立模型,試圖理解用戶查詢的目的,根本目標還是要理解人的信息需求。比如某個用戶在蘋果專賣店附近發(fā)出“蘋果”這個搜索請求,基于地點感知及用戶的個性化模型,搜索引擎就有可能認為這個查詢是針對蘋果公司的產(chǎn)品,而非對水果的需求。