客戶推廣
當前位置:SEO165 > se基礎
搜索引擎技術及趨勢2
來源:搜索引擎直通車 時間:2005-9-28 瀏覽:

四、未來動向

 搜索引擎已成為一個新的研究、開發領域。因為它要用到信息檢索、人工智能、計算機網絡、分布式處理、數據庫、數據挖掘、數字圖書館、自然語言處理等多領域的理論和技術,所以具有綜合性和挑戰性。又由于搜索引擎有大量的用戶,有很好的經濟價值,所以引起了世界各國計算機科學界和信息產業界的高度關注,目前的研究、開發十分活躍,并出現了很多值得注意的動向。

 1.十分注意提高信息查詢結果的精度,提高檢索的有效性

 用戶在搜索引擎上進行信息查詢時,并不十分關注返回結果的多少,而是看結果是否和自己的需求吻合。對于一個查詢,傳統的搜索引擎動輒返回幾十萬、幾百萬篇文檔,用戶不得不在結果中篩選。解決查詢結果過多的現象目前出現了幾種方法:一是通過各種方法獲得用戶沒有在查詢語句中表達出來的真正用途,包括使用智能代理跟蹤用戶檢索行為,分析用戶模型;使用相關度反饋機制,使用戶告訴搜索引擎哪些文檔和自己的需求相關(及其相關的程度),哪些不相關,通過多次交互逐步求精。二是用正文分類(Text Categorization)技術將結果分類,使用可視化技術顯示分類結構,用戶可以只瀏覽自己感興趣的類別。三是進行站點類聚或內容類聚,減少信息的總量。

 2.基于智能代理的信息過濾和個性化服務

 信息智能代理是另外一種利用互聯網信息的機制。它使用自動獲得的領域模型(如Web知識、信息處理、與用戶興趣相關的信息資源、領域組織結構)、用戶模型(如用戶背景、興趣、行為、風格)知識進行信息搜集、索引、過濾(包括興趣過濾和不良信息過濾),并自動地將用戶感興趣的、對用戶有用的信息提交給用戶。智能代理具有不斷學習、適應信息和用戶興趣動態變化的能力,從而提供個性化的服務。智能代理可以在用戶端進行,也可以在服務器端運行。

 3.采用分布式體系結構提高系統規模和性能

 搜索引擎的實現可以采用集中式體系結構和分布式體系結構,兩種方法各有千秋。但當系統規模到達一定程度(如網頁數達到億級)時,必然要采用某種分布式方法,以提高系統性能。搜索引擎的各個組成部分,除了用戶接口之外,都可以進行分布:搜索器可以在多臺機器上相互合作、相互分工進行信息發現,以提高信息發現和更新速度;索引器可以將索引分布在不同的機器上,以減小索引對機器的要求;檢索器可以在不同的機器上進行文檔的并行檢索,以提高檢索的速度和性能。

 4.重視交叉語言檢索的研究和開發

 交叉語言信息檢索是指用戶用母語提交查詢,搜索引擎在多種語言的數據庫中進行信息檢索,返回能夠回答用戶問題的所有語言的文檔。如果再加上機器翻譯,返回結果可以用母語顯示。該技術目前還處于初步研究階段,主要的困難在于語言之間在表達方式和語義對應上的不確定性。但對于經濟全球化、互聯網跨越國界的今天,無疑具有很重要的意義。

五、學術研究

 目前搜索引擎領域的商業開發非;钴S,各大搜索引擎公司都在投巨資研制搜索引擎系統,同時也不斷地涌現出新的具有鮮明特色的搜索引擎產品,搜索引擎已經成為信息領域的產業之一。在這種情況下,對搜索引擎技術相關領域的學術研究得到了大學和科研機構的重視。如Stanford大學在其數字圖書館項目中開發了Google搜索引擎,在Web信息的高效搜索、文檔的相關度評價、大規模索引等方面作了深入的研究,取得了很好的成果。

 NEC美國研究所的Steve Lawrence和C. Lee Giles 1998年和1999年連續兩年在《自然》和《科學》雜志上撰文對搜索引擎技術的研究進行評述。著名的信息檢索會議TREC也從1998年開始增加了Web Track課題,以考察Web文檔與其它類型文檔在檢索性質上的不同之處,并將測試在大規模的Web庫(如100G字節)上進行信息檢索的算法性能。

 由美國Infornotics公司主辦的搜索引擎國際會議從1996年開始,每年舉行一次,對搜索引擎技術進行總結、討論和展望,參加者有著名的搜索引擎公司、大學和研究機構的學者,對搜索引擎技術起到了很好的推動作用。另外象IEEE主辦的國際萬維網會議、人機交互會議已有越來越多關于搜索引擎技術研究的文章發表。

 國內先后有北京大學、清華大學、國家智能研究中心等高校和研究單位對搜索引擎技術開展研究,并開發出了幾個較好的系統。如由北京大學計算機系網絡研究室開發的“天網”中英文搜索引擎(http://pccms.pku.edu.cn:8000/gbindex.php),在系統規模及系統性能方面達到了國外中型搜索引擎系統的技術水平,為國內用戶提供了很好的互聯網搜索服務,受到了用戶的好評。

上一頁


【聲明】:
  以上搜索引擎優化文章或資料除注明為SEO165.COM自創或編輯整理外,均為各方收集或網友推薦所得。其中摘錄的內容以共享、研究為目的,不存在任何商業考慮。
  目前網站上有些文章未注明作者或出處,甚至標注錯誤,此類情況出現并非不尊重作者及出處網站,而是因為有些資料來源的不規范。如果有了解作者或出處的原作者或網友,請告知,本網站將立即更正注明,并向作者或出處單位道歉。
  被摘錄的對象如有任何異議,請與本站聯系,本站確認后將立即撤下。謝謝您的支持與理解!
公司介紹 - 聯系我們 - 留言 - 地圖 - 免費登錄 - Google排名 - Google優化 - 搜索引擎大全 - 網站優化 - 網站推廣 - 工具條 -

抢红包客服 宝博棋牌安卓版下载 最新AV番号网 nba总得分榜历史 河南麻将游戏 广东快乐十分开奖一 安徽十一选五走势基 日本av女优日本色情网 天天捕鱼达人 海南麻将官方 360排列五基本走势图2000 3d测试号专家预测 快播怎样搜索a片 呼和浩特按摩休闲会所 白小姐精选资料六肖中特 今天适合打麻将吗 熟客温州麻将安卓版