客戶推廣
當前位置:SEO165 > se基礎
搜索引擎是如何工作的?
來源:北京奕天銳新 時間:2005-9-28 瀏覽:
  我經常會遇到一些不知道 搜索引擎如何收集信息的人。他們知道什么是搜索引擎,而且也理解得到搜索引擎索引的重要性,盡管有些人知道一些,但當你開始談論諸如爬行程序之類的內容時,他們就開始卡殼了。

  不要再出現卡殼這樣的尷尬場面了。本文旨在幫你揭示一些你對搜索引擎還不是很肯定的東西。畢竟,如果你想通過得到搜索引擎的收錄而受益,你還是了解一下搜索引擎如何工作為好。

  合三為一

  基于爬行程序的搜索引擎是由三部分組成的:爬行程序、索引和軟件。每一部分都具有自己的功能并且三個部分一起產生了我們在搜索引擎結果頁面(SERPs)上所看到的內容。
饑餓的爬行程序

  另一個廣為人知的名字是網絡爬行程序或者機器人,搜索引擎爬行程序就是能閱讀網頁和跟蹤站點內到其它網頁任何鏈接的一個自動程序。我們經常將一個稱為被“爬行”或“索引”。在網絡上有三種非常饑餓、非;钴S的爬行程序。它們的名字為Googlebot(Google)、Slurp( Yahoo。┖蚆SNBot(MSN 搜索)。

  爬行程序會從先前添加到它們索引(數據庫)中的系列網頁URLs開始網絡之旅。在它們訪問這些網頁時,它們爬行編碼和副本,它將在網絡上找到的新網頁(鏈接)也添加到它的索引之中。對于這個過程,我們可以將爬行程序稱為是正在建立索引,稍后將進一步加以討論。

  爬行程序會根據一個固定的周期回訪其目錄中的站點,尋找任何的更新。至于爬行程序回訪的頻率,這要由搜索引擎確定。網站擁有者通過采用一個名為robot.txt的文件確實能控制爬行程序訪問這個站點的頻率。搜索引擎在進一步爬行一個網站之前首先查看這個文件。

  正在成長的索引

  索引就像是一個包含爬行程序所找到網站每一個網頁和文件副本的巨大目錄或者詳細目錄。如果某一個網頁發生了變化,則會使用新的信息來更新這個目錄。為了能使一個數量的概念給你描述這些索引的大小,Google最新公布的數字是80億個網頁。

  有時候需要一定的時間才能讓爬行程序找到新的網頁和更改并添加到自己的索引中。由此,一個網頁可能已被“爬行”但尚未“索引”。知道一個網頁被索引后——添加到索引中——此時在搜索引擎中是搜索不到這些被爬行過的網頁的。

  搜索引擎的工作模式

  每天,搜索引擎都通過一個設計好的軟件來詳細審核其索引中的數十億的網頁索引,并找出哪些與搜索查詢最為匹配以及將其按最為相關的順序進行 排名。

  搜索引擎面對的是數百億需要排序的網頁,它如何決定相關性呢?每一個搜索引擎都已形成了一套規則和數學公式,我們將其稱之為算法,用這種算法來決定網頁的排名。

  至于每一家搜索引擎的算法是如何工作的這是一個秘密,但常常用來改進一個網站的排名性能的一般原則大家還是知道的,我們將其稱之為搜索引擎優化。

  搜索引擎不時簡單地采用網頁副本將相關的網頁根據一個垂直的主題進行分組。如果我們取出一個與電影行業相關的網頁,這些主題或者組可能是娛樂、電影娛樂、電影明星娛樂等等。每一個主題都有描述這個組所包含網頁的公共字和短語。有些網頁可能不單單屬于一個組,例如:與電影利潤相關的一個網頁可能既屬于金融組又屬于娛樂組。

  SERP(或搜索引擎結果頁)

  將此算法應用于索引的站點后,根據所執行的搜索,搜索引擎會給出一些最相關的搜索結果。

  我們來簡化一個復雜的過程,當一位用戶輸入一個搜索查詢時,搜索引擎根據這個網頁對其認為相關的索引進行分析和檢索。如果它具有一個相關網頁的候選名單,它會依據另外的算法因素對這些列表進行進一步計算,以便決定以何種順序將其展示給用戶。這些因素或許是用戶的位置,當然了,甚至也可能是用戶的搜索歷史記錄。

  每個搜索引擎所使用的算法是不同的,這就是為什么對于相同的查詢,每個搜索引擎所搜索到的結果不盡相同的原因。每一個搜索引擎都有自己的小生境,因此,對于一個用戶常常同時使用多個搜索引擎來搜索一個內容并不少見。這進一步說明了網站擁有者將其網站在所有搜索引擎上獲得索引并得到較好的排名是非常重要的。

  結論

  搜索引擎的目標是如何適合用戶的口味。它們因此想在第一時間給用戶提供合適的、相關的、信息量大的站點來滿足他們。


【聲明】:
  以上搜索引擎優化文章或資料除注明為SEO165.COM自創或編輯整理外,均為各方收集或網友推薦所得。其中摘錄的內容以共享、研究為目的,不存在任何商業考慮。
  目前網站上有些文章未注明作者或出處,甚至標注錯誤,此類情況出現并非不尊重作者及出處網站,而是因為有些資料來源的不規范。如果有了解作者或出處的原作者或網友,請告知,本網站將立即更正注明,并向作者或出處單位道歉。
  被摘錄的對象如有任何異議,請與本站聯系,本站確認后將立即撤下。謝謝您的支持與理解!
公司介紹 - 聯系我們 - 留言 - 地圖 - 免費登錄 - Google排名 - Google優化 - 搜索引擎大全 - 網站優化 - 網站推廣 - 工具條 -

抢红包客服 新浪财经 上证指数 上海11选5任走势图 大地棋牌游戏官方网站 星悦浙江麻将下载安装 最新大嘴棋牌官网 3d非常准的独胆公式表 网赚平台源码 广西十一选五 东方6+1 辽宁35选7走势图500期 黑龙江22选5中奖 欧洲篮球比分网 神算子精选资料网站 784123精选六马 追光娱乐棋牌app 山西快乐10分玩法说明