客戶推廣
當前位置:SEO165 > 搜索引擎優化
面向搜索引擎的URL設計
來源:http://www.chedong.com/tech/Google_url.html 時間:2005-9-27 瀏覽:

不得不承認,將動態網頁鏈接rewriting成靜態鏈接是最保險和穩定的面向搜索引擎優化方式。

此外隨著互聯網上的內容以驚人速度的增長也越來越突出了搜索引擎的重要性,如果網站想更好地被搜索引擎收錄,網站設計除了面向用戶友好(User Friendly)外,搜索引擎友好(Search Engine Friendly)的設計也是非常重要的。進入搜索引擎的頁面內容越多,則被用戶用不同的關鍵詞找到的幾率越大。在Google的算法調查一文中提到一個站點被Google索引頁面的數量其實對PageRank也是有一定影響的。由于Google 突出的是整個網絡中相對靜態的部分(動態網頁索引量比較。,鏈接地址相對固定的靜態網頁比較適合被Google索引(怪不得很多大網站的郵件列表歸檔和BLOG按日期歸檔的文檔很容被搜的到),因此很多關于面向搜索引擎 URL設計優化(URI Pretty)的文章中提到了很多利用一定機制將動態網頁參數變成像靜態網頁的形式。比如可以將:

http://phpunixman.sourceforge.net/index.php?mode=man¶meter=ls

變成:

http://phpunixman.sourceforge.net/index.php/man/ls

實現方式主要有2種:

基于url rewrite
IIS的ISAPI REWRITE下載(免費)
基于path_info
把URI地址用作參數傳遞:URL REWRITE

最簡單的是基于各種WEB服務器中的URL重寫轉向(Rewrite)模塊的URL轉換:這樣幾乎可以不修改程序的實現將 news.asp?id=234 這樣的鏈接映射成 news/234.html,從外面看上去和靜態鏈接一樣。Apache服務器上有一個模塊(非缺。簃od_rewrite:URL REWRITE功能之強大足夠寫上一本書。

當我需要將將news.asp?id=234的映射成news/234.html時,只需設置:
RewriteRule /news/(d+).html /news.asp?id=$1 [N,I]
這樣就把 /news/234.html 這樣的請求映射成了 /news.asp?id=234
當有對/news/234.html的請求時:web服務器會把實際請求轉發給/news.asp?id=234

而在IIS也有相應的REWRITE模塊:比如ISAPI REWRITE和IIS REWRITE,語法都是基于正則表達式,因此配置幾乎和apache的mod_rewrite是相同的:

比對于某一個簡單應用可以是:
RewriteRule /news/(d+).html /news/news.php?id=$1 [N,I]
這樣就把 http://www.chedong.com/news/234.html 映射到了 http://www.chedong.com/news/news.php?id=234

一個更通用的能夠將所有的動態頁面進行參數映射的表達式是:
把 http://www.myhost.com/foo.php?a=A&b=B&c=C
表現成 http://www.myhost.com/foo.php/a/A/b/B/c/C。
RewriteRule (.*?.php)(?[^/]*)?/([^/]*)/([^/]*)(.+?)? $1(?2$2&:?)$3=$4?5$5: [N,I]

一下是真對phpBB的一個Apache mod_rewrite配置樣例:
mod_rewrite和isapirewrite基本兼容,但是還是有些不同,比如:isapirewrite中"?"需要轉義成"?",mod_rewrite不用,isapirewrite支持 “d+” (全部數字),mod_rewrite不支持
RewriteEngine On
RewriteRule /forum/topic_(.+).html$ /forum/viewtopic.php?t=$1 [L]
RewriteRule /forum/forum_(.+).html$ /forum/viewforum.php?f=$1 [L]
RewriteRule /forum/user_(.+).html$ /forum/profile.php?mode=viewprofile&u=$1 [L]

這樣設置后就可以通過topic_1234.html forum_2.html user_34.html這樣的鏈接訪問原來的動態頁面了。
通過URL REWRITE還有一些好處:

隱藏后臺實現:這在后臺應用平臺的遷移時非常有用:當從asp遷移到java平臺時,對于前臺用戶來說,根本感受不到后臺應用的變化;
簡化數據校驗:因為像(d+)這樣的參數,可以有效的控制數字的格式甚至位數;
比如我們需要將應用從news.asp?id=234遷移成news.php?query=234時,前臺的表現可以一直保持為 news/234.html。從實現應用和前臺表現的分離:保持了URL的穩定性,而使用mod_rewrite甚至可以把請求轉發到其他后臺服務器上。

基于PATH_INFO的URL美化
Url美化的另外一個方式就是基于PATH_INFO:
PATH_INFO是一個CGI 1.1的標準,經常發現很多跟在CGI后面的"/value_1/value_2″就是PATH_INFO參數:
比如http://phpunixman.sourceforge.net/index.php/man/ls,中:$PATH_INFO = “/man/ls”

PATH_INFO是CGI標準,因此PHP Servlet等都有的支持。比如Servlet中就有request.getPathInfo()方法。
注意:/myapp/servlet/Hello/foo的 getPathInfo()返回的是/foo,而/myapp/dir/hello.jsp/foo的getPathInfo()將返回的 /hello.jsp,從這里你也可以知道jsp其實就是一個Servlet的PATH_INFO參數。ASP不支持PATH_INFO,

PHP中基于PATH_INFO的參數解析的例子如下:
//注意:參數按"/"分割,第一個參數是空的:從/param1/param2中解析出$param1 $param2這2個參數
if ( isset($_SERVER["PATH_INFO"]) ) {
list($nothing, $param1, $param2) = explode(’/’, $_SERVER["PATH_INFO"]);
}

如何隱蔽應用:例如 .php,的擴展名:
在APACHE中這樣配置:ForceType application/x-httpd-php

如何更像靜態頁面:app_name/my/app.html
解析的PATH_INFO參數的時候,把最后一個參數的最后5個字符“.html”截斷即可。
注意:APACHE2中缺省是不允許PATH_INFO的,需要設置AcceptPathInfo on

特別是針對使用虛擬主機用戶,無權安裝和配置mod_rewrite的時候,PATH_INFO往往就成了唯一的選擇。

OK,這樣以后看見類似于http://www.example.com/article/234這樣的網頁你就知道可能是 article/show.php?id=234這個php程序生成的動態網頁,很多站點表面看上去可能有很多靜態目錄,其實很有可能都是使用1,2個程序實現的內容發布。比如很多WIKIWIKI系統都使用了這個機制:整個系統就一個簡單的wiki程序,而看上去的目錄其實都是這個應用拿后面的地址作為參數的查詢結果。

利用基于MOD_REWRITE/PATH_INFO + CACHE服務器的解決方案對原有的動態發布系統進行改造,也可以大大降低舊有系統升級到新的內容管理系統的成本。并且方便了搜索引擎收錄入索引。
附:如何在IIS上利用PHP支持PATH_INFO,PHP的ISAPI模式安裝備忘:只試成 php-4.2.3-Win32

解包目錄
========
php-4.2.3-Win32.zip c:php

PHP.INI初始化文件
=================
復制:c:phpphp.ini-dist 到 c:winntphp.ini

配置文件關聯
============
按照install.txt中的說明配置文件關聯

運行庫文件
==========
復制 c:phpphp4ts.dll 到 c:winntsystem32php4ts.dll

這樣運行后:會發現php把PATH_INFO映射到了物理路徑上
Warning: Unknown(C:CheDongDownloadsariadnewwwtest.phppath): failed to create stream: No such file or directory in Unknown on line 0

Warning: Unknown(): Failed opening ‘C:CheDongDownloadsariadnewwwtest.phppath’ for inclusion (include_path=’.;c:php4pear’) in Unknown on line 0

安裝ariadne的PATCH
==================
停止IIS服務
net stop iisadmin
ftp://ftp.muze.nl/pub/ariadne/win/iis/php-4.2.3/php4isapi.dll
覆蓋原有的c:phpsapiphp4isapi.dll

注:
ariadne是一個基于PATH_INFO的內容發布系統,
PHP 4.3.2 RC2中CGI模式的PATH_INFO已經修正,照常安裝即可。

參考資料:
URL Rewrite文檔:
ISAPI REWRITE文檔
IIS的ISAPI REWRITE下載(免費)
http://httpd.apache.org/docs/mod/mod_rewrite.html
http://httpd.apache.org/docs-2.0/mod/mod_rewrite.html

搜索引擎友好的URL設計,http://www.sitepoint.com/article/485說不定這個URL原來就是articel.php?id=485

一個基于PATH_INFO的開源內容管理系統,http://typo3.com/

Google的PageRank算法說明:http://pr.efactory.de/


【聲明】:
  以上搜索引擎優化文章或資料除注明為SEO165.COM自創或編輯整理外,均為各方收集或網友推薦所得。其中摘錄的內容以共享、研究為目的,不存在任何商業考慮。
  目前網站上有些文章未注明作者或出處,甚至標注錯誤,此類情況出現并非不尊重作者及出處網站,而是因為有些資料來源的不規范。如果有了解作者或出處的原作者或網友,請告知,本網站將立即更正注明,并向作者或出處單位道歉。
  被摘錄的對象如有任何異議,請與本站聯系,本站確認后將立即撤下。謝謝您的支持與理解!
公司介紹 - 聯系我們 - 留言 - 地圖 - 免費登錄 - Google排名 - Google優化 - 搜索引擎大全 - 網站優化 - 網站推廣 - 工具條 -

抢红包客服 11选5 重庆麻将规则算账 街机电玩捕鱼游戏机厂家 全民福州麻将安卓 吉林快三走势图-百度 幸运11选5假 广东36选7开奖 信誉度高的棋牌游戏 52大庆麻将的漏洞 广东十一选五基本走势图 甘肃11选5一定牛 cba比分直播吧 山东11选5的1胆3期计划 pc蛋蛋计划 天津麻将怎么玩 11选5玩法技巧与盈利