XHTML、DOCTYPE和Web標準的基礎知識

作者:佚名 來源:52CSS 時間:2008-04-02 類別:網頁理論

Web 標準使您能通過最少的工作,生成可被最廣大受眾訪問的 Web 站點。Web 標準的承諾是:只需設計頁面一次,即可讓該頁以完全相同的方式在任何現代的瀏覽器中顯示和工作。例如,在按照標準生成以后,旨在在 Microsoft Internet Explorer 中以某種方式顯示的頁可在其他瀏覽器(如,Mozilla Firefox、Netscape Navigator、Opera、Camino 和 Safari)中以相同的方式顯示,而無需完成任何額外的工作。

  Web 標準的一個額外好處是 ― 使 Web 站點更易于為殘疾人士訪問。這是一個范圍廣泛的受眾群體,包括視力衰退的中年人士,剛剛在滑雪時跌斷胳膊的人士,以及完全失明的人士等。使用標準可避免無意中阻止那些具有暫時性或永久性身體殘疾的人士訪問 Web 頁。

  HTML 在正式的場合已經過時了。World Wide Web Consortium (W3C) 于 2000 年 6 月 26 日發布了 XHTML 的第一個版本作為推薦標準。XHTML 標準的目標是取代 HTML。按照 W3C 的說法,“XHTML 是 HTML 的繼承者”(http://www.w3.org/MarkUp/)。

  XHTML 標準的制定者具有兩大目標:

  在文檔結構和表示形式之間創建更明顯的分離。 
  將 HTML 重新表示為 XML 的應用程序。 
  為了實現第一個目標,W3C 一直在堅定地從 HTML 中刪除純粹描述性的元素和屬性(他們是從 HTML 4.0 開始這一過程的)。例如,XHTML 1.0 Strict 不包含諸如 <font> 標記之類的元素或諸如 bgcolor 屬性之類的屬性,因為這些元素和屬性完全用于描述文檔的外觀,它們與文檔的結構沒有任何關系。

  W3C 一直在努力使 Web 站點設計人員和開發人員摒棄特定標記應當具有特定外觀這一觀念。例如,您可能會認為 <h1> 標記(標題標記)的用途是在頁中呈現大的加粗文本。這實際上是錯的。<h1> 標記用來在文檔中標記標題而不是其他任何東西。如何呈現標題標記由瀏覽器確定。視力衰退的人士使用的屏幕閱讀器可能利用抑揚頓挫的聲音來大聲朗讀標題標記的內容。不支持多個字體大小的 PDA 可能用閃爍文本呈現標題標記的內容。

  您不應當試圖使用諸如 <h1> 標記之類的頁元素來控制 Web 頁的外觀。相反,您應當通過使用層疊樣式表來指示 Web 頁的外觀。而且,您所使用的層疊樣式表應當是外部 層疊樣式表。請使用標記和屬性來標記文檔的結構,而使用樣式表來控制文檔的表示形式。

  XHTML 的第二個目標是迫使 HTML 開發人員遵守更為嚴格的 XML 規則。按照 W3C 的說法,“XHTML 1.0 是 HTML 4.01 的作為 XML 1.0 應用程序的修訂”(http://www.w3.org/MarkUp/)。換句話說,使用 XHTML 生成 Web 頁時,實際上是在創建 XML 文檔。

  XML 文檔具有比 HTML 文檔更嚴格的語法。例如,XML 區分大小寫,所有 XML 屬性都必須放在引號內,而且 XML 標記不能重疊。強迫 Web 站點開發人員和設計人員遵守有更高要求的語言規則有很多好處。

  好處之一,用 XHTML 標記編寫的頁具有更高的跨瀏覽器、跨設備和跨操作系統兼容性。如果在瀏覽器中打開傳統的 HTML 頁,瀏覽器將千方百計地呈現該頁。瀏覽器將試圖呈現該頁,即使您的 HTML 一團糟。例如,Internet Explorer(以及 Firefox 和 Opera)能夠很好地顯示下面的 HTML 頁。

  <i><B>this is bold and italic</I> and this is bold </body></HTML>Internet Explorer 會恰當地顯示該頁 ― 即使該頁缺少 <html> 和 <body> 開始標記,<b> 標記不具有匹配的結束標記,并且開始和結束 <i> 標記的大小寫不一致。所有主要的瀏覽器都能適應幾乎任何 HTML 標記“混合物”,并且不顧一切地呈現一些內容。

  瀏覽器的這種適應行為是危險的,因為不同的瀏覽器(或相同瀏覽器的將來版本,或在不同操作系統上運行的相同瀏覽器)可能以不同方式呈現錯亂的 HTML。實際上,對于最新版本的 Internet Explorer、Mozilla Firefox 和 Opera 而言,它們呈現無效 HTML 的方式驚人地一致。但是,一旦開始違反游戲規則,就不會得到任何保證。

  然而,如果用 XHTML 的更嚴格的規則編寫 Web 頁,那么 Web 頁就更有可能以一致的方式與當前瀏覽器協作,并且它們將繼續與當前瀏覽器的未來新版本協作。對于任何公司而言,幾乎都不具備針對每個瀏覽器、在每個操作系統和每個設備上測試其 Web 站點的資源。如果按照 Web 標準編寫頁面,那么就不必具有這樣的資源。

  XHTML 標準的版本

  有三個版本的 XHTML 1.0,它們分別對應三個版本的 HTML 4.01:

  XHTML 1.0 Transitional 
  XHTML 1.0 Strict 
  XHTML 1.0 Frameset 
  XHTML 1.0 Transitional 包含 HTML 4.01 Transitional 中的全部標記和屬性。引入 XHTML 1.0 Transitional 標準的目的是,使現有 HTML 設計人員和開發人員無需經歷太多的痛苦就能遷移到 XHTML。

  XHTML 1.0 Strict 與 XHTML 1.0 Transitional 的不同之處在于,它在文檔結構和表示形式之間實施了一種更為明顯的分離。與 XHTML 1.0 Transitional 不同,XHTML 1.0 Strict 強迫您使用層疊樣式表來控制頁的外觀。

  XHTML 1.0 Frameset 文檔意在成為使用 <frameset> 標記將瀏覽器劃分為多個框架的文檔(XHTML 1.0 Transitional 和 Strict 頁不能包含 <frameset> 標記)。

  W3C 還發布了 XHTML 1.1 以作為推薦標準(2001 年 5 月 31 日)。XHTML 1.1 非常類似于 XHTML 1.0 Strict。二者的主要區別在于,可以用附加模塊擴展 XHTML 1.1 以便支持新元素。例如,可以生成特定的 XHTML 1.1 頁,該頁還包含 MathML(數學標記語言)、SVG(可伸縮向量語言)或創建的自定義模塊中的元素。

  最后,W3C 正在制訂 XHTML 2.0 推薦標準。因為 XHTML 2.0 仍然處于起草階段,并且當前沒有 Web 瀏覽器支持該標準,所以我們不在本文討論它。

  創建 XHTML 頁

  與 HTML 頁不同,XHTML 頁必須是標準格式且有效的 XML 文檔。XHTML 1.0 推薦標準的第 4 部分對 HTML 和 XHTML 之間的區別進行了總結。這里給出生成有效 XHTML 頁的最重要需求的列表:

  頁必須包含有效的 XHTML DOCTYPE。 
  有效的 XHTML 頁必須在其任何內容之前包含一個 XHTML DOCTYPE。當在 Visual Studio .NET 2005 或 Microsoft Visual Web Developer 中創建新的 ASP.NET 頁時,該頁中將自動包含 XHTML 1.0 Transitional 的正確的 DOCTYPE。下面列出四個標準的 XHTML DOCTYPE:

  XHTML 1.0 Transitional

  <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">XHTML 1.0 Strict

  <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">XHTML 1.0 Frameset

  <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Frameset//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-frameset.dtd">XHTML 1.1 

  <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN" "http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd">向頁中添加 DOCTYPE 會影響該頁在瀏覽器中的呈現方式。請參閱以下標題為“XHTML 和 DOCTYPE 切換”的一節。 

  根元素必須引用 XHTML 命名空間。 
  XHTML 頁的開始 <html> 標記必須指定默認命名空間 http://www.w3.org/1999/xhtml。以下是 XHTML 1.0 Transitional 頁的有效開始 <html> 標記的示例:

  <html  xml:lang="en" lang="en">所有元素和屬性名都必須小寫。 
  XML 區分大小寫。因此,在 <p> 標記和 <P> 標記之間存在差異。只有前者是有效的 XHTML 段落標記。 

  屬性值必須始終放在引號內。 
  確保始終將屬性值放在雙引號或單引號中。例如,以下是無效的 XHTML。

  <a href=SomePage.aspx>Next</a>在該示例中,href 屬性缺少引號。以下代碼是有效的 XHTML。

  <a href="SomePage.aspx" mce_href="SomePage.aspx">Next</a>您可以通過選擇菜單選項 Tools、Options、Format,將 Visual Studio .NET 2005 和 Visual Web Developer 配置為自動將屬性值放在引號內。 

  所有具有開始標記的非空元素都必須具有匹配的結束標記。 
  如果具有開始 <p> 標記,則必須包含結束 </p> 標記來標記段落的結束。對于根本不包含任何內容的標記,例如 <br> 標記,可同時提供開始和結束標記 <br></br>,也可以使用空元素簡寫。

  為使 XHTML 頁與現有的 HTML 瀏覽器向后兼容,需要小心處理打開和關閉標記的方式。例如,現有 HTML 瀏覽器傾向于將開始和結束 <br> </br> 標記錯誤地解釋為兩個 <br> 元素。因此,您應當使用空元素簡寫</br>。

  此外,除非您小心地在結束斜杠之前添加一個空格,否則現有 HTML 瀏覽器在處理空元素簡寫時會出現問題。因此,應當使用 <BR< b>[space] />(而不是)向頁中添加 <br> 元素。 

  不得存在重疊標記。 
  可以使標記嵌套,但是不允許使標記重疊。例如,以下 XHTML 是有效的。

  <b><i>This is bold and italic</i></b>但是,以下 XHTML 是無效的。

  <i><b>This is bold and italic</i></b>不得存在屬性最簡化。 
  所有屬性都必須具有值,即使該值看起來有一點兒奇怪。例如,標記<input type=”checkbox” checked />是無效的 XHTML,因為 checked 屬性不具有值。該標記應當寫成<input type=”checkbox” checked=”checked” />。 

  必須使用 id 屬性而不是 name 屬性。 
  在 HTML 中,可以使用 name 屬性來標識 <a>、<applet>、<form>、<frame>、<iframe>、<img> 和 <map> 元素。盡管可以使用 name 屬性生成 XHTML 1.0 Transitional 頁,但在 XHTML 1.0 Strict 和 XHTML 1.1 標準中已經將 name 屬性刪除。您應當改而使用 id 屬性來標識這些元素。 

  必須將 <script> 和 <style> 元素的內容包裝到 CDATA 節中。 
  如果在腳本或樣式表中使用特殊字符(例如 < 或 &)或實體引用(例如 < 或 &),則需要將腳本或樣式表的內容標記為 CDATA(字符數據)節,如下所示。

  <script type="text/javascript"> <![CDATA[ function isLess(a, b) {     if (a < b) return true; } ]]> </script>使用 CDATA 節并非對所有瀏覽器都有效。例如,Internet Explorer 會將 <script> 標記中的 CDATA 節視為語法錯誤。可以通過添加 JavaScript 注釋避免該問題,如下所示。

  <script type="text/javascript"> /* <![CDATA[ */ function isLess(a, b) {     if (a < b) return true; } /* ]]> */ </script>JavaScript 使用 /* 和 */ 來標志注釋的開始和結束。因此,CDATA 節對 JavaScript 隱藏,但不對分析該頁的瀏覽器隱藏。總之,較好的做法是將樣式規則和腳本放在外部文件中,而從 XHTML 頁中引用這些文件。通過使用外部樣式表和腳本,能夠避免上述所有問題。 

  XHTML 和 DOCTYPE 切換

  為 Web頁指定 DOCTYPE 會影響瀏覽器呈現頁的方式。Internet Explorer、Mozilla Firefox 和 Opera 全都支持一種名為“DOCTYPE 切換”(也叫“DOCTYPE 嗅探”)的功能。

  引入 DOCTYPE 切換的目的是使瀏覽器能夠正確地呈現符合標準的 Web 站點以及舊式 Web 站點。大多數 Web 站點被開發為呈現 HTML 頁而不是 XHTML 頁。瀏覽器通過判斷是否存在 DOCTYPE 來確定何時應該使用標準來呈現頁。

  Internet Explorer 6+ 支持兩種呈現模式,分別叫做 Quirks 模式和 Standards 模式。當 Internet Explorer 呈現包含有效 XHTML(或 HTML 4.0)DOCTYPE 的頁時,它會以 Standards 模式呈現該頁;否則,它會以 Quirks模式呈現該頁(有關詳細信息,請參閱 CSS Enhancements in Internet Explorer 6)。

  Opera 瀏覽器 (Opera 7+) 支持與 Internet Explorer 相同的兩種呈現模式:Quirks 和 Standards(有關詳細信息,請參閱 http://www.opera.com/docs/specs/doctype/)。

  Mozilla Firefox 1+ 支持三種呈現模式:Quirks 模式、Almost Standards 模式和 Standards 模式。Firefox 的 Almost Standards 模式對應于 Internet Explorer 和 Opera 的 Standards 模式。當頁包含有效的 XHTML 1.0 Transitional DOCTYPE(并且該頁被分配為 text/html MIME 類型)時,Firefox 會以 Almost Standards 模式呈現該頁。當頁包含 XHTML 1.0 Strict 或 XHTML 1.1 DOCTYPE(或者該頁被分配為 XML MIME 類型)時,該頁將以 Standards 模式呈現(有關詳細信息,請參閱 http://www.mozilla.org/docs/web-developer/quirks/doctypes.html)。

  可以通過臨時向頁中添加以下客戶端腳本(該腳本在最新版本的 Internet Explorer、Firefox 和 Opera 中有效)確定瀏覽器的當前呈現模式。

  <script type="text/javascript"> alert( document.compatMode ); </script>您需要關心瀏覽器的呈現模式,因為它會影響將層疊樣式表應用于該頁的方式。如果將現有 HTML 頁轉換為 XHTML 頁,那么在瀏覽器中打開它們時,它們可能看起來非常不同。

  例如,Internet Explorer 以不同方式計算頁元素的大小,這取決于呈現模式(它使用不同的 CSS Box Model)。在 Quirks 模式下,元素的寬度是通過將元素的內容、內邊距、邊框和邊距相加而計算得到的。在 Standards 模式下,元素的寬度是只考慮元素內容的寬度而計算得到的。
标签: 基礎知識

相關文章:

推薦設計

最新文章