xml中的空格之完全解說
提示:我提取了《xslt從入門到精通》中關(guān)于空格解釋的核心部分,借以拋磚引玉,希望大家踴躍參與討論。談?wù)勀銓?duì)空格的理解。
只適合對(duì)xml文件結(jié)構(gòu)有一定了解的學(xué)者,不適合初學(xué)者。請(qǐng)按從上至下的順序閱讀。
對(duì)html文件而言,空格不重要;然而,對(duì)xml而言,默認(rèn)立場(chǎng)就是要保留空格結(jié)點(diǎn)(空格結(jié)點(diǎn)的解釋見下文)。
根據(jù)xml規(guī)范的規(guī)定,所謂空格是四種字符的任意組合序列:
-----------------------
空格字符(space),對(duì)應(yīng)字符值為 #x20
返回字符(Carriage Return),對(duì)應(yīng)字符值為 #xD
新行字符(Newline),對(duì)應(yīng)字符值為 #xA
跳格字符(Tab),對(duì)應(yīng)字符值為 #x9。
xml文件的空格也會(huì)形成結(jié)點(diǎn),也就是空格結(jié)點(diǎn)??崭窠Y(jié)點(diǎn)屬于文字結(jié)點(diǎn)類型。
對(duì)xml和xslt而言,空格結(jié)點(diǎn)會(huì)牽涉到兩個(gè)議題:
-----------------------
1。在xml輸入文件中決定哪些空格是重要的,xslt處理器要看見這些空格結(jié)點(diǎn)。而決定的密鑰就是xml:space屬性。
2。在xsl模板文件中決定哪些空格是重要的,xslt處理器應(yīng)將它復(fù)制到結(jié)果樹中,而決定的密鑰就是xsl:strip-space
和xsl:preserve-space這兩個(gè)命令。
“重要和不重要的空格結(jié)點(diǎn)”
-----------------------
若某組件的內(nèi)容只能放組件,則該組件中的空格結(jié)點(diǎn)就是不重要的(Insignificant);
如果某組件的內(nèi)容是#PCDATA的類型,則其內(nèi)的空格結(jié)點(diǎn)應(yīng)視為重要的(Signficant)。
至于組件內(nèi)容混雜了文字內(nèi)容和組件的情況則無從評(píng)判,應(yīng)視組件及其內(nèi)容之語意而定。
xslt處理器接觸到xml輸入文件之前,會(huì)先由xml分析器進(jìn)行分析
-----------------------
(1)xml:space屬性可以改變后續(xù)接手的xml應(yīng)用程序處理空格結(jié)點(diǎn)的模式,例如,xslt處理器就會(huì)受xml:space屬性影響。
(2)xml文件中任何一列標(biāo)記或內(nèi)容尾端的結(jié)尾的結(jié)尾符號(hào)全部會(huì)換成單一新行字符(#xA)。
(3)屬性值交給xml應(yīng)用程序之前,xml分析器也應(yīng)該先對(duì)屬性值做規(guī)范化的操作。這是因?yàn)椴煌牟僮飨到y(tǒng)每一行文字列的結(jié)尾字符有不同的組合,例如,windows系統(tǒng)會(huì)由返回字符呵新行字符組成結(jié)尾符號(hào),而Unix系統(tǒng)則僅由新行字符組
成結(jié)尾符號(hào)。xml分析器在讀取xml文件之后,便先行將所有結(jié)尾符號(hào)換成單一新行字符,不僅統(tǒng)一了不同系統(tǒng)間不同結(jié)尾符號(hào)設(shè)計(jì)的差異性,同時(shí)也簡(jiǎn)化了后續(xù)xml應(yīng)用程序的的操作難度。這樣一個(gè)處理過程稱為“規(guī)范化(Normalization)”。
a,每一文字列的結(jié)尾符號(hào)都要規(guī)范化成單一的新行字符(#xA)。
b,任何一個(gè)空格符(#x20、#xD、#xA、#x9)都應(yīng)換成一個(gè)空格字符(#x20)。
c,屬性值中若含有字參碼,則應(yīng)替換成該參考字符,例如,
會(huì)換成新行字符(#xA)。
d,屬性值若含有實(shí)體參考,則應(yīng)以其替換文字替換。
e,除此之外,任何字符都應(yīng)直接放入規(guī)范化屬性值中。
f,最后,如果屬性類型不是CDATA,則xml分析器應(yīng)該再進(jìn)一步把屬性值前后的空格字符序列刪除,而且屬性值中間若有空格序列,也應(yīng)該替換成單一空格字符。
xslt處理器把xml輸入文件和xsl模板文件的結(jié)構(gòu)樹建好之后,會(huì)現(xiàn)把組件中相鄰的文字結(jié)點(diǎn)合并成單一的文字結(jié)點(diǎn),然后再把一些文字結(jié)點(diǎn)抽掉。然而,如果文字結(jié)點(diǎn)符合下列條件之一,就會(huì)被保留下來:
-----------------------
(1)文字結(jié)點(diǎn)的父組件是空格保留組件名稱集(Set Of Whitespace-preserving Element Names)中的一員。
(2)文字結(jié)點(diǎn)中至少有一個(gè)非空格符。
(3)文字結(jié)點(diǎn)的某個(gè)祖先組件中有xml:space屬性,其值為preserve,而且較近的祖先組件中沒有其他xml:space屬性值為default。除此之外的文字結(jié)點(diǎn)逗會(huì)被抽掉。
對(duì)xsl模板而言,所謂的空格保留組件名稱集只有一個(gè)xsl:text組件可用。xsl模板文件的空格結(jié)點(diǎn)都會(huì)被刪除,但是,如果空格結(jié)點(diǎn)出現(xiàn)在xsl:text組件中就會(huì)被保留下來。
上一篇:WML教程之文本框控件Input
欄 目:XML/RSS
下一篇:無線標(biāo)記語言(WML)基礎(chǔ)之WMLScript 基礎(chǔ)第1/2頁
本文標(biāo)題:xml中的空格之完全解說
本文地址:http://mengdiqiu.com.cn/a1/XML_RSS/11724.html
您可能感興趣的文章
- 01-11XML中顯示HTML的小技巧
- 01-11使用Spry輕松將XML數(shù)據(jù)顯示到HTML頁的方法
- 01-11xml文件的結(jié)構(gòu)解讀第1/2頁
- 01-11得到XML文檔大小的方法
- 01-11用xslt將xml解析成xhtml的代碼
- 01-11XML解析錯(cuò)誤:未組織好 的解決辦法
- 01-11用Asp與XML實(shí)現(xiàn)交互的一個(gè)實(shí)例源碼
- 01-11怎樣打開XML文件?xml文件如何打開?
- 01-11asp下利用xml打包網(wǎng)站文件
- 01-11不同瀏覽器對(duì)XML的解析是不同的


閱讀排行
- 1C語言 while語句的用法詳解
- 2java 實(shí)現(xiàn)簡(jiǎn)單圣誕樹的示例代碼(圣誕
- 3利用C語言實(shí)現(xiàn)“百馬百擔(dān)”問題方法
- 4C語言中計(jì)算正弦的相關(guān)函數(shù)總結(jié)
- 5c語言計(jì)算三角形面積代碼
- 6什么是 WSH(腳本宿主)的詳細(xì)解釋
- 7C++ 中隨機(jī)函數(shù)random函數(shù)的使用方法
- 8正則表達(dá)式匹配各種特殊字符
- 9C語言十進(jìn)制轉(zhuǎn)二進(jìn)制代碼實(shí)例
- 10C語言查找數(shù)組里數(shù)字重復(fù)次數(shù)的方法
本欄相關(guān)
- 01-11關(guān)于XSL - XSL教程
- 01-11WMLScript的語法基礎(chǔ)
- 01-11選擇模式 - XSL教程 - 2
- 01-11WML學(xué)習(xí)之五 顯示表單
- 01-11WML學(xué)習(xí)之三 顯示文本
- 01-11匹配模式 - XSL教程 - 4
- 01-11WML語法大全與相關(guān)介紹第1/3頁
- 01-11XPath入門 - XSL教程 - 3
- 01-11測(cè)試模式 - XSL教程 - 5
- 01-11WAP建站W(wǎng)ML語言語法基礎(chǔ)教程第1/6頁
隨機(jī)閱讀
- 01-10C#中split用法實(shí)例總結(jié)
- 01-10使用C語言求解撲克牌的順子及n個(gè)骰子
- 01-11Mac OSX 打開原生自帶讀寫NTFS功能(圖文
- 08-05DEDE織夢(mèng)data目錄下的sessions文件夾有什
- 08-05織夢(mèng)dedecms什么時(shí)候用欄目交叉功能?
- 01-11ajax實(shí)現(xiàn)頁面的局部加載
- 04-02jquery與jsp,用jquery
- 01-10SublimeText編譯C開發(fā)環(huán)境設(shè)置
- 08-05dedecms(織夢(mèng))副欄目數(shù)量限制代碼修改
- 01-10delphi制作wav文件的方法