得到XML文檔大小的方法
XML文檔從格式到大小都是不是確定的。有的可能只有幾行,而有的卻有好幾兆字節(jié)。你也許會懷疑是不是需要了解XML文檔的大小。而當性能成為首要問題時,知道XML文檔大小就是件必須要作的事情了。
從性能角度講,有兩類處理XML文檔的方法。批量處理方式需要較短的時間,解析成組的文檔。實時方式就是實時的處理文檔。批處理方式的性能可以通過在一定時間內處理多少文檔來測量,而實時模式的性能也采用類似的測量方式,不過是以處理一個文檔需要多長時間來計算的。
Scenarios場景
想象一下,你有一個實時工作的系統(tǒng),比如一個Web服務器。這個系統(tǒng)需要實時的接收客戶發(fā)來的訂單,并需要立即對這個訂單進行響應。
這個系統(tǒng)顯然不能用批量處理的方式進行。簡單的估計一下,假設這是個很簡單的訂單,只有十個項目,這樣所生成的XML文檔就比較小,大概每個文檔是4KB。這種情況下,使用DOM來解析收到文檔。
如果你的訂單每小時只有幾個,那么系統(tǒng)性能對你來說還不是問題。但是長遠考慮,總有一天訂單的數(shù)量會多到令你意識到系統(tǒng)性能必須提高。
現(xiàn)在你開始考慮提高性能來適應增長的負荷。你的訂單文檔已經很小了,把它們合并成較大的文檔也沒有什么實際的意義。從縱向考慮,這時候你可以提高現(xiàn)有系統(tǒng)處理能力;從橫向考慮,你可以增加更多的系統(tǒng)將負荷分散開。
再看看另一個完全不同的領域,你現(xiàn)在要處理的是一個大型的數(shù)據倉庫。和Web服務器完全不同,你現(xiàn)在用FTP來傳輸平均大小為300MB的XML文檔。如果還是使用DOM來解析XML文檔,你很快就會遇到大麻煩。相反,如果你使用SAX就會好的多,它可以直接解析流入的XML文檔,而不必把它們事先都裝入內存。
改變文檔尺寸
有時候你會遇到特殊情況需要改變XML文檔大小。想象一下,和剛才一樣你有一個實時處理XML文檔的Web服務器,而此時所有的文檔大小都是400MB而不是4KB,你不能使用DOM方式,因為那太占內存了??墒且驗檫@是個實時系統(tǒng),性能很重要。你可以使用SAX,不過需要時間允許并要有強大的處理器。
在這種情況下,你可以通過改變文檔大小來改進系統(tǒng)執(zhí)行性能。比如你可以將一個400MB的文檔分成10個40MB的,或者40個10MB的小文檔,這比起處理一個400MB的文檔更有效率。這樣你就可以使用DOM方式把文件讀入內存進行處理,及時響應每個文檔的請求了。同時還可以清除掉不相關的文檔。
在批量處理方式上也有類似情況。想象一下你在通過DOM的批處理方式處理數(shù)千個4KB大小的文檔。最好的方式是將一千個文件合并成一個4MB的文件。因為每個文檔的載入都需要占用系統(tǒng)時間(不論是DOM還是SAX)。通過將一千個文檔合并成一個,你只需要載入一個文檔,占用的時間只是原來的千分之一。
欄 目:XML/RSS
下一篇:xml文件的結構解讀第1/2頁
本文標題:得到XML文檔大小的方法
本文地址:http://mengdiqiu.com.cn/a1/XML_RSS/11721.html
您可能感興趣的文章
- 01-11XML中顯示HTML的小技巧
- 01-11使用Spry輕松將XML數(shù)據顯示到HTML頁的方法
- 01-11xml中的空格之完全解說
- 01-11xml文件的結構解讀第1/2頁
- 01-11用xslt將xml解析成xhtml的代碼
- 01-11XML解析錯誤:未組織好 的解決辦法
- 01-11用Asp與XML實現(xiàn)交互的一個實例源碼
- 01-11怎樣打開XML文件?xml文件如何打開?
- 01-11asp下利用xml打包網站文件
- 01-11不同瀏覽器對XML的解析是不同的


閱讀排行
本欄相關
- 01-11關于XSL - XSL教程
- 01-11WMLScript的語法基礎
- 01-11選擇模式 - XSL教程 - 2
- 01-11WML學習之五 顯示表單
- 01-11WML學習之三 顯示文本
- 01-11匹配模式 - XSL教程 - 4
- 01-11WML語法大全與相關介紹第1/3頁
- 01-11XPath入門 - XSL教程 - 3
- 01-11測試模式 - XSL教程 - 5
- 01-11WAP建站WML語言語法基礎教程第1/6頁
隨機閱讀
- 01-10delphi制作wav文件的方法
- 08-05DEDE織夢data目錄下的sessions文件夾有什
- 01-10C#中split用法實例總結
- 01-10SublimeText編譯C開發(fā)環(huán)境設置
- 04-02jquery與jsp,用jquery
- 01-10使用C語言求解撲克牌的順子及n個骰子
- 08-05織夢dedecms什么時候用欄目交叉功能?
- 08-05dedecms(織夢)副欄目數(shù)量限制代碼修改
- 01-11Mac OSX 打開原生自帶讀寫NTFS功能(圖文
- 01-11ajax實現(xiàn)頁面的局部加載