在Intel的早期,Andy Grove遇到一個雇員 - 他
建議公司在芯片的基礎(chǔ)上開發(fā)個人計算機。Andy
Grove疑問道“個人計算機能做什么呢?”,這個
雇員舉例說,它可以存儲處方。Grove考慮到整個
研究、開發(fā)和市場費用要數(shù)百萬美圓,最終決定
以為紅綠燈提供芯片作為開始。
每個人都是事后諸葛亮。Andy Grove,不管你怎樣看他,被普遍
認為是一個非常聰明的人 - 能夠做出發(fā)展公司的重大決定。但
是在七十年代,不可能強求他預見到個人計算機的潛力。如果
他當時見過Excel、Quark、Photoshop、Oracle或者網(wǎng)絡(luò),他就會
理解把強大的處理器放在桌面上會允許軟件做任何事。
但是如果沒親眼見過,誰能想到呢。在用打字機、加法機和鉛
筆作為計算的工具的時代,你能解釋PC和它的用途嗎?
這個例子可以用在解釋擴展標記語言(XML - eXtensible Markup
Language)上?,F(xiàn)在還沒有和它相似的東西,所以很難做出比
較。你可能聽說過XML是HTML的替代物或XML與HTML相似,可以
定義自己的標記符。這兩種說法都不全對,就象說PC是存儲處
方的機器一樣。
我媽媽是一個訓練有素的廚師,如果我用她的配方,我的家庭
會省下很大一筆錢。
我以簡單的開始。因此我打開文本編輯器,開始寫一些HTML
代碼:
HTML>
H1 ALIGN=CENTER>Recipe/H1>
FONT FACE size=2>Chocolate Chip Bars/FONT>
在寫完上面幾行后,我想接著寫我媽媽 的精妙菜譜。那么怎么
做呢?一份老式的Web頁面。接下來呢?把我的頁面的URL送給
對這個菜譜感興趣的人們,然后讓他們剝掉其中的P>和FONT
FACE size=2>嗎?這得花些時間,我想得到實際的內(nèi)容。
看看下面可能的XML標記:
author>Carol Schmidt/author>
recipe_name>Chocolate Chip Bars/recipe_name>
在XML中,標記符可以最好地描述內(nèi)容。以這種方式,我可以肯
定任何查找出現(xiàn)在recipe_name>標記符中的“Chocolate Chip”
的人都可以得到媽媽_的菜譜。進一步說,如果我的信息被象這
樣的標記符(有意義的標記符)包圍 - 我可以告訴其它程序如
何使用它們。我還可以通過編碼把recipe_name>標記符中的內(nèi)
容放入數(shù)據(jù)庫的某個域中,然后把它輸出到一本書的硬拷貝中。
還有,我可以用一個支持XML的字處理器使網(wǎng)頁的出版輕而易舉。
這就是XML的本質(zhì):使標記對人和機器都可讀。但是在實現(xiàn)這個
目標之前,應該理解用XML編碼所涉及的東西。
文檔要組織良好
一個XML文件必須滿足兩點:組織良好和有效。我們以一個組
織良好的文檔開始。
我發(fā)明了一些描述菜譜的標記符,并把它們組織成一種合理
和可讀的方式。它可能不是最好的標記,但是在下面的例子
中工作得很好。
?xml version="1.0"?>
list>
recipe>
author>Carol Schmidt/author>
recipe_name>Chocolate Chip Bars/recipe_name>
meal>Dinner
course>Dessert/course>
/meal>
ingredients>
item>2/3 C butter/item>
item>2 C brown sugar/item>
item>1 tsp vanilla/item>
item>1 3/4 C unsifted all-purpose flour/item>
item>1 1/2 tsp baking powder/item>
item>1/2 tsp salt/item>
item>3 eggs/item>
item>1/2 C chopped nuts/item>
item>2 cups (12-oz pkg.) semi-sweet choc. chips/item>
/ingredients>
directions>
Preheat oven to 350 degrees. Melt butter;
combine with brown sugar and vanilla in large mixing bowl.
Set aside to cool. Combine flour, baking powder, and salt;
set aside.Add eggs to cooled sugar mixture; beat well.
Stir in reserved dryingredients, nuts, and chips.
Spread in greased 13-by-9-inch pan.
Bake for 25 to 30 minutes until goldenbrown;
cool. Cut into squares.
/directions>
/recipe>
/list>
這就是一份可以接受的XML文檔 - 告訴你XML是什么:把數(shù)據(jù)
以一種有實際意義的方式進行組織。
雖然這些標記符看起來有點象HTML,但是有很大的區(qū)別:文件
中沒有指出數(shù)據(jù)如何表示的信息。版面指令,當我們準備好時,
就會從其它地方出現(xiàn)。這和把地址簿的信息放在數(shù)據(jù)庫的字段
和記錄中而不是放在字處理器產(chǎn)生的清單中的道理一樣。數(shù)據(jù)
庫可以讓你把地址簿中的信息合成到標簽、信封、信件或其它
任何想要的載體上面。最后,就是把這份菜譜文件合成到一種
表現(xiàn)語言中,如HTML或CSS。
前面說過,XML文檔必須組織良好。這意味著文件必須滿足以下
三項基本規(guī)則:
文檔以XML定義?xml version="1.0"?>開始。
有一個包含所有其它內(nèi)容的根元素,如上面例子中的list>
和/list>標記符。
所有元素必須合理地嵌套,不允許交叉嵌套。
上面的例子中,幾個item>元素被合理地嵌套ingredients>和
/ingredients>標記符中。但是下面的標記卻有嚴重的問題:
ingredients>item>/ingredients>chocolate chips/item>
于是"chocolate chips"沒有被包含在ingredients清單中。因此
這份文檔就沒有組織好。這在HTML中可能不算什么,因為瀏覽器
已經(jīng)被設(shè)計成可以處理這種問題。
但是在XML中卻是致命的 - 應用程序?qū)⒕芙^處理沒有組織好的
文件。
我們現(xiàn)在知道組織良好非常重要,但是還不止這些