| Preklady
Štrukturované dáta — to sú tabuľky, adresáre, konfigurácie, obchodné transakcie, technické výkresy... XML je súbor
pravidiel (môžete si ho predstaviť aj ako smernicu alebo konvenciu) tvorby textových formátov, ktoré umožňujú štruktúrovať
vaše dáta. XML nie je programovací jazyk a k jeho zvládnutiu nieje potrebné mať znalosti o programovaní.
XML uľahčuje počítaču tvoriť, čitať a zapisovať dáta a zaistiť jednoznačnosť štruktúry dát.
XML sa vyhlo bežným nevýhodám popisovacích jazykov: je rozšíriteľné, nezávislé na platforme a podporuje lokalizáciu.
XML plne vyhovuje štandardu Unicode.
Rovanko ako HTML, i XML používa tzv. tagy (názvy uzatvorené medzi lomenými zátvorkami '<' a '>')
a atribúty (v tvare
názov="hodnota"
). Zatiaľ čo HTML presne
špecifikuje, čo ktorý tag či atribút znamená a ako bude v prehliadači zobrazený text vnútri, XML používa tagy iba
k ohraničeniu častí dát, a ich interpretácia je ponechaná aplikácii, ktorá dáta číta. Inými slovami, pokiaľ je
v XML tag <b>
, nepredpokladá sa, že bude obsahovať tučné písmo. Podľa situácie to môže znamenať
napr. bydlisko, body, brat, b... (a kto povedal, že to musí byť slovo obsahujúce "b"?).
Programy vytvárajúce tabuľky, kontakty a iné štrukturované dáta ich väčšinou zapisujú na disk, a to buď
v binárnom alebo textovom formáte. Výhoda textového formátu je, že umožňuje ľuďom nahliadnuť na dáta
s obyčajným textovým editorom. Textový formát tiež uľahčuje vývojárom ladenie programov. Ako HTML i XML sú
textové súbory, ktoré ľudia nemusia čítať, ale pokiaľ je to potrebné, môžu. XML je však oproti HTML o niečo prísnejší,
čo sa týka formátu. Zabudnutý tag alebo atribút bez úvodzoviek robí XML súbor neplatným, zatiaľ čo HTML to niekde dokonca
výslovne povoľuje. Oficiálna XML špecifikácia zakazuje aplikáciám "domýšľať si", čo tvorca poškodeného XML
súboru zamýšľal, a pokiaľ objaví chybu, musí načítavanie zastaviť a ohlásiť chybu.
Pretože XML je textový formát a používa tagy k oddeleniu dát, je XML súbor skoro vždy väčší než porovnateľné dáta
v binárnom formáte. S tým sa pri návrhu XML počítalo. Výhody textového formátu sú evidentné (viď bod 3)
a nevýhody sú kompenzované na inej úrovni. Miesto na disku je stále lacnejšie a kompresné programy
ako zip alebo gzip zvládajú zmenšiť objem dát veľmi dobre
a veľmi rýchlo. Navyše komunikačné protokoly ako modemový protokol
a HTTP/1.1, hlavný protokol na webe, komprimujú dáta za behu
a šetria tak kapacitu liniek skoro ako binárne formáty.
XML 1.0
je špecifikácia definujúca, čo sú tagy a atribúty. Na základe XML 1.0, "XML rodina" vytvára
niekoľko modulov, ktoré ponúkajú rôzne služby plniace časté a dôležité potreby.
Xlink popisuje štandardnú cestu ako pridať do XML
súboru hypertextové odkazy.
XPointer slúži k odkazovaniu na časti XML
dokumentov. XPointer je niečo ako URL, ale namiesto odkazov na dokumenty na webe odkazuje dovnútra XML dokumentu.
CSS — štýlovací jazyk, sa dá aplikovať na XML
podobne ako na HTML.
XSL je
vylepšený jazyk pre zapisovanie štýlov. Je založený
na XSLT — transformačnom jazyku používanom
na pridávanie, odoberanie a úpravu tagov a atribútov.
DOM je štandardizácia funkcií pre manipuláciu
s XML (a HTML) súbormi v programovacích jazykoch.
XML Schema 1
a XML Schema 2 pomáhajú vývojárom presne
definovať štruktúru ich vlastných formátov založených na XML.
K dispozícii je niekoľko ďalších modulov, ďalšie sa vyvíjajú.
Viď W3C's technical reports page.
Vývoj XML začal v roku 1996 a stal sa doporučením W3C od februáru 1998,
čo môže budiť dojem, že ide o nevyspelú technológiu. V skutočnosti táto technológia nie je úplne nová.
Pred XML existovalo SGML — vyvíjané v osemdesiatych rokoch, štandard ISO od roku 1986, široko používaný
pre rozsiahle dokumentácie. Vývoj HTML začal v roku 1990. Tvorci XML prevzali to najlepšie zo SGML podľa
skúsenosti s HTML a vytvorili niečo rovnako mocné ako SGML, ale jednoduchšie na používanie. Aj keď niektoré
evolúcie sú nerozoznateľné od revolúcií... A je treba povedať, že zatiaľ čo SGML je určené skôr pre technickú
dokumentáciu než dáta iného druhu, u XML je to naopak.
Dôležité použitie XML, formát dokumentov XHTML, je nástupcom HTML. XHTML má mnoho elementov rovnakých ako HTML. Syntax bola
pozmenená, aby vyhovovala pravidlám XML. Dokument, ktorý je založený na XML ("XML-based"), dedí syntax XML
a rôzne ju obmedzuje (napr. XHTML povoľuje
<p>
, ale nie napr. <r>
); tiež dáva
syntaxi význam (XHTML určuje, že <p>
je odstavec (paragraph,
pozn. prekladateľa) a nie napr. policajt, pokuta, pelendrek alebo čokoľvek iné).
XML dovoľuje definovať nový formát kombináciou a opätovným použitím iných formátov. Keďže by dva formáty vyvíjané
nezávisle na sebe mohli mať definované rovnaké názvy elementov alebo atribútov, musíme si pri ich kombinovaní dávať pozor.
Aby sa predišlo zámene, XML obsahuje mechanizmus
menných priestorov
(namespaces). XSL a RDF sú dobré
príklady XML-založených formátov používajúcich menné priestory.
XML Schema je navrhnutá tak, aby umožňovala použitie menných
priestorov pri návrhu štruktúry dát. Potom je ľahké vytvoriť novú schému kombináciou dvoch iných a spojiť tak štruktúru
dokumentu.
Systém popisu zdrojov od W3C (Resource Description Framework, RDF)
je XML formát podporujúci popis zdrojov a uplatnení metadát, ako sú hudobné "playlisty", katalógy fotografií,
knižnice, atď. RDF vám umožní napríklad identifikovať ľudí na webovom fotoalbume podľa informácií vo vašom
adresári, potom môže váš e-mailový program pre týchto ľudí pripraviť správu. Tak ako HTML spojovalo dokumenty, menu
a formuláre do webovej aplikácie a naštartovalo originálny Web, RDF poskytuje nástroje na ešte väčšiu
integráciu, aby posunulo Web o trochu bližšie ku Sémantickému Webu. Tak ako sa ľudia musia dohodnúť na význame
slov používaných v komunikácii, i počítače musia mať význam termínov
definovaný, aby mohli komunikovať efektívne. Formálne popisy
termínov z určitej oblasti (nakupovanie, výroba, ...) sa nazávajú "ontológia" a sú nevyhnutnou súčasťou
Sémantického Webu. RDF, ontológia a reprezentácia významov tak, aby mohli počítače ľuďom pomôcť v práci, to sú témy
Aktivity Sémantického Webu
("Semantic Web Activity").
Voľbou XML za základ projektu získate prístup k obsiahlej skupine nástrojov (z ktorých jeden dokonca môže byť
to, čo potrebujete!) a odborníkov so skúsenosťami v tejto technológii. Voľba XML je niečo ako keď si zvolíte SQL
pre databázu: stále musíte vytvoriť vlastnú databázu a programy na jej obsluhu, ale existuje mnoho nástrojov
a ľudí, ktorí vám môžu pomôcť. A keďže XML je k dispozícii bez licencie, môžete vytvoriť vlastný software
pracujúci s XML bez toho, aby ste niečo niekomu platili. Rastúca podpora a veľký počet vývojárov vám naviac dajú
istotu, že sa nemusíte viazať k jedinému výrobcovi softwaru. XML nie je vždy najlepšou voľbu, ale vždy sa oplatí
ho zvážiť ako možnosť.
Preložil Jozef Izso, anglický originál.
W3C Communications Team, w3t-comm@w3.orgCopyright © 1999-2003 W3C® (MIT, ERCIM, Keio), All Rights Reserved. W3C liability, trademark, document use and software licensing rules apply.