W3C | Translations

XML en 10 puntos

XML, XLink, Namespace, DTD, Schema, CSS, XHTML ...Se vostede ven de descubrir o XML pode ser difícil saber onde comezar. Este resumo en dez puntos tenta achegar ao principiante os conceptos básicos para que sexa quen de albiscar a fraga entre as árbores. E si vostede está a preparar unha presentación sobre XML, ¿Por que non comezar con estes dez puntos?

1. XML serve para estructurar datos

- Exemplos de datos estructurados son follas de cálculo, guías de enderezos, listas de parámetros de configuración, transaccións financeiras e debuxos técnicos. XML é un conxunto de regras (tamén se poden ver coma directrices ou convencións) para xerar texto con datos estructurados. XML non é unha linguaxe de programación, e vostede non precisa ser programador para empregalo ou entendelo. XML facilita que o ordenador xere e lea datos, e garante que as estructuras nas que estes datos aparecen non sexan ambiguas. XML evita os erros máis comúns nestas linguaxes: É extensible, independente de plataforma, e permite a internacionalización e maila localización. XML é conforme ao patrón Unicode.

2. XML parécese ó HTML

- Como o HTML, XML usa marcadores (verbas entre os signos '<' e '>') e atributos (parellas nome="valor"). Pero HTML especifica o significado deses marcadores e atributos, e tamén de que xeito debe presentar o texto entre eles un navegador. Pola contra, en XML os marcadores delimitan datos, quedando a súa interpretación a cargo da aplicación que os le. Explicado doutro xeito: Se vostede atopa "<p>" nun arquivo XML non pense que é un parágrafo. Dependendo do contexto podería ser un prezo, un parámetro, unha persoa, un p... (¿E quén di que ten que ser unha verba cunha "p"?).

3. XML é texto, mais non para ler

- Os programas que xeran follas de cálculo, guías de enderezos e outros datos estructurados adoitan gravalos en disco empregando formatos binarios ou texto. Unha vantaxe do formato texto é que permite ás persoas, se é necesario, ver os datos sen usar o programa que os produciu; É dicir: Vostede pode ler o formato texto cun simple editor. Estes formatos tamén axudan ós programadores a depurar máis facilmente as aplicacións. Do mesmo xeito que HTML, os arquivos XML conteñen texto non pensado para ser lido por persoas, pero estas poden facelo se é necesario. En comparación co HTML as regras de XML son máis ríxidas. Un marcador esquecido ou un atributo sen comiñas inutilizan un arquivo XML, mais non necesariamente un arquivo HTML. A especificación oficial do XML prohibe que as aplicacións tenten adiviñar o contido correcto dun arquivo XML errado ou danado. Se o arquivo é inconsistente a aplicación ten a obriga de parar e amosar un erro.

4. XML é prolixo adrede

- Como XML ten formato texto e emprega marcadores para delimitar os datos, os arquivos XML son case sempre maiores do que serían nun formato binario. Esa foi unha decisión consciente dos deseñadores do XML. As vantaxes do formato textual son evidentes (ver punto 3) e os inconvenientes poden compensarse normalmente a outro nivel. O espacio en disco baixa de prezo a cotío, e programas de compresión como zip e gzip poden comprimir arquivos moito e moi rápido. Ademais, os protocolos de comunicación dos modems e o HTTP/1.1, o protocolo básico da web, poden comprimir os datos en tránsito, aforrando ancho de banda cunha eficiencia semellante á dun formato binario.

5. XML é unha familia de tecnoloxías

- XML 1.0 é a especificación que define o que son as "marcas" e os "atributos"; mais a carón dela medra a "familia XML", un conxunto crecente de módulos que ofrecen servicios útiles para desenvolver tarefas importantes e decote requiridas. Xlink describe un xeito estándar de engadir ligazóns de hipertexto a un arquivo XML. Un XPointer é unha sintaxe en desenvolvemento para se referir a partes dun documento XML. Un XPointer lembra a un URL, mais apunta a estructuras de datos dentro dun documento XML. CSS, a linguaxe das follas de estilo, aplícase tanto a XML como a HTML. XSL é a linguaxe avanzada para definir follas de estilo. Está baseada en XSLT, unha linguaxe de transformación empregada para arranxar, engadir e anular marcas e atributos. O DOM é un conxunto patrón de funcións para manipular arquivos XML (e HTML) dende unha linguaxe de programación. XML Schemas 1 e 2 axudan ós desenvolvedores a definir polo miúdo as estructuras dos seus propios formatos XML. Hai máis módulos e ferramentas dispoñibles ou en desenvolvemento. Mantéñase informado na páxina de relatorios técnicos do W3C.

6. XML é novo, pero non tanto

- O seu desenvolvemento comezou en 1996, e é unha recomendación W3C dende febreiro de 1998, o que lle pode levar á sospeita de que é unha tecnoloxía algo inmatura. A verdade é que non é recente. Antes de XML existía SGML, desenvolvida no inicio da década dos 80 e patrón ISO dende 1986, empregada con amplitude en documentacións de grandes proxectos. O desenvolvemento de HTML arrancou en 1990. Os deseñadores de XML colleron simplemente o mellor de SGML, guiados pola experiencia co HTML, e produciron algo non menos potente que SGML e de uso moito máis regular e simple. Con todo, ás veces é difícil distinguir evolucións de revolucións... E compre dicir que malia ser SGML ámplamente empregado en documentación técnica, e moito menos noutros eidos, co XML acontece xusto ó contrario.

7. XML leva o HTML cara XHTML

- Unha aplicación importante do XML é precisamente a linguaxe XHTML como sucesora de HTML. XHTML ten moitos dos elementos de HTML, mais a súa sintaxe mudou un chisco para ser conforme ás regras de XML. Un formato que é "baseado en XML" herda a sintaxe de XML e a restrinxe en certos aspectos (por exemplo, XHTML permite "<p>", mais non "<r>"); tamén engade significado á sintaxe (en XHTML "<p>" é parágrafo, non prezo, nin persoa, nin outra cousa).

8. XML é modular

- XML lle permite definir un novo formato de documento a partires dun existente ou da combinación de varios. Como dous formatos desenvolvidos por separado poden ter elementos ou atributos co mesmo nome débese ter coidado cando se combinan (¿Significa "<p>" 'parágrafo' deste formato ou 'persoa' daquel outro?). Para eliminar estas confusións XML fornece o mecanismo dos espacios nominais (namespaces). XSL e RDF son bos exemplos de formatos XML que empregan estes espacios. XML-Schema foi concibido para reflectir este mecanismo de soporte da modularidade no nivel da definición de estructuras XML, permitindo combinar dous esquemas nun terceiro ó que se corresponderá un documento híbrido.

9. XML é a base de RDF e da web semántica

- RDF, a recomendación do W3C para "metadatos" (coñecemento en xeral), é un formato XML para describir recursos e aplicacións a un nivel superior ó do HTML, ligando calquera cousa con calquera cousa e asignando nomes a esas relacións. Do mesmo xeito que HTML integrou documentos, menús e formularios na web orixinal, RDF fornece as ferramentas para integrar máis coñecemento e nos achegar á web semántica. Como pasa cos humanos, que precisan concordar no significado das palabras que empregan para se comunicar, os ordenadores necesitan mecanismos para compartir o significado dos termos que empregan na súa comunicación. As descricións formais dos termos dunha certa area (comercio e manufactura, por exemplo) son chamadas ontoloxías e son unha parte necesaria da web semántica. RDF, as ontoloxías, e a representación formal do significado, de xeito que os ordenadores podan axudar ó traballo das persoas, son temas tratados polo grupo de actividade da web semàntica, Semantic Web Activity.

10. XML é de balde, independente de plataforma, e ben soportado

- Basear un proxecto en XML é beneficiarse dunha grande comunidade de ferramentas e de desenvolvedores experimentados nesa tecnoloxía; esta comunidade de recursos, que medra a cotío, pode xa conter unha solución parcial ou total para tal proxecto. Elixir XML é dalgún xeito como escoller SQL no eido das bases de datos: Tense que construír a BD e mais a aplicación, pero existe xa moito código dispoñible, e moitos técnicos que lle poden axudar. E por ser XML de licencia libre pode construír o seu propio software arredor del sen pagar un patacón a ninguén. O soporte grande e crecente significa que vostede non se ten que comprometer cun só vendedor. XML, ainda que non sexa a mellor solución, merece ser considerado.


Bert Bos
Revisado 13 nov 2001 (última actualización: $Date: 2001/12/05 12:45:24 $)
Creado o 27 de marzo de 1999 (Versión anterior)

Copyright © 1999-2000 W3C® (MIT, INRIA, Keio), All Rights Reserved.