XML

Da Wikipedia, a enciclopedia libre.
Ir á navegación Ir á busca
Nota de desambiguación.svg Desambiguación : se está a buscar outros significados, consulte XML (desambiguación) .
XML
XML.svg
Extensión .xml
Tipo MIME application/xml
text/xml
Desenvolvido por W3C
Rapaz Linguaxe de marcado
Extensión de SGML
Estendido a XHTML , RSS , Atom e outros
¿Formato aberto ? Si

En informática , XML (abreviatura de eXtensible Markup Language , lit. "linguaxe de marcado extensible") é unha metalinguaxe para a definición de linguaxes de marcado , que é unha linguaxe baseada nun mecanismo sintáctico que permite definir e controlar o significado dos elementos contidos. nun documento ou texto.

O nome indica que é unha linguaxe extensible, xa que permite crear etiquetas personalizadas e é un intento de producir unha versión simplificada do Standard Generalized Markup Language (SGML), que permite definir novas linguaxes de marcado.

Historia

O World Wide Web Consortium (W3C), tras a guerra do navegador (é dicir, a situación ocorrida nos noventa na que Microsoft e Netscape introduciron, con cada nova versión do seu navegador , unha extensión propietaria ao HTML oficial), foi forzada a seguir extensións individuais á linguaxe HTML. [ a conexión non está clara ]

O W3C tivo que escoller que características estandarizar e cales deixar fóra da especificación HTML oficial. Foi neste contexto cando comezou a xurdir a necesidade dunha linguaxe de marcas que daría máis liberdade na definición de etiquetas, manténdose nun estándar.

O "proxecto XML", que comezou a finais dos anos noventa como parte da actividade W3C SGML , espertou un forte interese que o W3C creou un grupo de traballo, chamado XML Working Group , formado por expertos mundiais en tecnoloxías SGML . E unha comisión , Xunta de revisión editorial XML , responsable da redacción das especificacións do proxecto.

En febreiro de 1998 a especificación converteuse nunha recomendación oficial baixo o nome Extensible Mark-up Language , versión 1.0. Pronto deuse conta de que XML non se limitaba só ao contexto web senón que era algo máis: unha ferramenta que permitía o seu uso nos contextos máis diversos, desde a definición da estrutura do documento , ata o intercambio de información entre diferentes sistemas , dende a representación de imaxes ata a definición de formatos de datos .

Usos

En comparación co HTML , XML ten un propósito moi diferente: mentres que o primeiro define unha gramática para a descrición e formato de páxinas web ( deseño ) e, en xeral, hipertextos , o segundo é unha metalinguaxe usada para crear novas linguaxes, axeitada para describir estruturados. documentos. Aínda que HTML ten un conxunto de etiquetas ben definido e restrinxido, con XML é posible definir as súas propias segundo as súas necesidades.

Hoxe en día tamén se usa XML como medio para exportar datos entre diferentes SGBD . Xeneralizado é o uso en ficheiros de configuración de aplicacións e sistemas operativos .

Sintaxe

Aquí tes un exemplo típico de ficheiro XML, que se pode ver en calquera navegador simplemente gardando o texto nun ficheiro coa extensión .xml .

 <? xml version = "1.0" encoding = "UTF-8"?>
<usuarios>
    <user years = "20" >
        <name> Ema </name>
        <surname> Princi </surname>
        <dirección> Turín </dirección>
    </usuario>
    <user years = "54" >
        <name> Máximo </name>
        <apelido> Rossi </ apelido>
        <dirección> Roma </dirección>
    </usuario>
</usuario>

A primeira liña indica a versión de XML en uso e especifica a codificación UTF-8 para unha interpretación correcta dos datos.

Os caracteres especiais que farían que o documento estea mal formado deben substituírse coas respectivas entidades XML:

Personaxe Entidade
& &amp;
< &lt;
> &gt;
" &quot;
' &apos;

Hai que ter en conta que só os tres primeiros [ ou só os primeiros 2? ] as entidades sempre se deben respectar, mentres que o último &apos; nalgúns casos non se xestiona (como no iPhone iOS 3.1.3 e posteriores).

Etiquetas ou etiquetas

XML, como HTML , usa marcadores, chamados etiquetas , para asignar semántica ao texto. As etiquetas poden conter información de dous xeitos: mediante parámetros ou incluíndo texto ou outro tipo de información. Deste xeito, poden ser etiquetas de apertura, seguidas necesariamente de etiquetas de peche (entre as que se pode ter un contido) ou etiquetas que se abren e pechan e, polo tanto, poden proporcionar información só a través dos seus parámetros.

Cada etiqueta comeza e remata con parénteses angulares ( <> ) (que noutros contextos serían os signos menor e maior), mentres que a etiqueta de peche ou de peche está representada pola barra ( / ). Aquí tes algúns exemplos de etiquetas:

 <tagExample parameter1 = "apertura de etiqueta" features = "só a etiqueta de apertura ten parámetros" >
    contido
</tagExample>
<TagAutoclosing parâmetro1 = "etiqueta auto-peche" características = "Non ten etiqueta peche" />

XML permite comentarios incluídos por <!-- --> Por exemplo:

 <! - Este é un comentario ->

XML é moi estrito sobre a sintaxe a seguir con respecto ao HTML e, polo tanto, é necesario respectar algunhas regras:

  1. as etiquetas non poden comezar con números ou caracteres especiais e non poden conter espazos;
  2. as etiquetas deben estar equilibradas, é dicir, non se permiten erros de aniñamento, por exemplo:
 <libro>
  <name> Mario </name>
  <apelido> Rossi
</rubrica>

A etiqueta de cognome non se pechou, polo tanto o XML está mal formado.

 <libro>
  <name> Mario </name>
  <apelido> Rossi
</rubrica> </surname>

A etiqueta de cognome pechouse despois da etiqueta de rubrica , de novo o XML non está ben formado.

 <libro>
  <name> Mario </name>
  <apelido> Rossi </SURNAME>
</rubrica>

XML distingue entre maiúsculas e minúsculas polo que a etiqueta de cognome e a COGNOME considéranse como dúas etiquetas diferentes; XML de novo non está ben formado.

Tamén é posible definir etiquetas baleiras que se abren e pechan inmediatamente:

 <rubrica> </rubrica>

Ou en forma abreviada:

 <axenda telefónica />

Para ser interpretado correctamente, un documento XML debe estar formateado correctamente, é dicir, debe ter as seguintes características:

  • Un prólogo , que é a primeira instrución que aparece escrita no documento. No noso caso: <?xml version="1.0" encoding="UTF-8"?> .
  • Un único elemento raíz (tamén coñecido como nodo raíz , chamado elemento raíz ) que contén todos os outros nodos do documento. No noso exemplo: <utenti> .
  • Dentro do documento todas as etiquetas deben estar equilibradas.

Se o documento XML non contén erros, dise que está ben formado . Se o documento está ben formado e tamén cumpre cos requisitos estruturais definidos no esquema XML asociado ou no ficheiro DTD , chámaselle válido .

Vantaxes de XML

As vantaxes de XML normalmente resúmense co acrónimo SPEED, tamén significado co significado da palabra en inglés (é dicir, "velocidade"). A velocidade é, en primeiro lugar, a principal razón pola que moitas empresas pasan ao comercio electrónico: resposta máis rápida ás necesidades dos clientes, entrega máis rápida de información aos clientes e socios da cadea de subministración; procesamento máis rápido dos pedidos recibidos a través de Internet. O arquónimo deriva de Almacenar, publicar e intercambiar documentos electrónicos ("almacenar, publicar e intercambiar documentos electrónicos").

En XML, a información específica da aplicación está incluída dentro de "etiquetas", marcadas con parénteses < > , que describen o contido dun documento. Cada etiqueta define un tipo de elemento e, ao delimitar cada dato con etiquetas, podemos entender a súa estrutura aínda que non coñezamos a aplicación que a xerou. Dado que os datos se autodescriben, os socios tamén poderán entendelos e procesalos. Ademais, tamén se poden xestionar no futuro cando as aplicacións que as xeraron quedaron obsoletas.

A extensibilidade é outra das características gañadoras de XML, xa que é posible que os programadores reutilicen documentos XML existentes simplemente ampliándoos con novas etiquetas, deixando os elementos clave do documento orixinal para que sexan comprensibles por todos os usuarios.

XML respondeu ao proverbial lema americano: "adopta e adapta", é dicir, adopta un estándar fiable e gañador e adáptao ás túas necesidades.

Outra vantaxe non insignificante de XML é a posibilidade de validalos mediante o uso de XML Schema (XSD) [1] .

Esta posibilidade non está presente noutros formatos intercambiables, incluído JSON .

Para resumir as vantaxes do XML, polo tanto, pódese dicir que XML require:

  • menos esforzo de mantemento;
  • mellor reutilización;
  • maior capacidade para orientar varios dispositivos;
  • posibilidade de reducir os recursos dedicados á execución de proxectos.

Tecnoloxías de soporte XML

Idiomas de esquema (permítenlle crear novas linguaxes XML):

  • DTD (acrónimo de Definición de tipo de documento ): é un documento a través do cal se especifican as características estruturais dun documento XML a través dunha serie de "regras gramaticais". En particular, define o conxunto de elementos do documento XML, as relacións xerárquicas entre os elementos, a orde de aparición no documento XML e que elementos e cales atributos son opcionais ou non.
  • Esquema XML : do mesmo xeito que o DTD, úsase para definir a estrutura dun documento XML. Hoxe o W3C recomenda adoptala en lugar da propia DTD, sendo unha técnica máis recente e avanzada. A súa abreviatura é XSD, que significa XML Schema Definition .

Outras tecnoloxías relacionadas co XML:

  • XLink : úsase para vincular completamente dous documentos XML; a diferenza dos clásicos hipervínculos que coñecemos en HTML , XLink permítelle crear ligazóns multidireccionais e semánticamente avanzadas.
  • XSL (acrónimo de eXtensible Stylesheet Language ): é a linguaxe empregada para describir a folla de estilo dun documento XML. A súa versión estendida é XSLT (onde T significa Transformations ).
  • XPath : é unha linguaxe coa que é posible identificar porcións dun documento XML e é a base doutras ferramentas para XML como XQuery.
    Para apoiar este propósito principal, tamén ofrece funcionalidades básicas para tratar con cadeas, números e datos booleanos. O seu funcionamento baséase na creación dunha árbore a partir do documento e a sintáctica sucinta permite abordar unha parte específica a través dos nodos da árbore coa sinxela ruta de palabras.
  • XPointer : úsase para identificar porcións precisas dun documento XML; entón permite o seu acceso a outros idiomas ou obxectos de interface.
  • XQuery : é unha linguaxe de consulta deseñada para ser aplicable a calquera tipo de documento XML e baséase no uso de XPath para especificar camiños dentro dos documentos. XQuery ten funcións que permiten acceder a varias fontes de datos para buscar, filtrar documentos ou reunir contido de interese.
  • SAX (API sinxela para XML): é unha interface de programación, implementada en numerosas linguaxes, que permite ler e modificar documentos XML. A través de SAX é posible implementar analizadores XML específicos. SAX está baseado en eventos, en oposición a DOM , e reacciona ao analizar eventos informando á aplicación. É tarefa do programador implementar métodos para reaccionar ante os eventos de análise.
  • DOM : é unha interface de programación, como SAX, implementada en multitude de linguaxes de programación , para manipular ficheiros XML. DOM constrúe unha árbore a partir do ficheiro XML onde cada nodo da árbore corresponde a un elemento do ficheiro; por este motivo chámase baseado en árbore.
  • VTD-XML : o DOM é máis fácil e inmediato de usar que o SAX e, polo tanto, os programadores normalmente prefiren manipular un ficheiro XML; con todo, a árbore xerada por DOM debe manterse completamente na memoria RAM e, en consecuencia, non é posible usar esta interface para manipular ficheiros que sexan máis grandes que a memoria dispoñible no ordenador.
  • RSS : é un estándar usado para crear un documento cunha estrutura XML única, axeitado para o desenvolvemento dun intercambio de datos sinxelo entre páxinas web e accesible desde calquera linguaxe de script . Basicamente é un documento XML cuxa estrutura de nodo e etiquetas relacionadas teñen o mesmo nome.
  • SVG ( Scalable Vector Graphics ) e VML ( Vector Markup Language ) son estándares para crear imaxes vectoriais que aproveitan os documentos formateados en XML. Tamén se usa para describir imaxes bidimensionais, estáticas e dinámicas. Ao ler as instrucións contidas no documento de orixe XML, o intérprete debuxa as cifras básicas ata completar a imaxe.
  • WDDX (Word Data Description Exchange): WDDX é unha estrutura para a contención de datos coa mesma estrutura que unha base de datos, creada por Allaire hoxe Macromedia e lanzada Open na organización WDDX

Linguaxes XML máis populares

  • XForms : como o seu nome indica, é unha linguaxe creada para crear formularios similares a HTML dentro dun documento XML.
  • SMIL ( Synchronized Multimedia Integration Language ): este idioma definido en XML, úsase para describir o contido e xestionar o tempo das presentacións multimedia que poden combinar vídeo, audio, imaxes e texto xuntos.
  • MathML (Mathematical Markup Language): MathML úsase para a descrición de notacións matemáticas, procedendo a fixar a súa estrutura e contidos ao mesmo tempo, para que poidan ser informados e procesados ​​na web.
  • X3D (eXtensible 3D): X3D é unha linguaxe que permite construír modelos tridimensionais, sexan simples ou sofisticados. Pódense aplicar animacións e mecanismos para interactuar co usuario aos obxectos creados deste xeito. Como linguaxe, está construído sobre a linguaxe de modelado de realidade virtual ( VRML ), adoptado á súa vez como estándar internacional en 1997. Para este último, o X3D inclúe as capacidades, típicas da linguaxe de marcado extensible (XML), de integración con outras. Tecnoloxías da World Wide Web, validación de contido e adición flexible de novas extensións de hardware se fose necesario. Ademais, debemos mencionar as vantaxes relativas á lixeireza do "perfil básico" (perfil central: hai sete perfís, cada un dos cales agrupa un determinado conxunto de funcións que se usan habitualmente para diferentes fins. Isto permite aos desenvolvedores de navegadores alcanzar niveis intermedios de X3D, sen ter que implementar necesariamente toda a especificación á vez) e navegadores compoñentes para unha descarga máis rápida.
  • XBRL (eXtensible Business Reporting Language): é un idioma usado para a comunicación e intercambio de datos financeiros e contables en formato electrónico

XML e páxinas web: XHTML

XHTML é unha linguaxe de marcación deseñada para amosar páxinas web a través dun navegador, como HTML, e, sendo XML, respecta a súa semántica. Por exemplo, en XHTML, a diferenza do HTML tradicional, as etiquetas baleiras deben pecharse cunha barra final (/), os atributos baleiros deben establecerse en verdadeiro ou falso , o peche das etiquetas debe reflectirse (se é unha etiqueta e antes de pechala outra aberto, é preciso pechar primeiro a segunda etiqueta e despois a primeira), algunhas etiquetas e atributos, en comparación con HTML 4.0, desapareceron e hai un DTD dedicado.

O tipo MIME reservado para páxinas XHTML é (application / xhtml + xml). Se envía unha páxina XHTML non válida pero como texto / html, pode ocorrer que se amose porque se interpreta como html (con erros, como etiquetas pechadas como <br />) só que non respecta o estándar e non goza das súas vantaxes, entre elas a portabilidade en diferentes navegadores e clientes. [2] A verdadeira vantaxe dunha páxina XHTML é que sendo XML obtén todas as súas vantaxes, como a facilidade de validación e a interpretación programática. As páxinas XHTML adoitan ser máis facilmente accesibles, dada a súa semántica XML.

Nota

  1. ^ Andrea Chiarelli, XML Schema and XML Documents , en HTML.it. Consultado o 16 de outubro de 2020 .
  2. ^ (EN) Envío de XHTML como texto / html Considerado Nocivo

Elementos relacionados

Outros proxectos

Ligazóns externas

Control da autoridade LCCN (EN) sh97007825 · GND (DE) 4501553-3 · BNF (FR) cb131774360 (data) · BNE (ES) XX546216 (data)
Internet Portal de Internet : accede ás entradas da Wikipedia que tratan de internet