Linguaxe de marcado

Da Wikipedia, a enciclopedia libre.
Ir á navegación Ir á busca
Un exemplo de imaxe creada en linguaxe SVG
Un exemplo de imaxe creada en linguaxe SVG

A linguaxe de marcado (ou marcado ) é un conxunto de regras que describen os mecanismos de representación (estruturais, semánticos, de presentación) ou disposición dun texto; facendo uso de convencións normalizadas, estas regras poden usarse en varios soportes. Polo tanto, a técnica de formatar con marcadores (chamadas expresións codificadas ) requirirá unha serie de convencións, típicas dunha "linguaxe de marcado de documentos".

Descrición

O termo marcado (ou marcado ) deriva do ambiente tipográfico onde se usou para marcar con anotacións as partes do texto que había que resaltar ou corrixir, para sinalalas ao compositor ou mecanógrafo.

Tipos

Logotipo de HTML 5

As diferentes linguaxes de marcado existentes distínguense basicamente en:

  • linguaxes de marcas procedimentais;
  • linguaxes de marcado descritivos.

A diferenza entre os dous reside no mecanismo usado para definir a representación do texto, tanto no que se refire á súa estrutura, tanto no que se refire ao significado dos elementos que o compoñen, como no que se refire á visualización (ou formato):

  • as linguaxes de marcas procedementais indican os procedementos de procesamento de texto engadindo as instrucións que se deben realizar para amosar a parte do texto referenciada ( troff , T E X , ...)
  • as linguaxes de marcado descritivo deixan a elección do tipo de representación que se aplicará ao texto ao software que o reproducirá de cando en vez ( SGML , HTML , XML , ...)

As linguas do segundo tipo son máis vantaxosas porque se centran en problemas estruturais de lexibilidade e non teñen en conta o software co que se xeraron na fase de lectura. Noutras palabras, son os que permiten garantir unha correcta separación entre a estrutura (ou contido) e a visualización (ou a presentación, non necesariamente visual: por exemplo, falada).

SGML ( S tandard G eneralized M arkup L anguage) foi a primeira linguaxe de marcado descritivo estandarizado internacionalmente ( ISO 8879 de 1986 ) que definiu métodos para representar o texto en forma electrónica de forma independente do hardware e o sistema operativo empregado. SGML baséase no concepto de definición de tipo de documento ou Definición de tipo de documento (DTD), é dicir, require para cada documento a definición do xeito en que se poden empregar os distintos elementos do texto. Por exemplo, unha carta contén elementos esenciais como remitente , un ou máis destinatarios , data , asunto , corpo , a indicación da persoa que a firma , .... Todos os elementos que deben estar presentes, probablemente incluso cunha determinada orde. O DTD debe encargarse de definir todo isto, establecer o que está permitido e o que non.

O HTML foi desenvolvido a principios dos noventa do século XX por Tim Berners-Lee no CERN de Xenebra ( Suíza ), xunto co protocolo HTTP dedicado á transferencia de documentos neste formato. En 1989 Berners-Lee propuxo un proxecto que incluía a publicación de hipertexto , coñecido como " world wide web ". Dentro deste proxecto naceron tanto o servidor web " httpd " (HyperText Transfer Protocol Daemon) como o cliente WorldWideWeb (o primeiro navegador da historia), cuxo desenvolvemento comezou en outubro de 1990 e cuxo uso foi exclusivamente interno do CERN ata a súa publicación en internet en 1991. Axudado polos seus colegas do instituto suízo, Berners-Lee contribuíu á definición da primeira versión de HTML, que se fixo pública oficialmente en xuño de 1993 , co-asinada con Daniel Connolly e apoiada pola Internet Engineering Task. Grupo de traballo Force (IETF) chamado Integration of Internet Information Resources , para propoñelo como estándar IETF.

En 1994 a linguaxe tivo unha forte difusión tras os primeiros usos comerciais da web , polo que no mesmo ano nace o World Wide Web Consortium e, a partir dese momento, o desenvolvemento de HTML converterase na prerrogativa do W3C.

En 1995 o W3C definiu a versión 3.0 de HTML, que foi seguida da versión 3.2 en 1997 , e finalmente chegou a primeira especificación HTML4 en 1998 .

Características das linguaxes de marcado

Unha característica común de moitas linguaxes de marcado é que mesturan o texto dun documento con instrucións de marcado no mesmo fluxo de datos ou ficheiro. Isto non é necesario; pode illar a marca do contido do texto, usando punteiros, compensacións, IDs ou outros métodos para coordinar os dous. Este "marcado de separación" é típico das representacións internas que os programas usan para traballar con documentos marcados. Non obstante, o marcado incrustado ou "en liña" é moito máis común noutros lugares. Aquí, por exemplo, hai unha pequena sección de texto marcada en HTML:

 <h1> Anátidos </ h1> 
<p> 
A familia <i> Anatidae </ i> inclúe patos, gansos e cisnes,
pero <em> non </ em> os berradores estreitamente relacionados.
</ p>
Exemplo de páxina HTML
Exemplo de páxina HTML

Os códigos entre corchetes <like this> son sentenzas de marcado (coñecidas como etiquetas), mentres que o texto entre estas sentenzas é o texto real do documento. Os códigos h1 , p e em son exemplos de marcado semántico , xa que describen o propósito ou o significado do texto que inclúen. En concreto, h1 significa "este é un título de primeiro nivel", p significa "isto é un parágrafo" e em significa "esta é unha palabra ou frase enfatizada". Un programa que interpreta tal marcado estrutural pode aplicar as súas propias regras ou estilos para presentar varias pezas de texto, empregando diferentes tipos de letra, negrita, tamaño da letra, sangría, cor ou outros estilos, segundo o desexe. Por exemplo, unha etiqueta como "h1" (nivel de cabeceira 1) pode presentarse nun tipo de letra negra sen serif grande nun artigo, ou pode subliñarse nun documento monoespacio (estilo de máquina de escribir) ou pode que non o faga completamente cambiar a presentación.

Pola contra, a etiqueta i en HTML 4 é un exemplo de marcado de presentación , que normalmente se usa para especificar unha característica particular do texto sen especificar o motivo do mesmo. Neste caso, o elemento i require o uso dunha letra cursiva. Non obstante, en HTML 5 este elemento volveuse a utilizar cun uso máis semántico: para denotar un rango de texto cunha voz ou estado de ánimo alternativos, ou compensado pola prosa normal dun xeito que indica unha calidade diferente do texto . Por exemplo, o elemento i debería usarse para indicar unha designación ou frase taxonómica noutro idioma [1] . O cambio realizouse para facilitar a transición de HTML 4 a HTML 5 o máis sinxelo posible, de xeito que os usos obsoletos dos elementos de presentación preserven a semántica máis probable.

A Text Encoding Initiative (TEI) publicou extensas directrices [2] sobre como codificar textos de interese para as ciencias humanas e sociais, desenvolvidos ao longo de anos de cooperación internacional. Estas directrices son utilizadas por proxectos que codifican documentos históricos, obras de eruditos, períodos ou xéneros particulares, etc.

Nota

  1. ^ elemento , en html.spec.whatwg.org .
  2. ^ TEI: Guidelines , on web.archive.org , 3 de xullo de 2014. Consultado o 29 de xaneiro de 2021 (arquivado dende o orixinal o 3 de xullo de 2014) .

Elementos relacionados

Idiomas da familia SGML

Linguaxes da familia XML

Diagrama XSLT

Linguaxes lixeiras

Outras linguas

Outros elementos relacionados

Ligazóns externas

Control da autoridade Thesaurus BNCF 52326 · LCCN (EN) sh95002796 · BNF (FR) cb133199588 (data)