Diferencia entre revisiones de «Lenguaje de marcado»

(Elementos del lenguaje HTML)
 
Línea 52: Línea 52:
 
'''Caracteres'''&nbsp;: <br>  
 
'''Caracteres'''&nbsp;: <br>  
  
Cualquier cadena de caracteres imprimibles que no represente un marcado se representa literalmente, aunque los espacios y [[Tabuladores|tabuladores]] se reducen a un solo carácter cuando no están dentro de un bloque preformateado.<br>  
+
Cualquier cadena de caracteres imprimibles que no represente un marcado se representa literalmente, aunque los espacios y [[Tabulador|tabuladores]] se reducen a un solo carácter cuando no están dentro de un bloque preformateado.<br>  
  
 
'''Marcadores, marcas o etiquetas (tags)'''&nbsp;:<br>  
 
'''Marcadores, marcas o etiquetas (tags)'''&nbsp;:<br>  
Línea 64: Línea 64:
 
'''Nombres de etiquetas ''':<br>  
 
'''Nombres de etiquetas ''':<br>  
  
Los nombres consisten en una letra seguida de letras, [[Dígitos|dígitos]], [[Puntos|puntos]] o [[Guiones|guiones]]. Los ejemplos H1 y HR anteriores son ejemplos de nombres de etiquetas. La longitud de un nombre esta limitada a 72 caracteres en la definición del HTML. Los nombres de elementos y atributos no distinguen entre [[Mayúscula|mayúsculas]] y [[Minúsculas|minúsculas]], pero los nombres de [[Entidades|entidades]] (la representación alternativa de los caracteres) sí. En las marcas, el nombre del elemento debe comenzar inmediatamente después del &lt;.  
+
Los nombres consisten en una letra seguida de letras, dígitos, puntos o guiones. Los ejemplos H1 y HR anteriores son ejemplos de nombres de etiquetas. La longitud de un nombre esta limitada a 72 caracteres en la definición del HTML. Los nombres de elementos y atributos no distinguen entre mayúsculas y minúsculas, pero los nombres de entidades (la representación alternativa de los caracteres) sí. En las marcas, el nombre del elemento debe comenzar inmediatamente después del &lt;.  
  
 
'''Atributos'''&nbsp;:<br>  
 
'''Atributos'''&nbsp;:<br>  
Línea 70: Línea 70:
 
Cuando una marca inicial admite atributos, éstos se escriben a continuación del nombre del elemento. Generalmente los atributos tienen la forma nombre, signo igual, valor del atributo aunque en algunos casos basta con el nombre del atributo. Se pueden poner espacios en blanco antes y después del signo igual.El valor de un atributo puede ser una cadena de caracteres entre comillas (simples o dobles) que no contenga el [[Símbolo|símbolo]] de fin de marca "&gt;" o un nombre como los definidos en el apartado anterior. Por ejemplo, en &lt;img src="foto.gif"&gt;, img src es el nombre de la marca que se refiere a insertar una imagen en la página web; y "foto.gif" es el atributo que hace referencia al fichero específico de imagen que queremos incluir.  
 
Cuando una marca inicial admite atributos, éstos se escriben a continuación del nombre del elemento. Generalmente los atributos tienen la forma nombre, signo igual, valor del atributo aunque en algunos casos basta con el nombre del atributo. Se pueden poner espacios en blanco antes y después del signo igual.El valor de un atributo puede ser una cadena de caracteres entre comillas (simples o dobles) que no contenga el [[Símbolo|símbolo]] de fin de marca "&gt;" o un nombre como los definidos en el apartado anterior. Por ejemplo, en &lt;img src="foto.gif"&gt;, img src es el nombre de la marca que se refiere a insertar una imagen en la página web; y "foto.gif" es el atributo que hace referencia al fichero específico de imagen que queremos incluir.  
  
'''Comentarios'''&nbsp;:<br> Para incluir comentarios en [[HTML|HTML]] se emplea la declaración de comentarios. Una declaración de comentarios comienza con &lt;!, le siguen uno o varios comentarios y termina con &gt;. Cada comentario comienza con -- e incluye todo el [[Texto|texto]] hasta la siguiente aparición de -- . Dentro de una declaración de comentarios, se pueden poner espacios en blanco después de cada uno de ellos, pero no antes del primero. Toda la declaración del comentario se ignora. En páginas web complejas, con abundante código html, se utilizan estos comentarios para señalar partes de la página web que sirvan de orientación para ubicarse dentro del documento. Por ejemplo, en &lt;!--Aquí empieza el texto--&gt; está señalando una parte de la página web en la que empieza el grueso del texto de la página. <br>  
+
'''Comentarios'''&nbsp;:<br> Para incluir comentarios en [[HTML|HTML]] se emplea la declaración de comentarios. Una declaración de comentarios comienza con &lt;!, le siguen uno o varios comentarios y termina con &gt;. Cada comentario comienza con -- e incluye todo el [[Texto|texto]] hasta la siguiente aparición de -- . Dentro de una declaración de comentarios, se pueden poner espacios en blanco después de cada uno de ellos, pero no antes del primero. Toda la declaración del comentario se ignora. En páginas web complejas, con abundante código html, se utilizan estos comentarios para señalar partes de la página web que sirvan de orientación para ubicarse dentro del documento. Por ejemplo, en &lt;!--Aquí empieza el texto--&gt; está señalando una parte de la página web en la que empieza el grueso del texto de la página. <br>
  
 
=== XML<br>  ===
 
=== XML<br>  ===

última versión al 15:00 26 oct 2015

Lenguaje de marcado
Información sobre la plantilla
Marcado.jpg
Concepto:Un lenguaje de marcado(markup languaje) o lenguaje de marcas es una forma de codificar un documento que utiliza una notación especial para marcar las diferentes secciones de un documento, junto con el texto, incorpora etiquetas o marcas que contienen información adicional acerca de la estructura del texto o su presentación.

Los lenguajes de marcado suelen confundirse con lenguajes de programación. Sin embargo, no son lo mismo, ya que el lenguaje de marcado no tiene funciones aritméticas o variables, como sí poseen los lenguajes de programación. Históricamente, el marcado se usaba y se usa en la industria editorial y de la comunicación, así como entre autores, editores e impresores. Para cada lenguaje de marcado, los desarrolladores de software pueden construir una aplicación para leer los documentos escrito en ese lenguaje. Los navegadores de Web leerán los documentos HTML y Microsoft Office leerá los documentos de Office. Los documentos escritos en XML pueden leerse por medio de aplicaciones personalizadas utilizando diferentes objetos de análisis gramatical o pueden combinarse con el lenguaje de estilo extensible (XLS- Extensible Stylesheet Language) para poder mostrarse en un navegador.

Clases de lenguajes de marcado

Se suele diferenciar entre tres clases de lenguajes de marcado, aunque en la práctica pueden combinarse varias clases en un mismo documento. Por ejemplo, el HTML contiene etiquetas puramente procedimentales, como la B de bold (negrita), junto con otras puramente descriptivas ('BLOCKQUOTE, el atributo HREF). El HTML también incluye el elemento PRE, que indica que el texto debe representarse tal y como está escrito.

Marcado de presentación

El marcado de presentación es aquel que indica el formato del texto. Este tipo de marcado es útil para maquetar la presentación de un documento para su lectura, pero resulta insuficiente para el procesamiento automático de la información. El marcado de presentación resulta más fácil de elaborar, sobre todo para cantidades pequeñas de información. Sin embargo resulta complicado de mantener o modificar, por lo que su uso se ha ido reduciendo en proyectos grandes en favor de otros tipos de marcado más estructurados.
Se puede tratar de averiguar la estructura de un documento de esta clase buscando pistas en el texto. Por ejemplo, el título puede ir precedido de varios saltos de línea, y estar ubicado centrado en la página. Varios programas pueden deducir la estructura del texto basándose en esta clase de datos, aunque el resultado suele ser bastante imperfecto.

Marcado descriptivo

El marcado descriptivo o semántico utiliza etiquetas para describir los fragmentos de texto, pero sin especificar cómo deben ser representados, o en que orden. Los lenguajes expresamente diseñados para generar marcado descriptivo son el SGML y el XML.

Las etiquetas pueden utilizarse para añadir al contenido cualquier clase de metadatos. Por ejemplo, el estándar Atom, un lenguaje de sindicación, proporciona un método para marcar la hora "actualizada", que es el dato facilitado por el editor de cuándo ha sido modificada por última vez cierta información. El estándar no especifica como se debe representar, o siquiera si se debe representar. El software puede emplear este dato de múltiples maneras, incluyendo algunas no previstas por los diseñadores del estándar.

Una de las virtudes del marcado descriptivo es su flexibilidad: los fragmentos de texto se etiquetan tal como son, y no tal como deben aparecer. Estos fragmentos pueden utilizarse para más usos de los previstos inicialmente. Por ejemplo, los hiperenlaces fueron diseñados en un principio para que un usuario que lee el texto los pulse. Sin embargo, los buscadores los emplean para localizar nuevas páginas con información relacionada, o para evaluar la popularidad de determinado sitio web.

El marcado descriptivo también simplifica la tarea de reformatear un texto, debido a que la información del formato está separada del propio contenido. Por ejemplo, un fragmento indicado como cursiva (<i>texto</i>), puede emplearse para marcar énfasis o bien para señalar palabras en otro idioma. Esta ambigüedad, presente en el marcado presentacional y en el procedimental, no puede soslayarse más que con una tediosa revisión a mano. Sin embargo, si ambos casos se hubieran diferenciado descriptivamente con etiquetas distintas, podrían representarse de manera diferente sin esfuerzo.

Lenguajes especializados

Matemática: MathML y OpenMath.
Geomática: Geography ML.
Aeronáutica: Spacecraft ML.
Multimedia: Synchronized Multimedia Integration Language.
Voz: VoiceXML.
Mensajería instantánea: XMPP.
Gráficos 3D: VRML/X3D, STEP.

Orígenes

El concepto de lenguaje de marcas fue expuesto por vez primera por William W. Tunnicliffe en 1967. La mayor novedad consistía en la separación entre la presentación y la estructura del texto. Tunnicliffe, que prefería referirse a este concepto como codificación genérica (generic coding), dirigiría más tarde el desarrollo de un estándar al que bautizaría como GenCode, destinado a la industria editorial. El editor Stanley Fish también expuso ideas similares a finales de los años 1960. Brian Reid, en su disertación de 1980 en la Carnegie Mellon University, mostró su teoría y una implementación práctica de un lenguaje descriptivo todavía en uso.
Sin embargo, quien es considerado el padre de los lenguajes de marcas es Charles Goldfarb, investigador para la compañía IBM. Goldfarb participó en la creación del lenguaje GML, y posteriormente dirigió el comité que elaboró el estándar SGML, la piedra angular de los lenguajes de marcas. En cualquier caso, y a pesar de las controversias sobre su origen, es comúnmente aceptado que la idea surgió de forma independiente varias veces durante la década 1970, y que se generalizó en los 80.

La web semántica

Los lenguajes de marcado son la herramienta fundamental en el diseño de la web semántica, aquella que no solo permite acceder a la información, sino que además define su significado, de forma que sea más fácil su procesamiento automático y se pueda reutilizar para distintas aplicaciones.[9] Esto se consigue añadiendo datos adicionales a los documentos, por medio de dos lenguajes expresamente creados: el RDF (Resource descriptión framework-Plataforma de descripción de recursos) y OWL (Web Ontology Language-Lenguaje de ontologías para la web), ambos basados en XML.

lenguajes de marcado

SGML
Lenguajes hipertextuales.jpg.gif

 SGML son las siglas de Standard Generalized Markup Language o "Estándar de Lenguaje de Marcado Generalizado". Consiste en un sistema para la organización y etiquetado de documentos. La Organización Internacional de Estándares (ISO) normalizó este lenguaje en 1986.
El lenguaje SGML sirve para especificar las reglas de etiquetado de documentos y no impone en sí ningún conjunto de etiquetas en especial.
El lenguaje HTML está definido en términos del SGML. XML es un estándar de creación posterior, que incorpora un subconjunto de la funcionalidad del SGML (suficiente para las necesidades comunes), y resulta más sencillo de implementar pues evita algunas características avanzadas de SGML. Es un lenguaje extremadamente potente y versátil, estas características exigen un precio, es difícil su utilización, entrenar a personas para que utilicen documentos SGML y crear aplicaciones para que utilicen estos requiere gran cantidad de tiempo y energía.

HTML

Prácticamente todos los usuarios de computadoras están familiarizados con HTML. Es un lenguaje bastante sencillo que ha ayudado a promover el uso generalizado de internet. HTML ha recorrido un largo camino desde su diseño original con el objeto de que los científicos pudieran utilizar documentos de texto con hipervínculos para compartir la información.
HTML original, en su concepción inicial, la intención de HTML era incluir elementos que pudieran utilizarse para marcar la información de un documento de acuerdo a su significado. Se crearon etiquetas como <title>, <h1> <h2>, etc. Para representar el contenido del documento HTML.

Elementos del lenguaje HTML

Caracteres :

Cualquier cadena de caracteres imprimibles que no represente un marcado se representa literalmente, aunque los espacios y tabuladores se reducen a un solo carácter cuando no están dentro de un bloque preformateado.

Marcadores, marcas o etiquetas (tags) :

Los marcadores delimitan elementos de un documento como cabeceras, párrafos, etc. La mayoría de los marcadores constan de una marca inicial < ...> , que da el nombre y atributos del elemento, seguida del contenido ó secuencia de caracteres y una marca final</...>.

Las marcas iniciales se escriben entre los símbolos "<" y ">" (menor y mayor) y las finales entre "</" y ">" (menor barra y mayor). Por ejemplo, <H1>Contenido</H1>, indica que "Contenido" es una cabecera de nivel uno.

Algunos elementos sólo tienen una marca inicial (por ejemplo la marca <HR> que representa una línea horizontal) y otros, aunque disponen de ambas, se suelen expresar sólo con la inicial.

Nombres de etiquetas :

Los nombres consisten en una letra seguida de letras, dígitos, puntos o guiones. Los ejemplos H1 y HR anteriores son ejemplos de nombres de etiquetas. La longitud de un nombre esta limitada a 72 caracteres en la definición del HTML. Los nombres de elementos y atributos no distinguen entre mayúsculas y minúsculas, pero los nombres de entidades (la representación alternativa de los caracteres) sí. En las marcas, el nombre del elemento debe comenzar inmediatamente después del <.

Atributos :

Cuando una marca inicial admite atributos, éstos se escriben a continuación del nombre del elemento. Generalmente los atributos tienen la forma nombre, signo igual, valor del atributo aunque en algunos casos basta con el nombre del atributo. Se pueden poner espacios en blanco antes y después del signo igual.El valor de un atributo puede ser una cadena de caracteres entre comillas (simples o dobles) que no contenga el símbolo de fin de marca ">" o un nombre como los definidos en el apartado anterior. Por ejemplo, en <img src="foto.gif">, img src es el nombre de la marca que se refiere a insertar una imagen en la página web; y "foto.gif" es el atributo que hace referencia al fichero específico de imagen que queremos incluir.

Comentarios :
Para incluir comentarios en HTML se emplea la declaración de comentarios. Una declaración de comentarios comienza con <!, le siguen uno o varios comentarios y termina con >. Cada comentario comienza con -- e incluye todo el texto hasta la siguiente aparición de -- . Dentro de una declaración de comentarios, se pueden poner espacios en blanco después de cada uno de ellos, pero no antes del primero. Toda la declaración del comentario se ignora. En páginas web complejas, con abundante código html, se utilizan estos comentarios para señalar partes de la página web que sirvan de orientación para ubicarse dentro del documento. Por ejemplo, en <!--Aquí empieza el texto--> está señalando una parte de la página web en la que empieza el grueso del texto de la página.

XML

Siglas en inglés de eXtensible Markup Language ('lenguaje de marcas extensible'), es un metalenguaje extensible de etiquetas desarrollado por el World Wide Web Consortium (W3C). Es una simplificación y adaptación del SGML y permite definir la gramática de lenguajes específicos (de la misma manera que HTML es a su vez un lenguaje definido por SGML). Por lo tanto XML no es realmente un lenguaje en particular, sino una manera de definir lenguajes para diferentes necesidades[cita requerida]. Algunos de estos lenguajes que usan XML para su definición son XHTML, SVG, MathML.
No ha nacido sólo para su aplicación en Internet, sino que se propone como un estándar para el intercambio de información estructurada entre diferentes plataformas. Se puede usar en bases de datos, editores de texto, hojas de cálculo y casi cualquier cosa imaginable.
Es una tecnología sencilla que tiene a su alrededor otras que la complementan y la hacen mucho más grande y con unas posibilidades mucho mayores. Tiene un papel muy importante en la actualidad ya que permite la compatibilidad entre sistemas para compartir la información de una manera segura, fiable y fácil.

XHTML

Acrónimo en inglés de Extensible Hypertext Markup Language (lenguaje extensible de marcado de hipertexto), es el lenguaje de marcado pensado para sustituir a HTML como estándar para las páginas web. En su versión 1.0, XHTML es solamente la versión XML de HTML, por lo que tiene, básicamente, las mismas funcionalidades, pero cumple las especificaciones, más estrictas, de XML. Su objetivo es avanzar en el proyecto del World Wide Web Consortium de lograr una web semántica, donde la información, y la forma de presentarla estén claramente separadas. La versión 1.1 es similar, pero parte a la especificación en módulos. En sucesivas versiones la W3C planea romper con los tags clásicos traídos de HTML.

Fuentes

Desarrollo de soluciones XML
Autor: Sturm Jack
Aplicación de los lenguajes de marcas.
Autor: García Cataño Carolina y Arroyo Menéndez David (2002)

lenguaje-de-marcado