SGML

lenguaje SGML
Información sobre la plantilla
Lenguaje SGML.jpg.jpeg
Concepto:SGML son las siglas de Standard Generalized Markup Language o "Estándar de Lenguaje de Marcado Generalizado". Consiste en un sistema para la organización y etiquetado de documentos.

SGML. Diseñado para permitir el intercambio de información entre distintas plataformas, soportes físicos, lógicos y diferentes sistemas de almacenamiento y presentación (bases de datos, edición electrónica, etc.), con independencia de su grado de complejidad. El lenguaje SGML sirve para especificar las reglas de etiquetado de documentos y no impone en sí ningún conjunto de etiquetas en especial.

El lenguaje HTML está definido en términos del SGML. XML es un estándar de creación posterior, que incorpora un subconjunto de la funcionalidad del SGML (suficiente para las necesidades comunes), y resulta más sencillo de implementar pues evita algunas características avanzadas de SGML.

La industria de la publicación de documentos constituye uno de los principales usuarios del lenguaje SGML. Empleando este lenguaje, se crean y mantienen documentos que luego son llevados a otros formatos finales como HTML, Postscript, RTF

Funcionamiento

Cualquier base de datos cuenta con una representación interna que indica, por ejemplo, dónde termina el campo de "nombres" y donde comienza el campo de "direcciones".
Todos los procesadores de texto utilizan algún sistema de codificación interno para marcar cuestiones como la negrita, la cursiva, el sangrado, el centrado, etc. Pero el problema con estos códigos es que cada programa usa un sistema propio, sistemas que incluso cambian de una versión a otra en un mismo programa. Aunque existen programas para convertir, los problemas que esta disparidad ocasiona son considerables.

Etiquetas SGML

En SGML, las etiquetas se distinguen del resto del texto mediante caracteres de delimitación. Estos delimitadores permiten que el software reconozca qué caracteres deben ser leídos en modo de ETIQUETA, y deben por ello traducirse al lenguaje concreto de composición o tratarse de manera específica, y qué otros caracteres de CONTENIDO deberán ser transferidos posteriormente a la aplicación para su procesamiento.

Delimitadores

  • Los caracteres utilizados como delimitadores deben elegirse cuidadosamente, ya que no han de aparecer con demasiada frecuencia como parte del contenido de un documento.
  • El ISO 8879 describe un conjunto de caracteres básicos entre los que se incluyen el paréntesis angular de apertura y de cierre para destacar las etiquetas de inicio (los caracteres < > con el nombre de un elemento en su interior) y el signo & seguido por un nombre, y éste a su vez seguido de un punto y coma para representar entidades tales como imágenes gráficas o caracteres especiales (por ejemplo, &bullet; para un redondelito negro).

Procesamiento documental SGML

Se trata de una validación automática realizada por una máquina. Y en la medida en que asegura que el contenido que se está enviando a una base de datos o a una máquina de composición no sufrirá problemas excesivamente graves, no tendrá rivales en el mercado.
La función del parser es leer el documento SGML y separar los datos del etiquetado. El parser detecta cuándo el etiquetado ha sido minimizado y en tal caso lo expande. Si el contenido incluye referencias a una hoja de cálculo electrónica de un capítulo concreto (capítulo 2), y el gráfico del organigrama de otro capítulo (capítulo 6), dará las instrucciones pertinentes al sistema sobre cómo encontrar dichas entidades. Si el gráfico se halla en alguna notación de contenido de datos especial, generada por un programa de diseño de gráficos, el parser lo dispondrá todo para introducir la imagen (en este caso para ser editada). Si su contenido incluye instrucciones especiales para el sistema de edición en su propio lenguaje interno -SGML las denomina instrucciones de procesamiento- éstas pasarán directamente a la aplicación. Si se ha utilizado el componente de sección marcada en SGML y ha indicado que algunas partes de su documento no han de aparecer en la versión editada, el parser sabrá que no tiene que enviarlas. Si se está utilizando el componente de declaración de comentarios SGML para enviar y recibir notas y mensajes entre los escritores y los editores, el parser también sabrá que no ha de enviarlos a la aplicación receptora.

Declaración de un documento SGML

Cuando se le comunica a alguien que se le está enviando un documento SGML, esa persona sabe de antemano: que dicho documento puede comenzar con una declaración SGML. Ese diagrama formal y normalizado le indica al sistema receptor exactamente —entre otra mucha información— el conjunto de caracteres, los delimitadores y las características opcionales de SGML que se están utilizando. (Por ejemplo, la minimización es algo que unos sistemas soportan y otros no). A menudo se omitirá la declaración SGML presuponiendo que tanto el sistema emisor como el receptor utilizan la sintaxis por defecto o la sintaxis de referencia concreta. que por consiguiente, el documento contendrá un subconjunto de la declaración del tipo de documento, un conjunto formal de declaraciones de elementos, atributos y entidades que le indican a un sistema exactamente el tipo de etiquetado que se utiliza en dicho documento. A menudo se sustituirá la DTD completa por una línea que indique que la DTD se edita como un texto público o se encuentra ya disponible en el sistema recepto

Fuentes