Diferencia entre revisiones de «Base de datos documental bibliográfica»

Línea 45: Línea 45:
  
 
==== Ejemplos ====
 
==== Ejemplos ====
Por ejemplo, en un directorio de miembros de una asociación, un registro será la ficha completa de cada uno de los socios. En cada registro se recogerán determinados datos, como el nombre, la profesión, la dirección o el teléfono, cada uno de los cuáles constituye un campo.
+
En un directorio de miembros de una asociación, un registro será la ficha completa de cada uno de los socios. En cada registro se recogerán determinados datos, como el nombre, la profesión, la dirección o el teléfono, cada uno de los cuáles constituye un campo.
 
Las bases de datos también pueden ser clasificas de acuerdo a la variabilidad de los datos almacenados, de esta manera encontramos:
 
Las bases de datos también pueden ser clasificas de acuerdo a la variabilidad de los datos almacenados, de esta manera encontramos:
  
Línea 52: Línea 52:
 
'''Bases de datos dinamicas:''' Los datos acumulados son reformados con el correr del tiempo. Se realizan acciones tales como actualizaciones, eliminaciones o agregado de datos, más allá de las acciones básicas de consulta.
 
'''Bases de datos dinamicas:''' Los datos acumulados son reformados con el correr del tiempo. Se realizan acciones tales como actualizaciones, eliminaciones o agregado de datos, más allá de las acciones básicas de consulta.
  
'''Según el contenido de sus registros:'''
+
'''contenido de sus registros:'''
 
   
 
   
 
* '''Bases de datos con información factual:''' contienen informaciones muy concretas y actuales, generalmente de carácter numérico: datos estadísticos, series históricas, resultados de encuestas.
 
* '''Bases de datos con información factual:''' contienen informaciones muy concretas y actuales, generalmente de carácter numérico: datos estadísticos, series históricas, resultados de encuestas.
*'''Directorios:''' contienen datos sobre personas o instituciones especializadas en una actividad o materia concreta. Hay directorios de profesionales, de investigadores, de centros de investigación, de [[bibliotecas]], de [[revistas]] científicas.
+
*'''Directorios:''' contienen datos sobre personas o instituciones especializadas en una actividad o materia concreta. Hay directorios de profesionales, de investigadores, de centros de investigación, de [[bibliotecas]], de [[revistas científicas]].
*'''Bases de datos documentales:''' Cada registro se corresponde con un documento, sea éste de cualquier tipo: una publicación impresa, un documento audiovisual, gráfico o sonoro, un documento de archivo, un [[documento]] [[electrónico]].
+
*'''Bases de datos documentales:''' Cada registro se corresponde con un documento, sea éste de cualquier tipo: una publicación impresa, documento audiovisual gráfico o sonoro, documento de archivo, 0 [[documento electrónico]].
 
   
 
   
Las bases de datos documentales pueden incluir o no el contenido completo de los documentos que describen en los registros y se distinguen en diferentes categorías:
+
'''Las bases de datos documentales se distinguen en diferentes categorías:'''
 
   
 
   
* '''Bases de datos de texto completo:''' Están constituidas por los propios documentos en formato electrónico, por un volcado completo de su texto. Pueden incorporar además campos en los que se contiene la información fundamental para facilitar su descripción y recuperación. En estos sistemas la operación de búsqueda ( puede abarcar la totalidad del texto ), contienen la totalidad de una determinada fuente de carácter primario, incluyendo todo su contenido y todas sus ediciones., es decir que se constituyen por los propios documentos con su respectivo texto. Incluyen un resumen o descripción con el propósito de acelerar la búsqueda.
+
* '''Bases de datos de texto completo:''' Están constituidas por los propios documentos en formato electrónico, un volcado completo de su texto. Pueden incorporar además campos en los que se contiene la información fundamental para facilitar su descripción y recuperación. En estos sistemas la operación de búsqueda ( puede abarcar la totalidad del texto ), contienen la totalidad de una determinada fuente de carácter primario, incluyendo todo su contenido y todas sus ediciones, es decir que se constituyen por los propios documentos con su respectivo texto. Incluyen un resumen o descripción con el propósito de acelerar la búsqueda.
*'''Archivos electrónicos de imágenes:''' Contienen por referencias que permiten un enlace directo con la imagen del documento original, sea éste un documento iconográfico ([[fotografías]], [[imágenes]] de [[televisión]]) o un documento impreso digitalizado en formato de imagen. En estas bases de datos normalmente la búsqueda está limitada a los campos de la [[referencia bibliográfica]] y no se pueden localizar otros términos presentes en el texto completo del documento original.
+
*'''Archivos electrónicos de imágenes:''' Contienen por referencias que permiten un enlace directo con la imagen del documento original, sea éste un documento iconográfico ([[fotografías]], [[imágenes]] de [[televisión]]) o un documento impreso digitalizado en formato de imagen. En estas bases de datos normalmente la búsqueda está limitada a los campos de la [[referencia bibliográfica]], no se pueden localizar otros términos presentes en el texto completo del documento original.
* '''Bases de datos referenciales:''' Los registros no contienen el texto original, sólo información fundamental para describir y permitir la localización de documentos impresos, sonoros, iconográficos, audiovisuales o electrónicos. Estos sistemas de información sólo se puede tener referencias sobre documentos que habrá que localizar posteriormente en otro servicio (archivo, [[biblioteca]], fototeca, [[fonoteca]]) o solicitar a un servicio de suministro de documentos. Una base de datos referencial puede incluir campos que faciliten la localización del documento (bibliotecas, signaturas, direcciones en Internet,...) o incluso enlaces directos para obtener directamente el original a través de otro programa (tratamiento de texto, navegador de internet).
+
* '''Bases de datos referenciales:''' Los registros no contienen el texto original, sólo información fundamental para describir y permitir la localización de documentos impresos, sonoros, iconográficos, audiovisuales o electrónicos. Estos sistemas de información sólo se puede tener referencias sobre documentos que habrá que localizar posteriormente en otro servicio (archivo, [[biblioteca]],fototeca,) o solicitar a un servicio de suministro de documentos. Una base de datos referencial puede incluir campos que faciliten la localización del documento (bibliotecas, signaturas, direcciones en Internet,...) o incluso enlaces directos para obtener directamente el original a través de otro programa (tratamiento de texto, navegador de internet).
 
   
 
   
 
'''Las bases de datos bibliográficas:''' Son generalmente documentales referenciales, cuyos registros contienen referencias de documentos impresos o de texto. La base de datos se crea y con el objetivo de resolver necesidades de información concretas de un colectivo, una empresa o el conjunto de la sociedad. Estos recursos electrónicos pueden ser consultables directamente en formato electrónico o ser utilizados para elaborar productos impresos: bibliografías, directorios, informes.
 
'''Las bases de datos bibliográficas:''' Son generalmente documentales referenciales, cuyos registros contienen referencias de documentos impresos o de texto. La base de datos se crea y con el objetivo de resolver necesidades de información concretas de un colectivo, una empresa o el conjunto de la sociedad. Estos recursos electrónicos pueden ser consultables directamente en formato electrónico o ser utilizados para elaborar productos impresos: bibliografías, directorios, informes.
 
   
 
   
== Tipología de las basesde datos documentales ==
+
== Tipología de las bases de datos documentales bibliograficas ==
 
   
 
   
Se pueden establecer diferentes tipologías para caracterizar los diferentes modelos de bases de datos documentales tales como:
+
Se pueden establecer diferentes tipologías para caracterizar los diferentes modelos de bases de datos bibliograficas tales como:
 
   
 
   
 
'''cobertura documental.'''
 
'''cobertura documental.'''
Línea 87: Línea 87:
 
'''Indices de citas:''' Son sistemas de información en los que, además de extraer los datos de descripción de los documentos, se vacían sistemáticamente las referencias bibliográficas citadas en los artículos de las revistas científicas. Su mayor utilidad radica en servir de apoyo para la elaboración de estudios [[bibliométricos]] y de productividad científica: autores, instituciones y publicaciones científicas más citadas; pervivencia de la literatura científica,...
 
'''Indices de citas:''' Son sistemas de información en los que, además de extraer los datos de descripción de los documentos, se vacían sistemáticamente las referencias bibliográficas citadas en los artículos de las revistas científicas. Su mayor utilidad radica en servir de apoyo para la elaboración de estudios [[bibliométricos]] y de productividad científica: autores, instituciones y publicaciones científicas más citadas; pervivencia de la literatura científica,...
  
== Estructura interna de una base de datos ==
+
== Estructura interna ==
  
 
Se componen de diferentes registros con su correspondiente número de identificación. Cada registro se corresponde con una referencia de un documento original, que puede ser una publicación independiente (monografía, tesis, informe, artículo,) o una parte con autonomía de contenido dentro de otra publicación (artículo incluido en una revista, una serie o una compilación, ponencia o comunicación en las actas de una reunión científica). La información contenida en cada registro bibliográfico se estructura en diferentes campos para facilitar su control sistemático y su recuperación individualizada. Algunos campos reflejarán la descripción formal del documento y otros van destinados a reflejar su contenido temático. Según el modelo de base de datos y el tipo de documentos contenido en la misma se establece una estructura de campos particular.  
 
Se componen de diferentes registros con su correspondiente número de identificación. Cada registro se corresponde con una referencia de un documento original, que puede ser una publicación independiente (monografía, tesis, informe, artículo,) o una parte con autonomía de contenido dentro de otra publicación (artículo incluido en una revista, una serie o una compilación, ponencia o comunicación en las actas de una reunión científica). La información contenida en cada registro bibliográfico se estructura en diferentes campos para facilitar su control sistemático y su recuperación individualizada. Algunos campos reflejarán la descripción formal del documento y otros van destinados a reflejar su contenido temático. Según el modelo de base de datos y el tipo de documentos contenido en la misma se establece una estructura de campos particular.  
Línea 107: Línea 107:
 
Los índices pueden estar formados por palabras (unitérminos) o por frases (texto completo de un campo o de cada ocurrencia de un campo: cada autor, cada descriptor)
 
Los índices pueden estar formados por palabras (unitérminos) o por frases (texto completo de un campo o de cada ocurrencia de un campo: cada autor, cada descriptor)
  
==Recuperación deinformación ==
+
==Recuperación de información ==
  
 
Significa volver a tener, información que alguna vez, hace unos minutos o hace unos años, ha sido producida por alguien, bien por nosotros mismos o bien por terceras personas. La Recuperación deInformación (a partir de ahora) es la disciplina que estudia la representación, la organización y el acceso eficiente a la información que se encuentra registrada en documentos.
 
Significa volver a tener, información que alguna vez, hace unos minutos o hace unos años, ha sido producida por alguien, bien por nosotros mismos o bien por terceras personas. La Recuperación deInformación (a partir de ahora) es la disciplina que estudia la representación, la organización y el acceso eficiente a la información que se encuentra registrada en documentos.
Línea 134: Línea 134:
  
 
=== Herramientas ===
 
=== Herramientas ===
Para realizar una búsqueda compleja en una base de datos es preciso utilizar un número elevado de conceptos. Hay que precisar los diferentes aspectos temáticos implicados y además contar con la posibilidad de que cada uno de ellos pueda estar expresado de diferentes maneras (sinónimos, temas relacionados,...). Los sistemas de recuperación de información cuentan con diferentes herramientas para construir una estrategia y relacionar de forma clara los diferentes términos utilizados en una búsqueda.
+
Para realizar una búsqueda compleja en una base de datos es preciso utilizar un número elevado de conceptos. Hay que precisar los diferentes aspectos temáticos implicados y además contar con la posibilidad de que cada uno de ellos pueda estar expresado de diferentes maneras (sinónimos, temas relacionados,...). Los sistemas de recuperación de información cuentan con diferentes herramientas para construir una estrategia y relacionar de forma clara los diferentes términos utilizados en una búsqueda tales como:
  
 
*'''Operadores lógicos o booleanos.''' Permiten la combinación de conceptos en una misma búsqueda. Los sistemas de recuperación utilizan las operaciones propias de la teoría de conjuntos o álgebra de Booleanos:
 
*'''Operadores lógicos o booleanos.''' Permiten la combinación de conceptos en una misma búsqueda. Los sistemas de recuperación utilizan las operaciones propias de la teoría de conjuntos o álgebra de Booleanos:

Revisión del 10:56 14 nov 2013

Base de datos documental bibliografica
Información sobre la plantilla
Basededatos4.jpg
Concepto:Es un conjunto de información estructurada en registros y almacenada en un soporte electrónico legible desde un ordenador.

Base de datos documental bibliografica. Es un conjunto de información estructurada en registros y almacenada en un soporte electrónico legible desde un ordenador. Cada registro constituye una unidad autónoma de información que puede estar a su vez estructurada en diferentes campos o tipos de datos que se recogen en dicha base de datos.

Historia

En las bibliotecas de la antigüedad existían Bases de datos y toda clase de registros. También se utilizaban para recoger información sobre las cosechas y censos. Sin embargo, su búsqueda era lenta y poco eficaz y no se contaba con la ayuda de máquinas que pudiesen reemplazar el trabajo manual.

Más adelante, se desarrolló a partir de las necesidades de almacenar grandes cantidades de información o datos. Sobre todo, desde la aparición de las primeras computadoras, el concepto de bases de datos ha estado siempre ligado a la informática.

En 1960 se dio inicio a las primeras generaciones de bases de datos de red y las bases de datos jerárquicas, ya que era posible guardar estructuras de datos en listas y arboles. Otro logro alcanzado fue la alianza de IBM y American Airlines para desarrollar SABRE, un sistema operativo que manejaba las reservas de vuelos, transacciones e informaciones sobre los pasajeros de la compañía American Airlines. Y, en esta misma década, se llevo a cabo el desarrollo del IDS desarrollado por Charles Bachman ( que formaba parte de la CODASYL) supuso la creación de un nuevo tipo de sistema de bases de datos conocido como modelo en red que permitió la creación de un standard en los sistemas de bases de datos gracias a la creación de nuevos lenguajes de sistemas de información.

CODASYL (Conference on Data Systems Languages) era un consorcio de industrias informáticas que tenían como objetivo la regularización de un lenguaje de programación estándar que pudiera ser utilizado en multitud de ordenadores.

Los miembros de este consorcio pertenecían a industrias e instituciones gubernamentales relacionadas con el proceso de datos, cuya principal meta era promover un análisis, diseño e implementación de los sistemas de datos más efectivos; y aunque trabajaron en varios lenguajes de programación como COBOL, nunca llegaron a establecer un estándar fijo, proceso que se llevo a cabo por ANSI.

En 1970, Edgar Frank Codd, científico informático ingles conocido por sus aportaciones a la teoría de bases de datos relacionales, definió el modelo relacional a la par que publicó una serie de reglas para los sistemas de datos relacionales a través de su artículo “Un modelo relacional de datos para grandes bancos de datos compartidos”. Este hecho propicio el paso al nacimiento de la segunda generación de los Sistemas Gestores de Bases de Datos.

Como consecuencia de esto, durante 1970, Lawrence J. Ellison, más conocido como Larry Ellison, a partir del trabajo de Edgar F. Codd sobre los sistemas de bases de datos relacionales, desarrolló el Relational Software System, o lo que es lo mismo, lo que actualmente se conoce como Oracle Corporation, desarrollando así un sistema de gestión de bases de datos relacional con el mismo nombre que dicha compañía.

En la época de los ochenta también se desarrollará el SQL (Structured Query Language) o lo que es lo mismo un lenguaje de consultas o lenguaje declarativo de acceso a bases de datos relacionales que permite efectuar consultas con el fin de recuperar información de interés de una base de datos y hacer cambios sobre la base de datos de forma sencilla; además de analiza grandes cantidades de información y permitir especificar diversos tipos de operaciones frente a la misma información, a diferencia de las bases de datos de los años ochenta que se diseñaron para aplicaciones de procesamiento de transacciones.

ORACLE es considerado como uno de los sistemas de bases de datos más completos que existen en el mundo, y aunque su dominio en el mercado de servidores empresariales ha sido casi total hasta hace relativamente poco, actualmente sufre la competencia del SQL Server de la compañía Microsoft y de la oferta de otros Sistemas Administradores de Bases de Datos Relacionales con licencia libre como es el caso de PostgreSQL, MySQL o Firebird que aparecerían posteriormente en la década de 1990.

En 1990 la investigación en bases de datos giró en torno a las bases de datos orientadas a objetos. Las cuales han tenido bastante éxito a la hora de gestionar datos complejos en los campos donde las bases de datos relacionales no han podido desarrollarse de forma eficiente. Así se desarrollaron herramientas como Excel y Access del paquete de Microsoft Office que marcan el inicio de las bases de datos orientadas a objetos.

En la actualidad, las tres grandes compañías que dominan el mercado de las bases de datos son IBM, Microsoft y Oracle. Por su parte, en el campo de internet, la compañía que genera gran cantidad de información es Google. Aunque existe una gran variedad de software que permiten crear y manejar bases de datos con gran facilidad, como por ejemplo LINQ, que es un proyecto de Microsoft que agrega consultas nativas semejantes a las de SQL a los lenguajes de la plataforma .NET. El objetivo de este proyecto es permitir que todo el código hecho en Visual Studio sean también orientados a objetos; ya que antes de LINQ la manipulación de datos externos tenía un concepto más estructurado que orientado a objetos; y es por eso que trata de facilitar y estandarizar el acceso a dichos objetos.

Bases de datos documentales

Ofrecen algunas informaciones básicas para un uso más eficaz de las mismas. Bajo la denominación genérica de bases de datos documentales se engloban diferentes modelos que pueden diferenciarse tanto en el contenido (tipos de documentos que describen) como en la estructura de las mismas.

Definición

Es un conjunto de información estructurada en registros y almacenada en un soporte electrónico legible desde un ordenador. Cada registro constituye una unidad autónoma de información que puede estar a su vez estructurada en diferentes campos o tipos de datos que se recogen en dicha base de datos.

Ejemplos

En un directorio de miembros de una asociación, un registro será la ficha completa de cada uno de los socios. En cada registro se recogerán determinados datos, como el nombre, la profesión, la dirección o el teléfono, cada uno de los cuáles constituye un campo. Las bases de datos también pueden ser clasificas de acuerdo a la variabilidad de los datos almacenados, de esta manera encontramos:

Bses de datos estáticas: Son de sólo lectura. Su propósito esencial consiste en el almacenamiento de información de carácter histórico, con el fin de que luego sea usada para analizar la conducta de una serie de datos a lo largo del tiempo. Así es posible efectuar proyecciones y actuar en consecuencia.

Bases de datos dinamicas: Los datos acumulados son reformados con el correr del tiempo. Se realizan acciones tales como actualizaciones, eliminaciones o agregado de datos, más allá de las acciones básicas de consulta.

contenido de sus registros:

  • Bases de datos con información factual: contienen informaciones muy concretas y actuales, generalmente de carácter numérico: datos estadísticos, series históricas, resultados de encuestas.
  • Directorios: contienen datos sobre personas o instituciones especializadas en una actividad o materia concreta. Hay directorios de profesionales, de investigadores, de centros de investigación, de bibliotecas, de revistas científicas.
  • Bases de datos documentales: Cada registro se corresponde con un documento, sea éste de cualquier tipo: una publicación impresa, documento audiovisual gráfico o sonoro, documento de archivo, 0 documento electrónico.

Las bases de datos documentales se distinguen en diferentes categorías:

  • Bases de datos de texto completo: Están constituidas por los propios documentos en formato electrónico, un volcado completo de su texto. Pueden incorporar además campos en los que se contiene la información fundamental para facilitar su descripción y recuperación. En estos sistemas la operación de búsqueda ( puede abarcar la totalidad del texto ), contienen la totalidad de una determinada fuente de carácter primario, incluyendo todo su contenido y todas sus ediciones, es decir que se constituyen por los propios documentos con su respectivo texto. Incluyen un resumen o descripción con el propósito de acelerar la búsqueda.
  • Archivos electrónicos de imágenes: Contienen por referencias que permiten un enlace directo con la imagen del documento original, sea éste un documento iconográfico (fotografías, imágenes de televisión) o un documento impreso digitalizado en formato de imagen. En estas bases de datos normalmente la búsqueda está limitada a los campos de la referencia bibliográfica, no se pueden localizar otros términos presentes en el texto completo del documento original.
  • Bases de datos referenciales: Los registros no contienen el texto original, sólo información fundamental para describir y permitir la localización de documentos impresos, sonoros, iconográficos, audiovisuales o electrónicos. Estos sistemas de información sólo se puede tener referencias sobre documentos que habrá que localizar posteriormente en otro servicio (archivo, biblioteca,fototeca,) o solicitar a un servicio de suministro de documentos. Una base de datos referencial puede incluir campos que faciliten la localización del documento (bibliotecas, signaturas, direcciones en Internet,...) o incluso enlaces directos para obtener directamente el original a través de otro programa (tratamiento de texto, navegador de internet).

Las bases de datos bibliográficas: Son generalmente documentales referenciales, cuyos registros contienen referencias de documentos impresos o de texto. La base de datos se crea y con el objetivo de resolver necesidades de información concretas de un colectivo, una empresa o el conjunto de la sociedad. Estos recursos electrónicos pueden ser consultables directamente en formato electrónico o ser utilizados para elaborar productos impresos: bibliografías, directorios, informes.

Tipología de las bases de datos documentales bibliograficas

Se pueden establecer diferentes tipologías para caracterizar los diferentes modelos de bases de datos bibliograficas tales como:

cobertura documental. modelo de tratamiento documental.

  • cobertura documental

Bases de datos centradas en un único tipo de documento. Su objetivo es recopilar y permitir la localización de un tipo documental muy concreto. Hay bases especializadas en patentes, tesis doctorales, informes, artículos de revista, ejemplos de este modelo pueden citarse: Bases de datos que reúnen varios tipos de documentos. Su objetivo es dar información sobre una disciplina, incorporando para ello diferentes tipologías documentales.

  • Modelo de tratamiento documental
  • Bases de datos de sumarios o sin análisis de contenido: se componen de referencias bibliográficas sencillas, en las cuáles el productor se limita a grabar los datos de la propia fuente y no realiza ningún análisis del contenido. Incorporan solamente los datos descriptivos fundamentales para localizar el documento, presentes en el sumario: autor, título y datos de la fuente. En ocasiones pueden incorporar el resumen editado con el propio documento original, generalmente elaborado por el propio autor. En la mayoría de estas bases de datos la búsqueda

por materias sólo puede realizarse a través de las palabras del título del artículo. En muchas áreas temáticas los títulos pueden resultar poco significativos. Los resultados obtenidos en una búsqueda tienen cierta pertinencia, pero la escasez de puntos de acceso para la búsqueda por materias no garantiza la exhaustividad.

  • Catálogos de bibliotecas: Son bases de datos que responden estrictamente a los fondos contenidos en una biblioteca o en una red de bibliotecas (catálogos colectivos). Tienen una alta homogeneidad, gracias a la aplicación de normas internacionales de Catalogación. En estos sistemas se puede garantizar la búsqueda por ejemplar conocido. Por el contrario, la búsqueda por materias es en ocasiones dificultosa y con algunas variaciones entre diferentes catálogos. Puede realizarse a través de la clasificación o de los encabezamientos de materias.
  • Bases de datos con análisis documental más completo: Son sistemas de información que incorporan un mayor número de puntos de acceso para facilitar la localización por materias. Cada registro bibliográfico incluye bien un resumen del contenido del documento original y/o un conjunto de conceptos o términos representativos de los temas tratados en el mismo. Se denomina indización al proceso de asignación a un documento de estos términos que describen su contenido y que constituyen entradas en un índice de materias (palabras clave o descriptores). Estas bases de datos pueden ser independientes de un fondo documental concreto, ya que su objetivo no es describir una colección sino proporcionar el mayor número de referencias potencialmente relevantes para cubrir unas necesidades de información. Dentro de este modelo se incluyen numerosas bases de datos especializadas, de gran importancia y prestigio internacional como:
  • Bases de datos con clasificación y resúmenes: En estos sistemas de información , la búsqueda por materias se realiza generalmente a través de las palabras del título y del resumen. Tienen una alta cantidad de puntos de acceso, pero en ocasiones la búsqueda puede ser muy dificultosa.
  • Bases de datos con clasificación e indización: por descriptores o palabras clave Se caracterizan por permitir una mayor pertinencia de la recuperación. Sin embargo para sacarles un óptimo rendimiento es conveniente que el usuario conozca el listado de términos utilizados para la descripción del contenido de los documentos.
  • Bases de datos con clasificación, indización y resúmenes: teóricamente reúnen las ventajas de los dos grupos anteriores. Dentro de este modelo conviven bases de datos con diferentes criterios de indización (genérica o específica) y diferentes modelos de resúmenes (informativos o indicativos).

Indices de citas: Son sistemas de información en los que, además de extraer los datos de descripción de los documentos, se vacían sistemáticamente las referencias bibliográficas citadas en los artículos de las revistas científicas. Su mayor utilidad radica en servir de apoyo para la elaboración de estudios bibliométricos y de productividad científica: autores, instituciones y publicaciones científicas más citadas; pervivencia de la literatura científica,...

Estructura interna

Se componen de diferentes registros con su correspondiente número de identificación. Cada registro se corresponde con una referencia de un documento original, que puede ser una publicación independiente (monografía, tesis, informe, artículo,) o una parte con autonomía de contenido dentro de otra publicación (artículo incluido en una revista, una serie o una compilación, ponencia o comunicación en las actas de una reunión científica). La información contenida en cada registro bibliográfico se estructura en diferentes campos para facilitar su control sistemático y su recuperación individualizada. Algunos campos reflejarán la descripción formal del documento y otros van destinados a reflejar su contenido temático. Según el modelo de base de datos y el tipo de documentos contenido en la misma se establece una estructura de campos particular.

Por ejemplo, en una base de datos donde se incorporan referencias de artículos de revista se encuentran campos como los siguientes:

  • Autor o autores del documento original
  • Título del artículo
  • Título de la revista en la que aparece
  • Año de publicación
  • Datos fuente: volumen, número, páginas
  • Idioma
  • Clasificación
  • Palabras clave
  • Resumen

En algunas bases de datos el campo de palabras clave se sustituye por un conjunto de diferentes campos que informan sobre distintos aspectos del contenido del documento. Con ello se pretende mejorar la pertinencia de la recuperación. Según la cobertura temática se pueden encontrar campos como los siguientes:

  • Descriptores: términos que describen conceptos teóricos tratados de forma especialmente relevante en el artículo.
  • Identificadores: nombres propios de personas, obras o instituciones tratadas en el artículo.

Los índices pueden estar formados por palabras (unitérminos) o por frases (texto completo de un campo o de cada ocurrencia de un campo: cada autor, cada descriptor)

Recuperación de información

Significa volver a tener, información que alguna vez, hace unos minutos o hace unos años, ha sido producida por alguien, bien por nosotros mismos o bien por terceras personas. La Recuperación deInformación (a partir de ahora) es la disciplina que estudia la representación, la organización y el acceso eficiente a la información que se encuentra registrada en documentos.

De las operaciones propias la más característica consiste en la selección de documentos, bien a partir de las características de su contenido, (los temas tratados), bien a partir de características de su contexto (p.e. la fecha de publicación,) bien a partir de alguna combinación de ambas cosas.

Los sistemas de RI no son los únicos sistemas de información que existen. En tal sentido, en relación a otros métodos de procesamiento de la información, la RI presenta algunos rasgos bien definidos que presentamos a continuación:

  • Primero: aunque también utiliza ordenadores, como casi cualquier otro sistema de información actual, la intervención de los mismos varía mucho, yendo desde sistemas de RI mediante ordenador a sistemas de RI asistidos por ordenador.
  • Segundo: gestiona información de cualquier tipo, desde textos hasta videos, pasando por reproducciones de arte o fotografías, pero siempre mediante el uso información textual.
  • Tercero: tiene lugar en lo que aquí llamaremos un contexto de descubrimiento.

Significado:

  • Uso de ordenadores (automatización). Se caracteriza por el uso de ordenadores y, por tanto, por el uso de bases de datos u otros sistemas automáticos o semi automáticos de procesamiento de la información, tales como hipertextos.
  • Uso de información textual. La recuperación de información gestiona información textual de tipo narrativo o discursivo, en lugar de, por ejemplo, datos numéricos o alfanuméricos muy estructurados, como hacen otros sistemas de información, por ejemplo, los sistemas administrativos (Salton; McGill, 1983: viii). Cuando la RI gestiona documentos u objetos no textuales, como imágenes, fotografías, video, etc., lo hace también a través de descripciones textuales (p.e., descripciones de las imágenes) y/o de conjuntos de palabras que expresan el contenido y el contexto de las imágenes.
  • Contexto de descubrimiento. Los usuarios del sistema de información tienen la necesidad de descubrir qué entidades cumplen una o más condiciones, por ejemplo, qué documentos contienen información relevante para interpretar, desde el punto de vista x, el tema y. En otros sistemas de información, en cambio, los usuarios, partiendo de una entidad previamente conocida, quieren saber algo más de ella. La diferencia entre descubrir cosas y ampliar datos es esencial para entender la naturaleza de la RI.

Opciones de búsqueda

Se presenten en forma de lenguaje de comandos, permiten realizar diferentes modalidades de búsqueda:

  • Búsqueda directa: se teclea directamente una o varias palabras en el espacio reservado para ello por el sistema de interrogación en la base de datos. Pueden distinguirse a su vez dos tipos dentro de esta modalidad:
  • Búsqueda a través de índices: en vez de teclear un término, el usuario visualiza un diccionario o índice alfabético de las entradas de todos los campos o de uno concreto (índice de autores, descriptores,...) y selecciona las más adecuados a su búsqueda. El proceso puede parecer más lento pero es más seguro, ya que la búsqueda se adapta mejor al contenido real de los registros de una base de datos.

En esta posibilidad hay que tener en cuenta si el sistema trabaja con uno o varios índices y cómo se realizan los mismos:

  • Índices por palabras: incluyen solamente unitérminos (conceptos expresados en una sola palabra). Se elaboran, por ejemplo, con todas las palabras extraídas del título o del resumen de los documentos. La mayoría de los productores de bases de datos establecen una lista de

“palabras vacías” (preposiciones, artículos,...) para reducir el tamaño de estos índices. Los términos presentes en esta lista de palabras vacías no serán consultables.

  • Búsqueda jerarquizada: la interrogación se realiza a través de una estructura jerárquica. Es decir, a partir de un concepto genérico se pueden localizar, no sólo los registros en los que aparece dicho término, sino además todos aquellos en los que figure algún concepto más específico de su campo semántico. Está opción de búsqueda sólo será posible en aquellos sistemas de información que cuenten con campos codificados o que utilicen lenguajes estructurados jerárquicamente en la clasificación o en los descriptores.

Herramientas

Para realizar una búsqueda compleja en una base de datos es preciso utilizar un número elevado de conceptos. Hay que precisar los diferentes aspectos temáticos implicados y además contar con la posibilidad de que cada uno de ellos pueda estar expresado de diferentes maneras (sinónimos, temas relacionados,...). Los sistemas de recuperación de información cuentan con diferentes herramientas para construir una estrategia y relacionar de forma clara los diferentes términos utilizados en una búsqueda tales como:

  • Operadores lógicos o booleanos. Permiten la combinación de conceptos en una misma búsqueda. Los sistemas de recuperación utilizan las operaciones propias de la teoría de conjuntos o álgebra de Booleanos:
  • Suma o unión (A or B, A o B): selecciona todos los registros en los que

aparece tanto A como B como ambos a la vez.

  • Resta o negación (A and not B, A no B): selecciona sólo los registros en los

que se encuentre el término A sin estar acompañado del término B. Es una operación que debe realizarse con la máxima precaución para no dejar de seleccionar documentos que sí pueden ser de interés para la consulta deseada.

  • Intersección (A and B, A y B): selecciona solamente los registros en los que

aparece simultáneamente los conceptos A y B. Para realizar una consulta pertinente en la interrogación de una base de datos se deben tener claros los siguientes argumentos:

  • Seleccionar la base de datos que corresponda con la temática de la estrategia
  • Definir estrategia de búsqueda adecuada para esto es posible el correcto uso de lo operadores booleanos así como listados, tesauros en los campos seleccionados
  • Familiarizarse con las características de la base de datos y del sistema de

recuperación.

  • Seleccionar los conceptos de búsqueda que representen de forma precisa

el tema de interés.

  • Realizar la búsqueda y visualizar los resultados, valorando la adecuación

de los mismos y la eficacia de la estrategia utilizada.

  • Si el resultado es satisfactorio terminamos de lo contrario, se debe repetir la búsqueda ampliando o limitando la estrategia utilizada.

Fuente