Recuperación de información
|
Recuperación de información. Está indosolublemente vinculado a la búsqueda de información y consiste en la localización de recursos de información con el propósito de dar solución a necesidades de información específicas.
Sumario
Definiciones
Es “el conjunto de tareas mediante las cuales el usuario localiza y accede a los recursos de información que son pertinentes para la resolución del problema planteado. En estas tareas desempeñan un papel fundamental los lenguajes documentales, las técnicas de resumen, la descripción del objeto documental, etc.”
Proceso donde se accede a una información previamente almacenada, mediante herramientas informáticas que permiten establecer ecuaciones de búsqueda específicas. Dicha información ha debido de ser estructura previamente a su almacenamiento.
Herramientas para la recuperación de información
- bases de datos
- Internet (revistas electrónicas, buscadores temáticos y multitemáticos, directorios, metabuscadores)
- tesauros
- catálogos
- ontologías
- mapas
- índices
- palabras claves
- ecuaciones de búsqueda
Técnicas de recuperación de información
Sistemas de recuperación de lógica difusa
Permite formular consultas con frases normales y luego la máquina solo procesa las plabras que considera relevantes, no tomando en cuenta signos de puntuación, artículos, conjunciones, plurales, tiempos verbales, palabras comunes (que suelen aparecer en todos los documentos). La recuperación se basa en proposiciones lógicas con valores de verdadero y falso, teniendo en cuenta la localización de la palabra en el documento.
Técnicas de ponderación de términos
La ponderación da un valor adecuado a los criterios de búsqueda, dependiendo de los intereses del usuario, por tanto la recuperación de información depende del valor asignado. El documento más pertinente de búsqueda sería aquel que tenga representado todos los términos de búsqueda y además el que más valor tenga repetidos más veces, independientemente de donde se localice en el documento.
Técnica de clustering
Es un modelo probabilístico que permite las frecuencias de los términos de búsqueda en los documentos recuperados. Se atribuyen unos valores (pesos) que actúan como agentes para agrupar los documentos por orden de importancia, mediante algoritmos ranking.
Técnicas de retroalimentación por relevancia
Luego de determinar unos criterios de búsqueda y observar los documentos recuperados se repete nuevamente la consulta pero esta vez con los elementos interesantes, seleccionados de los documentos primeramente recuperados.
Técnicas de stemming
Morfológicamente las palabras están estructuradas en prefijos, sufijos y la raíz. La técnica de Stemming lo que pretende es eliminar las posibles confusiones semánticas que se puedan dar en la búsqueda de un concepto, para ello trunca la palabra y busca solo por la raíz.
Técnicas lingüísticas
Pretenden acotar de una manera eficaz los documentos relevantes. Por esta razón, esta técnica lo consigue mediante una correcta indización en el proceso de tratamiento de los documentos con ayuda de índices, tesauros, etc.; evitando las ambigüedades léxicas y semánticas a la hora de establecer las consultas.
Fuentes
- Recuperación de Información. Consultado el 28 de agosto del 2013.