WordNet

WordNet
Información sobre la plantilla
Wordnety.jpeg
Software que utiliza una base de datos
IdiomaInglés

WordNet. Es una gran base de datos léxica de Inglés. Sustantivos, verbos, adjetivos y adverbios se agrupan en conjuntos de sinónimos (synsets cognitivas), cada uno expresando un concepto distinto. Synsets están vinculados entre sí por medio de las relaciones conceptuales, semánticos y léxicos.

La red resultante de las palabras y los conceptos relacionados de manera significativa se puede navegar con el navegador. WordNet es también libre y públicamente disponible para descarga. Estructura de WordNet hace que sea una herramienta útil para la lingüística computacional y procesamiento del lenguaje natural.

WordNet superficialmente se parece a un diccionario de sinónimos, ya que los grupos de palabras juntas sobre la base de sus significados. Sin embargo, hay algunas diferencias importantes. En primer lugar, WordNet articula no sólo la palabra formas de cadenas de letras, pero los sentidos específicos de las palabras. Como resultado, las palabras que se encuentran en estrecha proximidad entre sí en la red son semánticamente desambiguadas. En segundo lugar, las etiquetas de WordNet las relaciones semánticas entre las palabras, mientras que las agrupaciones de palabras en un diccionario de sinónimos no sigue ningún patrón explícito que no sea el sentido de similitud.

Estructura

La relación principal entre las palabras en WordNet es la sinonimia, como entre las palabras y cerró cerca de o en coche y el automóvil. Sinónimos - palabras que denotan el mismo concepto y son intercambiables en muchos contextos, se agrupan en conjuntos desordenados (synsets). Cada uno de los 117 WordNet de 000 synsets está vinculada a synsets otros por medio de un pequeño número de "relaciones conceptuales."

Además, un synset contiene una breve definición ("brillante") y, en la mayoría de los casos, una o más frases cortas que ilustra el uso de los miembros synset. Formas de las palabras con varios significados distintos están representados en el mayor número synsets distintos. De este modo, cada par forma-significado en WordNet es único.

Relaciones

La relación más frecuente entre los synsets codificada es la relación super-subordinado (también llamado hiperonimia, hiponimia o la relación ISA). Vincula synsets más generales como {muebles, piece_of_furniture} para los cada vez más específicos, como la cama {} y {} litera. Por lo tanto, los estados WordNet que los muebles categoría incluye cama, que a su vez incluye una litera, por el contrario, conceptos como la cama y litera componen la categoría Mobiliario. Todas las jerarquías nominales en última instancia, ir hasta el nodo raíz {} la entidad. Relación hiponimia es transitiva: si un sillón es una especie de silla, y si una silla es una especie de muebles, a continuación, un sillón es un tipo de mobiliario. WordNet distingue entre tipos (nombres comunes) y los casos (personas concretas, los países y entidades geográficas).

De este modo, el sillón es un tipo de silla, Barack Obama, es una instancia de un presidente. Las instancias son siempre las hojas (terminal) en los nodos de sus jerarquías. Meronimia, la relación parte-todo se mantiene entre synsets como {Presidente} y {vuelta, respaldo}, {} y {asiento de la pierna}. Las piezas se heredaron de sus rango superior: si tiene una silla de patas, y luego un sillón tiene las piernas también. Las partes no se heredan "hacia arriba", ya que puede ser característica sólo de tipos específicos de las cosas en lugar de la clase como un todo: sillas y todo tipo de sillas tienen las patas, pero no todo tipo de muebles tienen las piernas.

Synsets verbales están organizados en jerarquías, así, los verbos hacia la parte inferior de los árboles (troponyms) expresar maneras cada vez más específicos que caracterizan a un evento, como en {comunicación} - {habla} - {} susurro. La forma específica expresada depende del campo semántico; volumen (como en el ejemplo anterior) es sólo una dimensión en la que los verbos pueden ser elaborados. Otros son la velocidad (movimiento-jogging-carrera) o la intensidad de la emoción (como el amor-idolatran). Los verbos que describen los eventos que necesariamente implica una forma unidireccional, y otra están vinculados: {adquirir} - {pago}, {éxito} - {try}, {programa} - {ver}, etc

Los adjetivos se organiza en términos de antonimia. Las parejas de antónimos, "directos" como seco-húmedo y los jóvenes de edad-refleja la fuerte contrato semántico de sus miembros. Cada uno de estos adjetivos polares, a su vez está vinculada a una serie de "semánticamente similares" seres: seco está relacionada con reseco, árido, desecado y el hueso seco y húmedo para empapados, adjetivos, etc anegados semánticamente similares son antónimos "indirecta" de las el miembro de la contral el polo opuesto. Adjetivos relacionales ("pertainyms") apuntan a los sustantivos que se derivan de (penal-delitos).

Sólo hay pocos adverbios en WordNet (apenas, en su mayoría, de verdad, etc) ya que la mayoría de los adverbios en inglés se deriva de forma directa a través de adjetivos afijación morfológica (sorprendentemente, curiosamente, etc)

Cruz-POS las relaciones

La mayoría de las relaciones de la WordNet de conectar las palabras de la misma parte del discurso (POS). Por lo tanto, WordNet realmente consiste en cuatro sub-redes, una para cada uno de los sustantivos, verbos, adjetivos y adverbios, con pocos puntos de venta cruzada punteros. Cruz-punto de venta incluyen las relaciones de los "enlaces" morphosemantic que mantienen entre las palabras semánticamente similares que comparten un tronco con el mismo significado: observar (verbo), la observación de observadores (adjetivo), Observatorio (los nombres). En muchos de los pares de nombre-verbo de la función semántica del nombre en relación con el verbo se ha especificado: {cama, sleeping_car} es el lugar de sueño {} y {} pintor es el agente de la pintura {}, {mientras que la pintura , imagen} es su resultado.

Fuentes

  • CDlibre. Disponible en "www.cdlibre.org". Consultado el 7 de agosto de 2012.
  • [1].