Redes neuronales artificiales


Redes neuronales artificiales
Información sobre la plantilla
Redes Neuroneles.jpeg
Concepto:Es una de las técnicas de inteligencia artificial más representativa de Minería de datos.

Redes neuronales artificiales (RNA). Son un paradigma de aprendizaje y procesamiento automático inspirado en la forma en que funciona el sistema nervioso de los animales. Se trata de un sistema de interconexión de neuronas en una red que colabora para producir un estímulo de salida.

Panorama Histórico

Las primeras explicaciones teóricas sobre el cerebro y el pensamiento fueron dadas por algunos filósofos griegos, como Platón y Aristóteles, quienes fueron apoyados después por Descartes y filósofos empiristas. Alan Turing, en 1936, fue el primero en estudiar el cerebro como una forma de ver el mundo de la computación, pero quienes primero concibieron algunos fundamentos de la computación neuronal fueron Warren McCulloch y Walter Pitts, después otras teorías fueron expuestas por Donald Hebb. Pero solo hasta 1957 Frank Rosenblatt comenzó el desarrollo del Perceptrón, la red neuronal más antigua. Más adelante apareció el modelo Adaline, desarrollado por Bernard Widrow y Marcial Hoff. Hasta 1982 el crecimiento se frenó, pero luego surgieron investigaciones sobre redes como la de Marvin Minsky y Seymour Papert, después James Anderson desarrollo el Asociador Lineal. Actualmente, son numerosos los trabajos que se realizan y publican. Revistas como Neural Networks, Transactions on Neural Networks, entre otros, son las encargadas de la publicación de los últimos avances.

Elementos de una Red Neuronal Artificial

Las RNA son modelos que intentan reproducir el comportamiento del cerebro. Como tal modelo, realiza una simplificación, averiguando cuáles son los elementos relevantes del sistema, bien porque la cantidad de información de que se dispone es excesiva o bien porque es redundante. Una elección adecuada de sus características, más una estructura conveniente, es el procedimiento convencional utilizado para construir redes capaces de realizar determinada tarea.

  • Se conoce como capa o nivel a un conjunto de neuronas cuyas entradas provienen de la misma fuente y cuyas salidas se dirigen al mismo destino.
  • Unidad de proceso: La neurona Artificial. Existen tres tipos de unidades en cualquier sistema: entradas, salidas y ocultas. Las unidades de entrada reciben señales desde el entorno; las de salida envían la señal fuera de la red, y las unidades ocultas son aquellas cuyas entradas y salidas se encuentran dentro del sistema.
  • Estado de Activación. Los estados del sistema en un tiempo t se representan por un vector A(t). Los valores de activación pueden ser continuos o discretos, limitados o ilimitados. Si son discretos, suelen tomar un conjunto discreto de valores binarios, así un estado activo se indicaría con un 1 y un estado pasivo se representaría por un cero. En otros modelos se considera un conjunto de estados de activación, en cuyo valor entre [0,1], o en el intervalo [-1,1], siendo una función sigmoidal.
  • Función de Salida o de Transferencia. Asociada con cada unidad hay una función de salida, que transforma el estado actual de activación en una señal de salida.

Características de las Redes Neuronales

Existen cuatro aspectos que caracterizan una red neuronal: su topología, el mecanismo de aprendizaje, tipo de asociación realizada entre la información de entrada y salida, y la forma de representación de estas informaciones.

  • Redes Monocapa: Se establecen conexiones laterales, cruzadas o autor recurrentes entre las neuronas que pertenecen a la única capa que constituye la red. Se utilizan en tareas relacionadas con lo que se conoce como auto asociación; por ejemplo, para generar informaciones de entrada que se presentan a la red incompleta o distorsionada.

Redes Multicapa: Son aquellas que disponen de conjuntos de neuronas agrupadas en varios niveles o capas. Una forma de distinguir la capa a la cual pertenece la neurona, consiste en fijarse en el origen de las señales que recibe a la entrada y el destino de la señal de salida. Según el tipo de conexión, como se vio previamente, se distinguen las redes feedforward, y las redes feedforward/feedback.

  • Topología de las Redes Neuronales. La arquitectura de las redes neuronales consiste en la organización y disposición de las neuronas formando capas más o menos alejadas de la entrada y salida de la red. En este sentido, los parámetros fundamentales de la red son: el número de capas, el número de neuronas por capa, el grado de conectividad y el tipo de conexiones entre neuronas.
  • Mecanismo de Aprendizaje. El aprendizaje es el proceso por el cual una red neuronal modifica sus pesos en respuesta a una información de entrada. Los cambios que se producen durante el proceso de aprendizaje se reducen a la destrucción, modificación y creación de conexiones entre las neuronas. La creación de una nueva conexión implica que el peso de la misma pasa a tener un valor distinto de cero, una conexión se destruye cuando su peso pasa a ser cero. Se puede afirmar que el proceso de aprendizaje ha finalizado, cuando los valores de los pesos permanecen estables (dwij / dt = 0).

Ventajas

Debido a su constitución y a sus fundamentos, las RNA presentan un gran número de características semejantes a las del cerebro. Por ejemplo, son capaces de aprender de la experiencia, de generalizar de casos anteriores a nuevos casos, de abstraer características esenciales a partir de entradas que representan información irrelevante. Estas ventajas incluyen:

  • Aprendizaje: Las RNA tienen la habilidad de aprender mediante una etapa de aprendizaje. Esta consiste en proporcionar a la RNA datos como entrada a su vez que se le indica cuál es la salida esperada.
  • Auto organización: Una RNA crea su propia representación de la información en su interior.
  • Tolerancia a fallos: Debido a que una RNA almacena la información de forma redundante, ésta puede seguir respondiendo de manera aceptable aun si se daña parcialmente.
  • Flexibilidad: Una RNA puede manejar cambios no importantes en la información de entrada, como señales con ruido u otros cambios en la entrada.
  • Tiempo real: La estructura de una RNA es paralela, por lo cual si esto es implementado con computadoras o en dispositivos electrónicos especiales, se pueden obtener respuestas en tiempo real.

Aplicaciones

Las características de las RNA las hacen bastante apropiadas para aplicaciones en las que no se dispone de un modelo identificable que pueda ser programado, pero se dispone de un conjunto básico de ejemplos de entrada. Esto incluye problemas de clasificación y reconocimiento de patrones de voz, imágenes, señales. Asimismo se han utilizado para encontrar patrones de fraude económico, hacer predicciones en el mercado financiero y tiempo atmosférico. Además se pueden utilizar cuando no existen modelos matemáticos precisos o algoritmos con complejidad razonable; por ejemplo el problema del viajante.

Fuentes

  • Las redes neuronales artificiales en el trabajo de auditoría. En revista Giga, No. 3, pág 28, 2004.