Entrenamiento de Redes Neuronales Artificiales con Aprendizaje No Supervisado en el control de calidad del anlisis

 

Training of Artificial Neural Networks with Unsupervised Learning in the quality control of the analysis

 

Treinamento de Redes Neurais Artificiais com Aprendizado No Supervisionado no controle de qualidade da anlise

 

Rodrigo Rigoberto Moreno-Pallares II
rodrigo.moreno@espoch.edu.ec 
https://orcid.org/0000-0003-1877-6942
Mario Gerardo Moreno-Pallares I
mario.moreno01@epn.edu.ec 
https://orcid.org/0000-0001-9083-8816
Edwin Fernando Mejia-Peafiel III
efmejia@espoch.edu.ec 
https://orcid.org/0000-0001-6888-4621
 

 

 

 

 

 

 

 

 

 

 

 


 

Correspondencia: mario.moreno01@epn.edu.ec

 

 

Ciencias Tcnicas y Aplicadas

Artculo de Revisin

 

 

* Recibido: 20 de marzo de 2022 *Aceptado: 18 de abril de 2022 * Publicado: 24 de mayo de 2022

 

 

        I.            Magister en Computacin Mencin en Sistemas Inteligentes, Escuela Politcnica Nacional, Quito, Ecuador.

     II.            Magister en Ingeniera Industrial y Productividad Msc, Escuela Politcnica Nacional, Quito, Ecuador.

   III.            Magister en Informtica Aplicada, Escuela Superior Politcnica de Chimborazo (ESPOCH), Riobamba, Ecuador.

 

 


Resumen

El aprendizaje automtico tiene el propsito de entrenar a la computadora para realizar tareas rpidamente con grandes volmenes de datos. En el presente trabajo se realiza la agrupacin de un conjunto de datos de un vino el cual tiene tres caractersticas, una vez normalizado en formato .csv se realiza una comparacin de un conjunto de datos utilizando redes neuronales artificiales, tales como: Red Neuronal de Auto- Mapa organizativo y una Red Neuronal Competitiva, combinando las propiedades de cada Red, se obtiene que para este caso particular es mejor que una Red Neuronal de Mapa Autoorganizador para la clasificacin y que es la que menor porcentaje de error. Tenga en cuenta que se tomaron sus propiedades que han sido por defecto en el entorno MATLAB.

Palabras Clave: Redes Neuronales Artificiales; Red Mapa Autoorganizativo; Red Neuronal Competitiva; SOM; Aprendizaje no Supervisado.

 

Abstract

The machine learning has the purpose of training the computer to perform tasks quickly with large volumes of data. In the present work, the grouping of a data set of a wine which has three characteristics is performed, once normalized in a .csv format, a comparison of a data set is made using artificial neural networks, such as: Neural Network of Self-organizing Map and a Competitive Neural Network, combining the properties of each Network, it is obtained that for this particular case it is better than a Neuronal Network of Autoorganizing Map for the classification and that is the one that lower percentage of error. note that their properties were taken that have been by default in the MATLAB environment.

Keywords: Artificial Neural Networks; Self-organizing Map Network; Competitive Neural Network; SOM; Unsupervised Learning.

 

Resumo

O aprendizado de mquina tem o objetivo de treinar o computador para executar rapidamente tarefas com grandes volumes de dados. No presente trabalho realizado o agrupamento de um conjunto de dados de um vinho, que possui trs caractersticas, uma vez normalizado em formato .csv, feita uma comparao de um conjunto de dados utilizando redes neurais artificiais, tais como: Rede Neural de Auto - Mapa Organizacional e uma Rede Neural Competitiva, combinando as propriedades de cada Rede, obtm-se que para este caso particular melhor do que uma Rede Neural de Mapa Auto-Organizvel para classificao e que a que apresenta o menor percentual de erro. Observe que suas propriedades foram retiradas do padro no ambiente MATLAB.

Palavras-chave: Redes Neurais Artificiais; Rede de Mapas auto-organizada; Rede Neural Competitiva; SOM; Aprendizagem no supervisionada.

 

Introduccin

El machine learning tambin conocido como aprendizaje de mquina tiene como propsito entrenar a la computadora para realizar ciertas tareas rpidamente, en grandes volmenes y con el menor error posible. Esto se lo hace a travs del aprendizaje de patrones con base en ejemplos. Las redes con aprendizaje no supervisado no requieren de la influencia externa para el ajuste de sus pesos de las conexiones entre sus neuronas, estas redes encuentran las caractersticas, correlaciones o categoras que pueden establecer los datos de entrada[1].

A travs de la pgina https://archive.ics.uci.edu/ml/datasets/wine se obtuvo un conjunto de datos de los resultados de un anlisis qumico de vinos cultivados en una misma regin en Italia, pero derivado de tres cultivares diferentes, el conjunto de datos especifica trece variables, la primera variable da a conocer a cul de las tres de clases de vino pertenece la informacin[2].

En el presente trabajo se realiz el clustering del conjunto de datos en cuestin utilizando una Red Neuronal Competitiva y una Red Neuronal de Mapa Autoorganizativo (SON o SOFM) para la comparacin de que red realiz de mejor manera la clasificacin de los dato, tomando en cuenta el error que produjeron cada una de ellas, se modificaron las propiedades de cada una de las redes y se observ el error producido. Para realizar este trabajo se us el entorno de MATLAB.

El presente trabajo la Seccin II denominada Metodologa y Materiales se encuentra el marco terico y la metodologa usada para resolver el problema planteado, la Seccin III Resultados muestra los datos que se obtuvo al realizar el cambio de las propiedades en las redes, la Seccin IV Discusin de los resultados obtenidos y Seccin V Conclusiones muestra las conclusiones en base a los resultados obtenidos.

 

Metodologa y materiales

Las Redes Neuronales Artificiales (ANN) con aprendizaje no supervisado tambin conocidas como autosupervisado no requieren de influencia externa para ajustar los pesos de las conexiones entre sus neuronas. Le red no recibe ninguna informacin por parte del entorno que le indique si la respuesta generada es correcta o no a una determinada entrada[3], [4].

Estas redes encuentran las caractersticas, correlaciones o categoras que puedan establecer entre los datos de entrada. Hay varias posibilidades en la interpretacin de la salida de estas redes, que dependen de su estructura y del algoritmo de aprendizaje que utilizan. Por lo general se consideran dos tipos de algoritmo de aprendizaje no supervisado, que dan lugar a los siguientes tipos de aprendizaje[3], [5]:

         Aprendizaje Hebbiano.

         Aprendizaje competitivo y comparativo.

El aprendizaje Hebbiano es la regla base para muchas otras, esta pretende medir la familiaridad de los datos de entrada. Se basa en una suposicin simple: si dos neuronas y toman el mismo estado simultneamente (activas o inactivas) el peso de la conexin entre ambas se incrementa. Las entradas y salidas de la neurona son: o .[3]

El aprendizaje competitivo se orienta a la clustrizacin o clasificacin de los datos de entrada, como una caracterstica importante es que si un patrn Nuevo se determina que pertenece a una clase reconocida con anterioridad, entonces la inclusin de este nuevo patrn a esta clase matizar la representacin de la misma. Si el patrn de entrada se determin que no pertenece a ninguna de las clases que se tiene, entonces los pesos de la red neuronal sern ajustados para reconocer la nueva clase. Antes de realizar el entrenamiento se escogen los pesos iniciales para las diversas conexiones entre las neuronas de la red neuronal. Esto es realizado por varios criterios, por ejemplo otorgar pesos aleatorios a cada conexin, encontrndose los mismos dentro de un cierto intervalo[3], [5].

Para detener el aprendizaje es necesario establecer una condicin de detencin. Normalmente el entrenamiento se detiene cuando el clculo del error cuadrado sobre todos los ejemplos de entrenamiento ha alcanzado un mnimo o cuando para cada uno de los ejemplos dados, el error observado est por debajo de un umbral. Otra condicin de detencin del aprendizaje puede ser cuando un cierto nmero de ciclos de entrenamiento hayan sido completamente corridos[3].

Existen dos tipos de codificacin de los datos de entrada, como lo son[3]:

         Variable o atributos numricos (continuo).

         Variable o atributos simblicos (discreto).

Un atributo numrico es aquel que puede tomar cualquier valor dentro de un interval ; donde puede ser y puede ser .

La arquitectura de una red neuronal consiste en la organizacin de las neuronas de la misma, en la formacin de las capas de neuronas que estn ms cerca o no de la entrada y salida de la red. Los parmetros fundamentales de la red son: el nmero de capas, neuronas por capa, el grado de conectividad y el tipo de conexiones entre neuronas. Las redes monocapa establecen conexiones entre las neuronas que pertenecen a la nica capa que constituye la red[3], [5].

Redes multicapa son aquellas que disponen de un conjunto de neuronas agrupadas en varias capas. Normalmente todas las neuronas de una capa reciben seales de entrada desde otra capa anterior y envan seales de salida a una capa posterior, a estas conexiones se las denomina conexiones hacia adelante o feedforward[3], [5]. Existen de igual manera redes que pueden conectar la salida de las neuronas de capas posteriores a la entrada de capas anteriores, a estas capas se las denomina conexiones hacia atrs o feedback[3], [5].

Las Redes Neuronales Competitivas pertenecen a una clase de redes recurrentes y se basa en algoritmos de aprendizaje no supervisado. En el aprendizaje competitivo las neuronas de salida de una red neuronal compiten entre s para activarse, en el aprendizaje competitivo solo una neurona de salida est activa en cualquier momento. Por lo general existen tres elementos necesarios para construir una res con una regla de aprendizaje competitivo[5], [6]:

1.      Un conjunto de neuronas que tiene la misma estructura y que estn conectadas con pesos seleccionados inicialmente al azar.

2.      Un valor lmite se determina segn la fuerza de cada neurona.

3.      Un mecanismo que permite a las neuronas completar el derecho a responder a un subconjunto dado de entradas, de manera que solo una neurona salida este activa a la vez.

En la forma ms sencilla de aprendizaje competitivo una Red Neuronal Artificial tiene un sola capa de neuronas de salida, cada una de las cuales estn totalmente conectadas a los nodos de entrada. La competencia entre las neuronas de la capa de salida se implementa mediante la inhibicin lateral, un conjunto de conexiones negativas entre neuronas. El ms conocido entre este paradigma de las redes neuronales es el Mapa Autoorganizativo (SOM) de Kohonen[6].

La red de Kohonen consiste en una capa de entrada que distribuye las entradas a cada nodo en la segunda capa, llamada capa competitiva, cada nodo de esta capa acta como un nodo de salida. Cada neurona en la capa competitiva est conectada a otras neuronas en su vecindad y la retroalimentacion se restringe a las vecinas a travs dichas conexiones laterales[3], [5], [6]. Las neuronas en la capa competitiva tienen conexiones excitadoras con vecinos inmediatos y conexiones inhibitorias con neuronas ms distantes. Todas las neuronas de la capa competitiva reciben una mezcla de seales excitadoras e inhibidoras de las neuronas de la capa de entrada y otras de neuronas de la capa competitiva[6].

A medida que se presenta un patrn de entrada, algunas de las neuronas estn suficientemente activadas para producir salidas que se retroalimentan a otras neuronas en sus vecindarios[6]. El nodo con el vector de peso ms cercano al vector del patrn de entrada produce la salida ms grande. Durante el entrenamiento los pesos de entrada de la neurona ganadora y sus vecinos se ajustan para que se aparezcan mucho ms al patrn de entrada[6].

Al finalizar el entrenamiento el nodo ganador termina con su vector de peso alineado con el patrn de entrada y produce la salida ms fuerte cada vez que se presenta ese patrn particular. Los nodos en el vecindario del nodo ganador tambin tienen sus pesos modificados para establecer una representacin promedio de esa clase de patrn. Como resultado los patrones invisibles que pertenecen a esa clase tambin se clasifican correctamente. Se dice que los barrios , correspondientes a las clases de patrones posibles forman un mapa topolgico que representan los patrones[5], [6].

 

Metodologa

El conjunto de datos a realizar el clustering correspondiente se la obtuvo de la pgina web: https://archive.ics.uci.edu/ml/datasets/wine, que son datos de los resultados de un anlisis qumico de vinos cultivados en una regin en Italia derivado de tres cultivares diferentes. El anlisis determin las cantidades de trece componentes en cada uno de los tres vinos, los atributos son: alcohol, cido mlico, ceniza, alcalinidad de las cenizas, magnesio, fenoles totales, flavonoides, fenoles no flavonoides, proantoacianinas, intensidad de color, hue, OD280/OD315 de vinos diluidos y prolina; todos los atributos son continuos[2].

Para este trabajo se elimin el primer atributo ya que este mostraba la clase del vino a la que pertenece, este atributo ayud a encontrar el error del clustering que se realiz.

Los datos del conjunto de datos correspondiente fueron normalizados mediante el mtodo MIN-MAX, su frmula es la siguiente:

 

Donde:

;

;

 

Mediante el entorno de MATLAB se procedi a la lectura del conjunto de datos una vez que se han normalizado, el conjunto de datos normalizado se le asign la extensin .csv; para la lectura de este tipo de archive se utiliz la funcin proporcionada por MATLAB y guardada a la vez en una variable , luego a la variable se le asigna (transpuesta).

Cabe recalcar que el procedimiento anteriormente descrito se aplica a los dos tipos de redes creadas, y el cambio de las propiedades se lo realiza de igual forma a los dos tipos de redes. Para la creacin de una Red Neuronal de Mapa Autoorganizativo (SOM) se utiliz la funcin proporcionada por MATLAB y como tamao de red se le aplic .

Para la creacin de una Red Neuronal Competitiva se lo hizo con la funcin proporcionada por MATLAB, con un nmero de neuronas de tres.

Para los dos tipos de redes del presente trabajo se tom como numero de pocas el valor de 1000.

Para el clculo del error en cada una de las redes se aplic un bucle que cuente el nmero de coincidencias en cada uno de los datos del conjunto de datos y se verific con el nmero de clases del conjunto de datos original as obteniendo el nmero de valores clasificados de forma correcta.

Para la Red Neuronal de Mapa Autoorganizativo se realiz la combinacin de la funcin de topologa y la funcin de distancia, manteniendo las dems propiedades que estn por defecto, de la siguiente manera:

         hextop linkdist

         gridtop linkdist

         randtop-linkdist

         hextop-dist

         hextop-mandist

         gridtop-dist

         gridtop-mandist

         randtop-dist

         randtop-mandist

         por defecto en MATLAB

Adems al conjunto de datos se le retiro la ltima caracterstica perteneciente a prolina y se realiz la ejecucin con los datos que estn por defecto, esto se lo hizo con el objetivo de ver el comportamiento del error.

Para la creacin de la Red Neuronal competitiva se combinaron los datos de tasa de aprendizaje de Kohonen y la tasa de aprendizaje, de la siguiente forma:

         por defecto en MATLAB.

         0.05-0.001

         0.01-0.005

         0.01-0.002

         0.01-0.0005

         0.005-0.0005

         0.008-0.0008

         0.009-0.0009

         0.007-0.0007

Como en el caso anterior en esta red tambin se ejecut la red con sus propiedades que vienen por defecto y retirando la ltima caracterstica perteneciente a prolina, esto se lo hizo con la finalidad de ver el comportamiento del error

 

Resultados

En la creacin de la Red Neuronal de Mapa Autoorganizativo (SOM) se realizaron 10 ejecuciones con diferentes valores en la funcin de topologa de la red (TFCN) y en la funcin de distancia (DFCN), como se indica a continuacin en la Tabla 1.

 

   TABLA I
CANTIDADES RED NEURONAL AUTOORGANIZATIVA
TFCN	DFCN	%Error
hextop	linkdist	16.8539
gridtop	linkdist	17.4157
randtop	linkdist	16.8539
hextop	dist	17.4157
hextop	mandist	17.4157
gridtop	dist	16.8539
gridtop	mandist	17.4157
randtop	dist	17.4187
randtop	mandist	17.4187
defecto	defecto	10.1124
defecto(12 atributos)	defecto(12 atributos)	7.8652
Tabla de valores de la Red Neuronal de Mapa Autoorganizativo.

En la creacin de la Red Neuronal Competitiva se realizaron nueve ejecuciones con la combinacin en las propiedades de la red como lo es en: Tasa de Aprendizaje de Kohonen (KLR) y Tasa de Aprendizaje de Consciencia (CLR), se obtuvieron los datos que se muestran en la Tabla 2.

 

TABLA II
CANTIDADES RED NEURONAL COMPETITIVA
KLR	CLR	%Error
defecto	defecto	13.4831
0.05	0.001	15.7303
0.01	0.005	44.9438
0.01	0.002	30.3371
0.01	0.0005	12.3596
0.005	0.0005	12.3596
0.008	0.0008	15.7303
0.009	0.0009	11.2360
0.007	0.0007	20.2247
defecto(12 atributos)	defecto(12 atributos)	24.7191
Tabla de valores de la Red Neuronal Competitiva.

 

Discusin

En el presente trabajo en el que se realiz el clustring de un conjunto de datos de trece caractersticas con tres distintas clases de vino, mediante una Red Neuronal de Mapa Autoorganizativo y una Red Neuronal Competitiva.

Para este caso en particular se obtuvieron errores menores al 18% en la utilizacin de una Red Neuronal de Mapa Autoorganizativo con la variacin de sus propiedades en la Funcin de Topologa de la red y en la Funcin de Vecindad que tiene dicha red.

Mientras tanto en el uso de una Red Neuronal Competitiva se obtuvieron cantidades altas de error en algunos casos sobrepasan el 30%, para este caso que se ha presentado con la variacin en la Tasa de Aprendizaje de Kohonen y en la Tasa de Aprendizaje de Consciencia.

Tomando en cuenta las ejecuciones ltimas a cada red correspondiente en las que solo se tomaron doce atributos en la Red Neuronal de Mapa Autoorganizativo (SOM) se tiene un error menor al 10%, por otra parte en la Red Neuronal Competitiva su error no es signifcativo.

 

Conclusiones

Utilizar una Red Neuronal de Mapa Autoorganizativo con sus propiedades que tiene por defecto, para el conjunto de datos mencionado tiene un error de 10.1124% por lo que es una seal significativamente alta de una clasificacin correcta realizada.

Para este caso es mucho mejor utilizar en el conjunto de datos solo doce caractersticas de las trece ya que asi su error es del 7.8652%.

La Red Neuronal Competitiva en su menor porcentaje de error es de 11.2360% esto se presenta cuando la Tasa de Aprendizaje de Kohonen es 0.009 y la Tasa de Aprendizaje de Consciencia es 0.0009.

 

Referencias

[1] Machine Learning: Qu es y para qu sirve el Clustering - Kueski.com. [Online]. Available: https://kueski.com/blog/tecnologia/machine-learning-que-es-clustering/. [Accessed: 14-Dec-2018].

[2] UCI Machine Learning Repository: Wine Data Set. [Online]. Available: https://archive.ics.uci.edu/ml/datasets/wine. [Accessed: 14-Dec-2018].

[3] C. Alberto Ruiz Marta Susana Basualdo Autor and D. Jorge Matich, Ctedra: Informtica Aplicada a la Ingeniera de Procesos-Orientacin I Redes Neuronales: Conceptos Bsicos y Aplicaciones.

[4] 6 COMPETITIVE NETWORKS AND COMPETITIVE LEARNING.

[5] L. B. Neto, Aprendizado no supervisionado.

[6] T. Kohonen and T. Honkela, Kohonen network, Scholarpedia, vol. 2, no. 1, p. 1568, 2007.

 

2022 por los autores. Este artculo es de acceso abierto y distribuido segn los trminos y condiciones de la licencia Creative Commons Atribucin-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0)

(https://creativecommons.org/licenses/by-nc-sa/4.0/).

Enlaces de Referencia

  • Por el momento, no existen enlaces de referencia
';





Polo del Conocimiento              

Revista Científico-Académica Multidisciplinaria

ISSN: 2550-682X

Casa Editora del Polo                                                 

Manta - Ecuador       

Dirección: Ciudadela El Palmar, II Etapa,  Manta - Manabí - Ecuador.

Código Postal: 130801

Teléfonos: 056051775/0991871420

Email: polodelconocimientorevista@gmail.com / director@polodelconocimiento.com

URL: https://www.polodelconocimiento.com/