Reconocimiento de objetos del hogar, usando redes neuronales convolucionales para personas con discapacidad visual

Jaime Israel Izquierdo-Valladarez, Juan Pablo Cuenca-Tapia

Resumen


Las personas con dificultades visuales tienen múltiples necesidades en su vida diaria. En muchas ocasiones, ellos necesitan de terceras personas para lograr ciertas actividades que requieren al momento de movilizarse. Hoy en día, múltiples soluciones tecnológicas han sido desarrolladas para ayudar a personas con deficiencia visual. El presente artículo, muestra las etapas de entrenamiento de una red neuronal convolucional (CNN) para el reconocimiento de imágenes de objetos del hogar, usando la red AlexNet y MATLAB. Para la etapa del entrenamiento se usarán 14 tipos de objetos del hogar: lavadora, televisor, sofá, sombrilla, grapadora, balón soccer, tijera, laptop, lámpara, jarro, taza, silla, cellphone y cámara. Se plantean los siguientes pasos para el entrenamiento de la red neuronal convolucional: recolección de las imágenes para entrenamiento, procesamiento de las imágenes, entrenamiento de la red neuronal en base a las imágenes y validación satisfactoria del modelo. Las imágenes son obtenidas de páginas digitales, se las organiza por su clase o nombre, para que sean utilizadas en el modelo de entrenamiento. La validación se la realiza calculando la fracción de imágenes de prueba correctamente clasificadas, con lo cual se determina la eficacia del sistema entrenado. Los resultados de la presente investigación, tienen un alcance exponencial en los sistemas autónomos dedicados con visión artificial, usando bajo recurso computacional, cuyo objetivo es demostrar que el reconocimiento de imágenes dentro del hogar aporta una ayuda valiosa a las personas con discapacidad visual.


Palabras clave


Aprendizaje de máquina; visión artificial; redes neuronales convolucionales; Alexnet; MatLab.

Texto completo:

PDF HTML XML

Referencias


Deepthi Jain, B., Thakur, S. M., & Suresh, K. V. (2018). Visual Assistance for Blind Using Image Processing. Proceedings of the 2018 IEEE International Conference on Communication and Signal Processing, ICCSP 2018, 499–503. https://doi.org/10.1109/ICCSP.2018.8524251

Esteva, A., Robicquet, A., Ramsundar, B., Kuleshov, V., DePristo, M., Chou, K., … Dean, J. (2019). A guide to deep learning in healthcare. Nature Medicine, 25(1), 24–29. https://doi.org/10.1038/s41591-018-0316-z

Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning (Adaptive Computation and Machine learning). Adaptive Computation and Machine Learning Series. https://doi.org/10.1016/B978-0-12-391420-0.09987-X

Haykin, S. (1994). Neural Networks: A Comprehensive Foundation (1st ed.). Upper Saddle River, NJ, USA: Prentice Hall PTR.

Kacorri, H., Kitani, K. M., Bigham, J. P., & Asakawa, C. (2017). People with visual impairment training personal object recognizers: Feasibility and challenges. Conference on Human Factors in Computing Systems - Proceedings, 2017-May, 5839–5849. https://doi.org/10.1145/3025453.3025899

Krizhevsky, A., Sutskever, I., & Hinton, G. (2007). ImageNet Classification with Deep ConvolutionalNeural Networks. Handbook of Approximation Algorithms and Metaheuristics, 1–1432. https://doi.org/10.1201/9781420010749

Loncomilla, P. (2016). Deep learning: Redes convolucionales. Recuperado de https://ccc. inaoep. mx/~ pgomez/deep/presentations.

Moreno, A. (2019). Autor: Álvaro Artola Moreno Tutor: José Antonio Pérez Carrasco.

Monroy, J, Ramírez, A, Alejo, R y López, E.(2017) Aspectos relevantes para mejorar el desempeño del algoritmo Backpropagation. Revista de Tecnologías de la Información 2017, 4-13: 1-11

Nayak, S. (2018). Understanding AlexNet | Learn OpenCV. Retrieved December 2, 2019, from https://www.learnopencv.com/understanding-alexnet/

Russakovsky, O., Deng, J., Su, H., Krause, J., Satheesh, S., Ma, S., … Fei-Fei, L. (2015). ImageNet Large Scale Visual Recognition Challenge. International Journal of Computer Vision, 115(3), 211–252. https://doi.org/10.1007/s11263-015-0816-y

OMS.(2018).Air-pollution-INFOGRAPHICS-English-4-1200px.jpg (1200×1200). https://doi.org/CLEAN AIR FOR HEALTH

Zhu, J., Zhang, E. & Del Rio-Tsonis, K., 2001. Eye Anatomy. e LS.




DOI: https://doi.org/10.23857/pc.v5i01.1238

Enlaces de Referencia

  • Por el momento, no existen enlaces de referencia
';





Polo del Conocimiento              

Revista Científico-Académica Multidisciplinaria

ISSN: 2550-682X

Casa Editora del Polo                                                 

Manta - Ecuador       

Dirección: Ciudadela El Palmar, II Etapa,  Manta - Manabí - Ecuador.

Código Postal: 130801

Teléfonos: 056051775/0991871420

Email: polodelconocimientorevista@gmail.com / director@polodelconocimiento.com

URL: https://www.polodelconocimiento.com/