Evaluacin del estado de somnolencia a travs de la ecuacin de relacin de aspecto del ojo (EAR) mediante un algoritmo adaptativo implementado en telfonos inteligentes

 

Evaluation of sleepiness state through the eye aspect ratio equation (EAR) using an adaptive algorithm implemented on smartphones

 

Avaliao do estado de sonolncia atravs da equao da proporo dos olhos (EAR) utilizando um algoritmo adaptativo implementado em smartphones

Mateo Granja I
jmgranja1@espe.edu.ec 
https://orcid.org/0009-0004-3536-3159

,Daniel Ynez II
dayanez8@espe.edu.ec 
https://orcid.org/0000-0002-5425-8918
Javier Montaluisa III
fjmontaluisa@espe.edu.ec 
https://orcid.org/0000-0002-9816-1990

,Patricio Navas IV
mpnavas@espe.edu.ec
https://orcid.org/0000-0001-5862-9475
 

 

 

 

 

 

 

 

 

 

 


Correspondencia: jmgranja1@espe.edu.ec

 

Ciencias Tcnicas y Aplicadas

Artculo de Investigacin

 

 

* Recibido: 08 de diciembre de 2023 *Aceptado: 11 de enero de 2024 * Publicado: 29 de febrero de 2024

 

        I.            Universidad de las Fuerzas Armadas ESPE, Sangolqu, Ecuador.

      II.            Universidad de las Fuerzas Armadas ESPE, Sangolqu, Ecuador.

   III.            Universidad de las Fuerzas Armadas ESPE, Sangolqu, Ecuador.

   IV.            Universidad de las Fuerzas Armadas ESPE, Sangolqu, Ecuador.

 


Resumen

Cuando se pretende evaluar la somnolencia mediante el uso de la cmara de un telfono inteligente, uno de los principales inconvenientes que se presentan es la rapidez del parpadeo esto hace que la deteccin automtica sea difcil. Un estudio reciente propone una tcnica para identificar somnolencia a travs de un algoritmo de visin artificial que puede identificar la somnolencia en tiempo real mediante la cmara frontal de un telfono inteligente. La tcnica consiste en determinar la posicin de los puntos de referencia faciales en cada fotograma, extraer la distancia vertical entre los prpados y calcular un nico valor escalar conocido como relacin de aspecto del ojo (EAR). El objetivo de esta investigacin es determinar qu valor del umbral EAR es un indicador confiable y si un algoritmo adaptativo implementado en telfonos inteligentes es una herramienta til para evaluar la somnolencia. Los resultados de las pruebas experimentales indican que un umbral EAR ms alto disminuye la precisin y que 0.25 es el umbral ptimo en esta investigacin.

Palabras clave: ojo; parpadeo; procesamiento de imgenes; somnolencia; telfono inteligente.

 

Abstract

When attempting to evaluate drowsiness using a smartphone camera, one of the main drawbacks that arise is the rapidity of blinking, which makes automatic detection difficult. A recent study proposes a technique to identify sleepiness through a computer vision algorithm that can identify sleepiness in real time using the front camera of a smartphone. The technique involves determining the position of facial landmarks in each frame, extracting the vertical distance between the eyelids, and calculating a single scalar value known as the eye aspect ratio (EAR). The goal of this research is to determine which EAR threshold value is a reliable indicator and whether an adaptive algorithm implemented on smartphones is a useful tool for assessing sleepiness. The experimental test results indicate that a higher EAR threshold decreases the accuracy and that 0.25 is the optimal threshold in this research.

Keywords: eye; flicker; image processing; drowsiness; smartphone.

 

Resumo

Ao tentar avaliar a sonolncia por meio da cmera de um smartphone, uma das principais desvantagens que surge a rapidez do piscar, o que dificulta a deteco automtica. Um estudo recente prope uma tcnica para identificar a sonolncia por meio de um algoritmo de viso computacional que consegue identificar a sonolncia em tempo real usando a cmera frontal de um smartphone. A tcnica envolve determinar a posio dos pontos de referncia faciais em cada quadro, extrair a distncia vertical entre as plpebras e calcular um nico valor escalar conhecido como relao de aspecto do olho (EAR). O objetivo desta pesquisa determinar qual valor do limiar EAR um indicador confivel e se um algoritmo adaptativo implementado em smartphones uma ferramenta til para avaliar a sonolncia. Os resultados dos testes experimentais indicam que um limite EAR mais alto diminui a preciso e que 0,25 o limite ideal nesta pesquisa.

Palavras-chave: olho; cintilao; processamento de imagem; sonolncia; telefone inteligente.

 

Introduccin

Segn Rosales Mayor y Rey De Castro Mujica (2010), en el artculo "Somnolencia: Qu es, qu la causa y cmo se mide", la evaluacin del estado de somnolencia es de vital importancia en numerosos mbitos, como la seguridad vial, la medicina del sueo y la salud en general. Detectar y prevenir la somnolencia excesiva puede tener un impacto significativo en la prevencin de accidentes y la mejora de la calidad de vida de las personas. En este sentido, el avance de la tecnologa ha permitido el desarrollo de mtodos no invasivos y de bajo costo para evaluar el estado de somnolencia. Uno de estos enfoques prometedores es la utilizacin de la ecuacin de relacin de aspecto del ojo (EAR, por sus siglas en ingls) a travs de un algoritmo adaptativo implementado en telfonos inteligentes. La ecuacin de relacin de aspecto del ojo se basa en el anlisis de las caractersticas del ojo, como el tamao y la forma de la pupila, para determinar el grado de somnolencia de una persona (Granda, 2021). La pupila es una parte clave del sistema visual que se modifica en funcin del estado de alerta y la somnolencia. En estudios anteriores, se ha demostrado que la relacin de aspecto de la pupila puede ser un indicador confiable de la somnolencia. La implementacin de esta ecuacin en telfonos inteligentes ofrece una serie de ventajas significativas. En primer lugar, los telfonos inteligentes son dispositivos ampliamente disponibles y utilizados en la actualidad, lo que facilita su adopcin y aplicacin generalizada. Adems, hay dispositivos que cuentan con cmaras de alta resolucin y potentes capacidades de procesamiento, lo que permite la captura precisa de imgenes del ojo y el clculo eficiente de la relacin de aspecto. En este artculo, presentamos un algoritmo adaptativo para la evaluacin del estado de somnolencia a travs de la ecuacin de relacin de aspecto del ojo implementndolo en telfonos inteligentes. El algoritmo utiliza tcnicas de aprendizaje automtico y procesamiento de imgenes para detectar y analizar las caractersticas oculares relevantes. Posteriormente, se lleva a cabo una validacin experimental del algoritmo, as como una evaluacin de la precisin de la ecuacin EAR, utilizando un grupo de participantes. Los resultados obtenidos fueron comparados y se estableci el umbral ptimo para la evaluacin del estado de somnolencia.

Recapitulando, el presente estudio tiene como objetivo desarrollar y evaluar un algoritmo adaptativo basado en la ecuacin de relacin de aspecto del ojo implementado en telfonos inteligentes para la evaluacin del estado de somnolencia. Se espera que los resultados de esta investigacin contribuyan al avance de las tecnologas no invasivas de evaluacin de la somnolencia y tengan un impacto significativo en la seguridad y la salud de las personas.

 

Herramientas y mtodos

Herramientas Software

Las herramientas software que han permitido el desarrollar el aplicativo son los siguientes:

Java: Es un lenguaje de programacin de alto nivel y orientado a objetos, que permite desarrollar aplicaciones mviles. Es uno de los lenguajes de programacin ms populares de la industria.

Android Studio: Es una herramienta desarrollada por Google, ampliamente utilizada para el desarrollo de Software en diferentes lenguajes.

Google Vision: Es una API desarrollada por Google que permite integrar funcionalidades de Machine Learning en aplicaciones desarrolladas en Java o Kotlin.

SQLite: Es un motor de base de datos que se integra con Java para la persistencia de los mismos

 

Planteamiento del sistema

El sistema ser implementado en un dispositivo mvil, por lo cual la entrada de imagen ser la cmara frontal. Para el desarrollo del algoritmo se ha realizado una divisin por etapas, las cuales se pueden apreciar en la Fig. 1.

Fig. 1: Etapas del sistema.

 

Reconocimiento facial: En esta etapa se busca reducir los tiempos de procesamiento y mejorar la eficacia del algoritmo. Esto se logra mediante una deteccin preliminar del rostro en la imagen capturada, con el propsito de establecer el punto de inicio del algoritmo y, por ende, realizar un anlisis ms exhaustivo de la imagen. Adems, permite extraer un rea de inters de la imagen, lo que acorta los tiempos de procesamiento y garantiza la existencia de una regin ocular, mejorando as la eficiencia de la aplicacin.

Reconocimiento de ojos: En esta etapa se logra ubicar los ojos en el rostro, una vez que se ha delimitado el rostro en la etapa previa (reconocimiento facial), es ms sencillo aproximar el reconocimiento de ojos usando el mtodo dentro de una zona delimitada.

Deteccin de parpadeo: Esta etapa es la ms crtica debido a que evaluar si el individuo presenta sus ojos abiertos o cerrados, tambin lo realiza con ayuda de la etapa previa, el reconocimiento de ojos, en la cual ya est delimitada la zona a evaluar por lo que se busca determinar si los ojos estn abiertos o cerrados.

Deteccin de somnolencia: Esta etapa analiza, mediante la deteccin de parpadeo, el tiempo que la persona mantiene sus ojos cerrados, en la etapa previa se determina cundo estn abiertos o cerrados, en esta se evala por cunto tiempo los mantiene cerrados para establecer que el individuo tiene somnolencia.

 

Mtodos de deteccin

A continuacin, en la Fig. 2. se presentan los mtodos de deteccin facial, de ojos, de parpadeo y de somnolencia ms relevantes:

 

Fig. 2: Mtodos de deteccin.

 

Reconocimiento Facial

Eigenfaces: Es un algoritmo utilizado en el reconocimiento facial que utiliza un conjunto de imgenes de entrenamiento para generar una representacin compacta de las caras. Estas representaciones, llamadas eigenfaces, capturan las caractersticas ms distintivas de las caras y se utilizan para comparar y reconocer caras en nuevas imgenes. (Calli, 2015)

Viola Jones: Es un algoritmo popular utilizado para la deteccin rpida y precisa de objetos en imgenes. Es conocido especialmente por su eficacia en la deteccin de rostros en tiempo real, utilizando caractersticas llamadas "cascadas de caractersticas" y un clasificador basado en aprendizaje automtico. (Hernndez, Cabrera & Sanchez, 2012)

LBP (Local Binary Patterns): Es un descriptor de caractersticas utilizado en el anlisis de imgenes para representar texturas y patrones locales. Se basa en la comparacin de pxeles vecinos en una imagen y su relacin binaria para codificar informacin sobre texturas y formas locales. (Bernal, 2018)

CNN (Convolutional Neural Network): Es una arquitectura de red neuronal profunda diseada especficamente para el procesamiento de imgenes. Las CNN utilizan capas de convolucin para extraer caractersticas relevantes de una imagen y aprenden automticamente patrones y caractersticas a diferentes niveles de abstraccin. (Wu, Hassner, Kim, Medioni & Natarajan, 2017).

 

 

Reconocimiento de ojos

Filtrado de color: El filtrado de color es una tcnica empleada para seleccionar o resaltar objetos o regiones en una imagen, utilizando como base su informacin cromtica. Esta tcnica es comnmente utilizada en aplicaciones de visin por computadora para segmentar y extraer informacin especfica de una imagen en funcin de sus componentes de color.

Deteccin de bordes: La deteccin de bordes es un proceso utilizado para identificar los lmites o transiciones abruptas entre diferentes regiones en una imagen. Los bordes contienen informacin crucial sobre la estructura y los contornos de los objetos presentes en la imagen, por lo que su deteccin resulta fundamental en numerosas aplicaciones de procesamiento de imgenes.

 

Reconocimiento de parpadeos

EAR: Es una mtrica utilizada en el anlisis de ojos para cuantificar y detectar cambios en la apertura de los ojos. Se basa en la relacin geomtrica entre los puntos clave de los ojos y puede ser utilizado en aplicaciones como el reconocimiento de parpadeo o la deteccin de somnolencia.

Seguimiento de puntos de referencia: El seguimiento y localizacin de puntos es una tcnica empleada para rastrear y ubicar puntos especficos en una secuencia de imgenes. En el contexto del reconocimiento facial, estos puntos de referencia pueden ser caractersticas como los ojos, la nariz, entre otros.

 

Reconocimiento de somnolencia

PERCLOS (Percentage of Eye Closure): Es una mtrica utilizada en la deteccin de somnolencia para medir el porcentaje de cierre de los ojos en una secuencia de imgenes. El PERCLOS se utiliza como indicador de somnolencia y puede ser utilizado para alertar o prevenir situaciones de riesgo, como la conduccin somnolienta.

Una vez que se han descrito las etapas y sus potenciales mtodos de implementacin es hora de determinar cul de las siguientes se conviene ser desarrollada, por lo que a priori se realiz la combinacin Fig. 3. de cada elemento perteneciente a cada grupo de deteccin, los resultados son los siguientes:

Fig. 3: Combinacin de cada metodologa de evaluacin.

 

-                     Tomando en cuenta las tecnologas existentes para el desarrollo en dispositivos mviles es importante seleccionar una que permita implementar alguna de las combinaciones encontradas. Una de ellas es Google Vision API la cual en su documentacin detalla que permite integrar el reconocimiento facial y de ojos mediante una red neuronal Convolucional (Fig. 4.) y el uso de deteccin de bordes en la parte de reconocimiento de ojos, por lo que quedaran dos etapas a implementar en el desarrollo, el reconocimiento de la apertura de los ojos y determinar si el individuo est o no con somnolencia.

Fig. 4: Caractersticas de Google Vision API.

 

Esta seleccin nos limita a determinar si utilizar EAR o el seguimiento de puntos de referencia para determinar el parpadeo. Esta seleccin se explica dentro del diseo del apartado 2.4.1 diseo del algoritmo

 

Implementacin

A continuacin, se muestra un esquema general de implementacin Fig. 5. que marca el resultado a obtener en cada etapa del algoritmo.

 

 

 

Fig. 5: Etapas de implementacin

 

Diseo del algoritmo

De acuerdo a la revisin de aplicativos similares implementados en ordenadores, es recomendable utilizar el EAR debido a su rpida implementacin y validacin (Patel,2018), por lo que la combinacin a desarrollar ser mostrada en la Fig. 6.

 

Fig.6: Diseo del Algoritmo

 

Red Neuronal Convolucional

Las redes neuronales convolucionales (CNN) han demostrado ser muy efectivas para detectar rostros en imgenes (Li, Z., et al. 2021). Para implementarlas es necesario seguir un conjunto de pasos recomendados:

Conjunto de datos: Primero, se necesita un conjunto de datos con imgenes de rostros y sus correspondientes ubicaciones o cajas delimitadoras (bounding boxes) que indiquen la posicin y tamao de los rostros en cada imagen (Deteccin de la cara, 2021). Este conjunto de datos se utilizar para entrenar la red neuronal.

Arquitectura de la red: La arquitectura de la CNN para deteccin de rostros puede variar, pero usualmente suelen componerse de capas convolucionales para extraer caractersticas y capas de deteccin para identificar y localizar los rostros (Saquicela et al., 2022).

Extraccin de caractersticas: Las primeras capas convolucionales de la red se encargan de extraer caractersticas relevantes de la imagen, como bordes, texturas y patrones faciales. Estas caractersticas se obtienen mediante la aplicacin de filtros convolucionales, los cuales se van refinando a medida que la red se profundiza.

Capas de deteccin: Despus de la etapa de extraccin de caractersticas, se utilizan capas especializadas para detectar y localizar los rostros en la imagen. Una de las tcnicas comunes para la deteccin de objetos es la utilizacin de capas de convolucin en cascada.

Aprendizaje supervisado: Durante el entrenamiento, la red neuronal ajusta los pesos de sus conexiones para minimizar la diferencia entre las ubicaciones de los rostros detectados y las ubicaciones reales de los rostros proporcionadas en el conjunto de datos etiquetado. Esto se realiza mediante el uso de algoritmos de optimizacin, como el descenso de gradiente estocstico, y se basa en la retro propagacin del error a lo largo de la red.

Evaluacin y prediccin: Una vez entrenada, la red neuronal se puede utilizar para detectar rostros en nuevas imgenes. La red examina la imagen de entrada utilizando ventanas deslizantes de diferentes tamaos y realiza predicciones sobre la presencia y ubicacin de rostros en cada ventana. Posteriormente, se aplican tcnicas de post-procesamiento para filtrar y refinar las detecciones, como la eliminacin de detecciones superpuestas o la utilizacin de algoritmos de ajuste preciso.

Es importante destacar que en esta investigacin no se abord el proceso de implementacin de una Red Neuronal Convolucional (CNN), ya que nuestro objetivo se centra en la evaluacin del estado de somnolencia mediante el uso de la ecuacin EAR. No obstante, resulta relevante mencionar que el proceso descrito anteriormente es utilizado en la deteccin de rostros, lo cual puede resultar til para investigaciones futuras.

 

Fig. 7: Red Neuronal Convolucional con varias capas. (Buigas, 2017)

 

Deteccin de Bordes

Cuando la capa de reconocimiento facial se encuentra completada el modelo ser capaz de evaluar el rostro de la persona y con ayuda de un lienzo (canvas), dibujar los puntos de inters (Wu, Y., Hassner. et al., 2017) del individuo Fig. 8 en tiempo real. En esta etapa es importante reconocer los ojos y delimitarlos con los puntos de inters, estos puntos se usarn posteriormente en el anlisis de la apertura.

Fig. 8: Deteccin de borde de rasgos faciales

 

La API de Google Vision proporciona la numeracin de los puntos basndose en el modelo Haarcascade, en su documentacin podemos encontrar el detalle de cada rasgo facial Tabla 1.

 

Tabla 1: Detalle de rasgos faciales por rango. Adaptado de (Conceptos de deteccin de rostro | ML Kit | Google for Developers, s. f.).

 

RANGO

CANTIDAD

CAPAS

TOTAL PUNTOS

ROSTRO

0-35

1

1

36

CEJAS

0-4

2

2

20

NARIZ

0-1

1

1

2

BOCA

0-8

1

4

36

OJOS

0-15

2

1

32

 

 

 

 

126

 

Eye Aspect Ratio

El "Eye Aspect Ratio" (EAR) es una mtrica utilizada en el campo de la visin por computadora y el reconocimiento facial para medir la apertura de los ojos en una imagen o video.

El EAR se basa en la posicin de los puntos de referencia de los ojos, como las esquinas interna y externa de los ojos, y la parte superior e inferior del prpado. Fig 9.

 

Fig. 9: Distancia entre los puntos de inters que delimitan el ojo

 

Al calcular la relacin entre las distancias verticales y horizontales entre estos puntos de referencia, se puede determinar si los ojos estn abiertos, cerrados o parcialmente cerrados. Su implementacin es sencilla debido a que la Red Neuronal arroja en su deteccin un vector de reconocimiento con los puntos de inters de cada zona, vase Tabla 1, posterior a esto se debe realizar una operacin matemtica Ecuacin 1 durante cada frame, los valores encontrados se deben almacenar en otro vector para ser analizados en la siguiente etapa. Estos valores pueden oscilar entre 0 y 1, lo cual significa que los ojos estn cerrados o abiertos respectivamente.

Ecuacin 1: Relacin de Aspecto del Ojo (EAR)

 

Perclos

El PERCLOS (Percent of Time Eyelids are Closed) es un ndice utilizado para medir el estado de somnolencia basado en el porcentaje de tiempo en el que los ojos estn cerrados durante un intervalo determinado. Se utiliza principalmente para evaluar la somnolencia de conductores, operadores de maquinaria u otras personas en situaciones en las que la somnolencia puede representar un riesgo. (Garca, 2011)

Para calcular el ndice PERCLOS, se utiliza la siguiente frmula:

Ecuacin 2: ndice Perclos

 

En este clculo, se capturan "n" fotogramas durante un perodo de tiempo especfico utilizando la cmara frontal del dispositivo mvil. Se cuenta el nmero de fotogramas en los que los ojos estn cerrados (EAR) y se divide por el nmero total de fotogramas. Luego, se multiplica por 100 para obtener el porcentaje de tiempo en el que los ojos estn cerrados, lo cual representa el ndice PERCLOS.

La Fig. 10 muestra la implementacin final del algoritmo en el lenguaje de programacin Java.

 

Fig. 10: Muestra de implementacin del algoritmo en JAVA

 

Pruebas

Para las pruebas de rigor se ha decidido testear tanto el reconocimiento de parpadeo en primera instancia como paso previo al reconocimiento de la somnolencia y la evaluacin del parpadeo en un rango de tiempo, esto debido a que el dato de entrada para evaluar la somnolencia es el nmero de parpadeos en un lapso de tiempo determinado.

 

Parpadeo

En la evaluacin del parpadeo interviene el umbral EAR que determina si la persona est con el ojo abierto o cerrado. En estas pruebas se iniciar con un valor EAR de 0.3 el cual se ajustar de acuerdo a los resultados obtenidos. La prueba consiste en colocarse frente al dispositivo mvil y parpadear, contar el nmero total de parpadeos y comparar con el nmero de reconocimientos que ha realizado el algoritmo. Para mayor precisin se realizarn 3 iteraciones de 5 evaluaciones cada una. Posterior se obtendr el porcentaje de aciertos.

 

Iteraciones

 

Tabla 2: Iteraciones de parpadeo evaluado por el aplicativo

EAR = 0.3

i1

 

 

EAR = 0.35

i2

 

 

EAR = 0.25

i3

 

Evaluacin 1

 

 

Evaluacin 1

 

 

Evaluacin 1

 

Total parpadeos

10

 

 

Total parpadeos

10

 

 

Total parpadeos

10

 

Reconocidos

7

 

 

Reconocidos

5

 

 

Reconocidos

9

 

Sin Reconocer

1

 

 

Sin Reconocer

5

 

 

Sin Reconocer

1

 

Evaluacin 2

 

 

Evaluacin 2

 

 

Evaluacin 2

 

Total parpadeos

10

 

 

Total parpadeos

10

 

 

Total parpadeos

10

 

Reconocidos

8

 

 

Reconocidos

4

 

 

Reconocidos

10

 

Sin Reconocer

2

 

 

Sin Reconocer

6

 

 

Sin Reconocer

0

 

Evaluacin 3

 

 

Evaluacin 3

 

 

Evaluacin 3

 

Total parpadeos

10

 

 

Total parpadeos

10

 

 

Total parpadeos

10

 

Reconocidos

6

 

 

Reconocidos

5

 

 

Reconocidos

8

 

Sin Reconocer

4

 

 

Sin Reconocer

5

 

 

Sin Reconocer

2

 

 

Evaluacin 4

 

 

Evaluacin 4

 

 

Evaluacin 4

 

Total parpadeos

10

 

 

Total parpadeos

10

 

 

Total parpadeos

10

 

Evaluacin 4

 

 

Evaluacin 4

 

 

Evaluacin 4

 

Reconocidos

7

 

 

Reconocidos

6

 

 

Reconocidos

9

 

Sin Reconocer

3

 

 

Sin Reconocer

4

 

 

Sin Reconocer

1

 

Evaluacin 5

 

 

Evaluacin 5

 

 

Evaluacin 5

 

Total parpadeos

10

 

 

Total parpadeos

10

 

 

Total parpadeos

10

 

Reconocidos

8

 

 

Reconocidos

7

 

 

Reconocidos

10

 

Sin Reconocer

2

 

 

Sin Reconocer

3

 

 

Sin Reconocer

0

 

 

 

Vase el anlisis de resultados en la seccin RESULTADOS

 

Evaluacin de somnolencia

Una vez que se ha obtenido un valor EAR confiable se contina al diseo y evaluacin de la prueba de evaluacin de somnolencia. Teniendo en cuenta que el ndice PERCLOS se obtiene mediante una operacin matemtica, Ecuacin 2, es necesario entonces evaluar en cada fotograma el estado del individuo a lo largo de un tiempo determinado. Como la evaluacin de la somnolencia debe ser rpida y certera, se ha decidido empezar la evaluacin con un tiempo de 1 segundo, los fotogramas a analizar dependen del equipo que proporciona la imagen de entrada.

Se realizaron 2 evaluaciones con cada dispositivo, la prueba consiste en mantener los ojos cerrados por el periodo de tiempo indicado y obtener los valores EAR promedio de cada fps.

 

Iteraciones

Para las siguientes pruebas se utilizarn 2 telfonos inteligentes por lo que a continuacin se detallan las especificaciones tcnicas relevantes para esta investigacin.

 

Tabla 3: Especificaciones tcnicas

Caractersticas relevantes para la investigacin

Equipo A

Equipo B

Modelo

Samsung Galaxy A23

Samsung Galaxy A31

Cmara frontal

8 MP, f/2.2, (wide) - 1080p 30fps

20 MP, f/2.2, (wide) - 1080p 60fps

Procesador

Qualcomm SM6375 Snapdragon 695 5G (6 nm)

Mediatek MT6768 Helio P65 (12nm)

CPU

Octa-core (2x2.2 GHz Kryo 660 Gold & 6x1.7 GHz Kryo 660 Silver)

Octa-core (2x2.0 GHz Cortex-A75 & 6x1.7 GHz Cortex-A55)

GPU

Adreno 619

Mali-G52 MC2

S.O.

Android 12

Android 10

 

Las siguientes pruebas consisten en que el individuo debe mirar fijamente a la cmara frontal del dispositivo para luego cerrar los ojos por un periodo de tiempo determinado. Fig. 11.

 

Fig. 11: Cerrar los ojos durante un intervalo de tiempo

 

Tabla 4: Pruebas de evaluacin de somnolencia

ITERACIN

1

 

ITERACIN

1

EQUIPO

A

 

EQUIPO

B

TIEMPO (T)

1s

 

TIEMPO (T)

1s

FPS

30

 

FPS

60

MUESTRAS

30

 

MUESTRAS

60

UMBRAL EAR

0,25

 

EMBRAL EAR

0,25

PERCLOS

91.41

 

PERCLOS

96.67

RESULTADO

SOMNOLIENTO

 

RESULTADO

SOMNOLIENTO

 

ITERACIN

2

 

ITERACIN

2

EQUIPO

A

 

EQUIPO

A

TIEMPO (T)

3s

 

TIEMPO (T)

3s

FPS

30

 

FPS

60

MUESTRAS

90

 

MUESTRAS

180

UMBRAL EAR

0.25

 

UMBRAL EAR

0,25

PERCLOS

88.89

 

PERCLOS

93.89

RESULTADO

SOMNOLIENTO

 

RESULTADO

SOMNOLIENTO

 

 

Resultados

Se presenta la demostracin de la ejecucin del proceso que se lleva a cabo gracias a la operacin matemtica EAR, propuesta a travs del anlisis emprico (vase seccin 2.5.1) cuando el valor obtenido por EAR es menor a 0.25 podemos afirmar que existe somnolencia) y mayor a 0.25 el estado del individuo es de vigilia, el anlisis se lo puede ver en la Tabla 5.

 

Tabla 5: Resultados de iteraciones

ITERACIN 1

 

ITERACIN 2

 

ITERACIN 3

Total

50

 

Total

50

 

Total

50

Aciertos

38

0,76

 

Aciertos

27

0,54

 

Aciertos

46

0,92

Errores

12

0,24

 

Errores

23

0,46

 

Errores

4

0,08

UMBRAL EAR

0,30

 

UMBRAL EAR

0,35

 

UMBRAL EAR

0,25

 

En la figura 12 (a) se muestra la ejecucin de identificacin de ojos abiertos y en la figura 12 (b) se muestra la ejecucin de identificacin de ojos cerrados. En las mismas se puede observar la evaluacin de la somnolencia de una persona mediante la cmara frontal de un telfono mvil, la figura 12 (a) muestra una persona normal con los ojos abiertos (sin signos de somnolencia), y la figura 12 (b) muestra un estado de somnolencia identificado despus que el sujeto permaneciera con los ojos cerrados (3 segundos), activando un mensaje de alerta.

 

Fig. 12 (a): Identificacin mediante EAR Fig. 12 (b): Identificacin mediante EAR

(ojos abiertos). (ojos cerrados).

 

El sistema recopila datos en tiempo real basado en los puntos de referencia identificados en los ojos. Luego determina la somnolencia en funcin de los valores EAR calculados a partir de las imgenes capturadas del usuario. La tabla 6 muestra el valor medio calculado de EAR, obtenido de las 6 pruebas realizadas. El valor promedio es de 0.60 y 0.10 cuando los ojos se encuentran abiertos y cerrados respectivamente. A partir de este experimento, puede observarse que no hay un valor medio de cero cuando los ojos se encuentran cerrados. No obstante, se puede deducir que si el valor disminuye repentinamente y permanece menor a 0.25 de manera consecutiva, el sujeto se encuentra en estado de somnolencia.

 

Tabla 6: Valor promedio del EAR mientras los ojos estn abiertos y cerrados.

Prueba

EAR (ojos abiertos)

EAR (ojos cerrados)

1

2

3

4

5

6

0,70

0,72

0,53

0,39

0,69

0,54

0,11

0,09

0,12

0,05

0,10

0,11

Promedio

0,60

0,10

 

Segn Patel et al. (2018), cuando el valor del EAR es menor a 0.25 se puede determinar que la persona se encuentra en estado de somnolencia. Este valor es determinado de acuerdo al movimiento de los ojos que cambia de abierto a cerrado; la Fig. 13 representa el valor resultante del EAR, calculado de la identificacin del ojo humano a lo largo del tiempo, las lneas continuas identifican las tres clasificaciones posibles. El comportamiento ocular esperado incluye ojos abiertos (verde): aqu, el EAR es mayor y presenta una gran variacin. Los parpadeos (amarillo): el EAR disminuye rpidamente cuando se cierran los ojos y vuelve aumentar de la misma manera al abrirlos. Cuando los ojos permanecen cerrados (azul): el valor del EAR es menor pero el flujo es constante y no presenta una gran variacin.

Fig. 13: Comportamiento del valor EAR en tiempo real para las 3 clasificaciones posibles

 

Discusin

En la presente investigacin se evalu el mtodo Eye Aspect Ratio (EAR) para mejorar la precisin en la evaluacin de la somnolencia a travs de un algoritmo adaptativo implementado en telfonos inteligentes. Los resultados obtenidos en base a las pruebas de ejecucin realizadas demuestran que el procesamiento de las imgenes capturadas en tiempo real de la persona (para realizar el clculo del valor EAR) funcionan de forma fluida y determinan de manera correcta el estado que se encuentran los ojos de la persona ya sea abiertos o cerrados, esto permite determinar con certeza cuando una persona se encuentra somnolienta, adems que el algoritmo adaptativo implementado funciona correctamente proporcionando una mayor precisin al clculo, este se adapta a los distintos tipos de rostros reajustando su modelo para detectar los puntos referenciales localizados en los ojos. En otros estudios realizados como el de Zhang et al. (2018), se concluy que el mtodo EAR tiene un alto porcentaje de precisin. El estudio demostr que el mtodo, es uno de los ms precisos para detectar la somnolencia.

En resumen, los resultados indican que el mtodo propuesto puede detectar eficazmente la somnolencia en una persona utilizando la cmara frontal de un telfono mvil. Adems, los valores de EAR proporcionan informacin til para determinar el estado de somnolencia en tiempo real, esto es til para prevenir accidentes y situaciones de riesgo. Sin embargo, algunos de estos indicadores pueden variar debido a la iluminacin del lugar o el tipo de resolucin de la cmara del celular, bajo esta premisa es necesario en futuras investigaciones determinar la precisin y la confiabilidad del mtodo en diferentes situaciones y en una poblacin ms amplia.

 

Conclusiones

Al usar el algoritmo propuesto, se pudo rastrear puntos especficos en el rostro humano permitiendo identificar los puntos de referencia en los ojos de la persona, el algoritmo es capaz de adaptarse a los distintos tipos de rostros y a las formas de ojos que existen; a partir de la identificacin y localizacin de estos puntos oculares se obtuvo el valor escalar del EAR que fue mediante la evaluacin del uso de su ecuacin respectiva en un periodo de tiempo, esto permiti determinar el porcentaje de abertura del ojo humano a lo largo del intervalo (PERCLOS) , tambin se obtuvo que 0.25 es el umbral ptimo para determinar que un ojo se encuentra cerrado.

En base a los resultados obtenidos mediante el uso de la cmara de los dispositivos mviles de prueba, se observ tambin que el flujo de datos en tiempo real del clculo del EAR para determinar que una persona se encuentra en estado de somnolencia funciona de forma fluida, sin presentar intermitencias o prdidas de datos; cuando los ojos se encuentran abiertos el flujo cambia constantemente esto se debe a la iluminacin que presente el lugar o al tipo de resolucin de la cmara del celular, en cambio cuando el valor es menor a 0.25 y este estado se mantiene por alrededor de 3 segundos; el flujo es constante sin presentar mayor variacin debido a la gran similitud que existe entre los rasgos correspondientes al ojo humano cuando se encuentra cerrado lo que facilita la identificacin del ojo y la obtencin del valor EAR. Cuando existe un parpadeo existe una mayor variacin acercndose el valor a 0, demostrando que el tratamiento de la imagen que proporciona la cmara es verificado durante el tiempo que permanezca en uso la aplicacin. El rendimiento del algoritmo es ptimo en los distintos celulares independientemente del tamao, versin del sistema operativo o procesador de los mismos.

 

Agradecimientos

Despus de haber trabajado tanto en este proyecto es necesario expresemos nuestra gratitud al universo por permitirnos perseguir nuestros sueos, a nuestra familia por apoyarnos incondicionalmente, a nuestros amigos por ser parte de este camino y a nuestros profes que han sido grandes guas durante el aprendizaje. Una especial mencin a nuestros padres ya que todo lo que somos y seremos se lo debemos a su incansable coraje, trabajo y enseanza, son uno de los ms grandes ejemplos que tenemos.

 

Referencias

1.      Buigas, J. (2017). Gua rpida de inteligencia artificial. As funciona Deep Learning. Puentes Digitales. Recuperado en 30 de junio de 2023, de https://puentesdigitales.com/2017/11/15/guia-rapida-de-inteligencia-artificial-asi-funciona-el-deep-learning/

2.      Bernal Leyva, A. Y. (2018). ANLISIS DE MTODOS DE RECONOCIMIENTO FACIAL BAJO EL SISTEMA OPERATIVO ANDROID.

3.      Calli Olvea, J. (2015). Reconocimiento facial basado en el Algoritmo Eigenface.

4.      Conceptos de deteccin de rostro | ML Kit | Google for Developers. (s. f.). Recuperado 30 de junio de 2023, de https://developers.google.com/ml-kit/vision/face-detection/face-detection-concepts?hl=es-419

5.      Garca Daza, I (2011). Deteccin de fatiga en conductores mediante fusin de sistemas ADAS [Tesis doctoral, Universidad de Alcal Escuela Politcnica Superior]. Ebuha Biblioteca Digital Universidad de Alcal. https://ebuah.uah.es/dspace/handle/10017/16621

6.      Deteccin de la cara: Qu es y cmo funciona esto Tech. (2021). RecFaces. https://recfaces.com/es/articles/deteccion-de-la-cara-que-es-y-como-funciona-esto-tech

7.      Granda, F. A. (2021). SISTEMA DE DETECCIN DE SOMNOLENCIA A TRAVS DE VISIN ASISTIDA POR COMPUTADORA EN EL PERIODO ABRIL-SEPTIEMBRE 2021.

8.      Hernndez, Ernesto del T, Cabrera Sarmiento, Alejandro, & Snchez Solano, Santiago. (2012). Implementacin hbrida hardware software del algoritmo de deteccin de rostros de Viola-Jones sobre FPGA. Universidad, Ciencia y Tecnologa, 16(63), 114-124. Recuperado en 30 de junio de 2023, de http://ve.scielo.org/scielo.php?script=sci_arttext&pid=S1316-48212012000200005&lng=es&tlng=es

9.      Li, Z., Liu, F., Yang, W., Peng, S., & Zhou, J. (2021). A survey of convolutional neural networks: analysis, applications, and prospects. IEEE transactions on neural networks and learning systems.

10.  Patel, R., Patel, M., & Patel, J. (2018). Real Time Somnolence Detection System In OpenCV Environment for Drivers. 2018 Second International Conference on Inventive Communication and Computational Technologies (ICICCT), 407410. https://doi.org/10.1109/ICICCT.2018.8473234

11.  Rosales Mayor, E., & Rey De Castro Mujica, J. (2010). Somnolencia: Qu es, qu causa y cmo se mide. Acta mdica peruana, 27(2), 137-143.

12.  Saquicela, A., Zambrano-Asanza, S., Cajamarca, B., Chitacapa, A., Sanango, J., & Franco, J. (2022). Estimation of Rural Populations without Access to Electricity Through Satellite Images and Deep Learning.

13.  Wu, Y., Hassner, T., Kim, K., Medioni, G., & Natarajan, P. (2017). Facial landmark detection with tweaked convolutional neural networks. IEEE transactions on pattern analysis and machine intelligence, 40(12), 3067-3074.

14.  Zhang, G., Ren, H., Jiang, B., & Zhang, X. (2018). Driver drowsiness detection based on eye state analysis using infrared thermal imaging. Infrared Physics & Technology, 94, 269-276.

 

 

 

 

 

2024 por los autores. Este artculo es de acceso abierto y distribuido segn los trminos y condiciones de la licencia Creative Commons Atribucin-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0)

(https://creativecommons.org/licenses/by-nc-sa/4.0/).

Enlaces de Referencia

  • Por el momento, no existen enlaces de referencia
';





Polo del Conocimiento              

Revista Científico-Académica Multidisciplinaria

ISSN: 2550-682X

Casa Editora del Polo                                                 

Manta - Ecuador       

Dirección: Ciudadela El Palmar, II Etapa,  Manta - Manabí - Ecuador.

Código Postal: 130801

Teléfonos: 056051775/0991871420

Email: polodelconocimientorevista@gmail.com / director@polodelconocimiento.com

URL: https://www.polodelconocimiento.com/