Distribucin de Poisson en el anlisis de defunciones en menores de un ao
Poisson distribution in the analysis of deaths in children under one year of age
Distribuio de Poisson na anlise de bitos em menores de um ano
Correspondencia: veronica.arguello@ueb.edu.ec
Ciencias Matemticas
Artculo de Investigacin
* Recibido: 15 de febrero de 2023 *Aceptado: 20 de abril de 2023 * Publicado: 04 de mayo de 2023
- Magster en Matemtica Mencin Modelacin y Docencia, Universidad Estatal de Bolvar, Ecuador.
- Magster en Pedagoga de la Matemtica, Universidad Estatal de Bolvar, Ecuador.
- Magster en Direccin de Operaciones y Seguridad Industrial, Universidad Metropolitana del Ecuador, Ecuador.
- Magster en Estadstica Mencin en Gestin de la Calidad y Productividad, Universidad Estatal de Bolvar, Ecuador.
Resumen
En la Universidad hemos sido abrumados con mucha informacin dejando de lado la importancia que tiene dicha informacin en la aplicacin de los conocimientos y arremetiendo al docente en la clase, es as que invitamos en la presente investigacin a caracterizar y modelar las muertes en menores de un ao, mediante modelos lineales generalizados a travs de la distribucin de Poisson. Este estudio tuvo una investigacin descriptiva puesto que se aplic un anlisis exploratorio que permiti conocer la tasa de mortalidad y que causas de muerte son las ms influyentes, se cont con una investigacin correlacional, con el nmero de eventos en menores de un ao que va a permitir modelar los datos de conteo y se verific la medida de calidad del modelo mediante AIC. Las estimaciones de los coeficientes del modelo, se verific que todas las variables son significativas debido a que tiene el valor p menor que el nivel de significancia de 0.05. Finalmente la regresin de Poisson es la que mejor se ajusta a los datos, adems tiene un 𝑅2 de 0.858 y un AIC de 650.72, se concluye que el modelo puede utilizar datos de mortalidad infantil de menores de un ao de todo el Ecuador.
Palabras Clave: Modelo Matemtico; Modelo Lineal Generalizado; Regresin de Poisson.
Abstract
At the University we have been overwhelmed with a lot of information, leaving aside the importance of said information in the application of knowledge and attacking the teacher in the class, so we invite in the present investigation to characterize and model deaths in children under one year, using generalized linear models through the Poisson distribution. This study had a descriptive investigation since an exploratory analysis was applied that allowed to know the mortality rate and which causes of death are the most influential, there was a correlational investigation, with the number of events in children under one year of age that will allow modeling the count data and the quality measure of the model was verified through AIC. The estimates of the model coefficients, it was verified that all the variables are significant because it has a p value less than the significance level of 0.05. Finally, the Poisson regression is the one that best fits the data, it also has an 𝑅2 of 0.858 and an AIC of 650.72, it is concluded that the model can use infant mortality data for children under one year of age from all over Ecuador.
Keywords: Mathematical model; Generalized Linear Model; Poisson regression.
Resumo
Na Universidade temos ficado sobrecarregados com muitas informaes, deixando de lado a importncia dessas informaes na aplicao do conhecimento e atacando o professor na aula, por isso convidamos na presente investigao a caracterizar e modelar mortes em crianas menores de um ano , utilizando modelos lineares generalizados atravs da distribuio de Poisson. Este estudo teve uma investigao descritiva pois foi aplicada uma anlise exploratria que permitiu conhecer a taxa de mortalidade e quais causas de morte so mais influentes, houve uma investigao correlacional, com o nmero de eventos em menores de um ano que permitir a modelagem dos dados de contagem e a medida de qualidade do modelo foram verificadas por meio do AIC. Pelas estimativas dos coeficientes do modelo, verificou-se que todas as variveis so significativas porque possui um valor de p menor que o nvel de significncia de 0,05. Por fim, a regresso de Poisson a que melhor se ajusta aos dados, tambm possui um 𝑅2 de 0,858 e um AIC de 650,72, conclui-se que o modelo pode utilizar dados de mortalidade infantil de crianas menores de um ano de todo o Equador.
Palavras-chave: Modelo matemtico; Modelo Linear Generalizado; Regresso de Poisson.
Introduccin
Cada ciclo se ampla el desarrollo de modelos matemticos que conllevan a la aplicacin y manipulacin de datos a partir de la utilizacin de modelos estadsticos que permiten analizar el comportamiento de los mismos. Por lo tanto, un modelo es un proceso de abstraccin desde la realidad al sistema matemtico con el objetivo de facilitar la comprensin del suceso que se est estudiando (Calzada, 2017). Por otra parte, el objetivo de la modelizacin estadstica es, por tanto, a travs de la observacin o experimentacin, explicar el comportamiento de una o ms variables en los individuos de una poblacin en base a la diferencia entre las caractersticas asociadas al objeto de estudio. As mismo Calzada (2017) menciona que en el planteamiento de un modelo es muy importante distinguir el tipo de variable que intervienen y la clase de relaciones funcionales que se admiten para analizar la relacin entre la variable objetivo y las variables explicativas adems seala que un modelo debe pasar por las siguientes etapas: especificacin del modelo terico, estimacin de parmetros, seleccin del modelo, evaluacin del modelo e interpretacin del modelo (p.13). Los modelos lineales (GLM) amplan los modelos de regresin lineal para abarcar distribuciones de respuesta no normales como es el caso de la distribucin de Poisson (Arguello, 2022). Con respecto a la importancia que engloba la distribucin de poisson, no obstante, algunos autores como Reading y Reid (2013) han reportado que existe evidencias sobre la posibilidad de investigar sobre el desarrollo de las concepciones de los estudiantes sobre la variabilidad y distribucin. En relacin con la teora de probabilidad y estadstica la distribucin de Poisson es una distribucin de probabilidad discreta que expresa la probabilidad de un nmero de eventos, esta distribucin fue descubierta por Simon Denis Poisson, que fue conocida a partir de 1838 ( Rodriguez, 2022). Habria que decir tambin que resulta atractivo el trabajo de Ramrez et al., (2013) mencionan la enseanza de la distribucin de Poisson resulta verla como un proceso en el cual ocurren sucesos discretos en un intervalo continuo de tiempo que tiene tres lugares condicionantes esenciales primero, que la probabilidad de observar exactamente un suceso en el intervalo sea estable, segundo, que la probabilidad de observar dos o ms sucesos en el intervalo sea cero y tercero, que la ocurrencia de un suceso en cualquier intervalo sea estadsticamente independiente de la ocurrencia de un suceso en cualquier otro intervalo de igual magnitud. Hay que mencionar que la distribucin de Poisson esta estrechamente relacionada con la distribucin binomial y que juega un papel importante en la solucin de problemas (Ramrez et al.,, 2013). En relacin a lo que caracteriza a tales procesos es su dependencia del tiempo, o sea, el hecho de que ciertos eventos suceden o no (por azar) a intervalos regulares de tiempo o en un intervalo continuo de tiempo (Freund et al., 2006). Con respecto a lograr una mejor comprensin de la distribucin de Poisson, es conveniente complementar el anlisis con dos consideraciones importantes. Por una parte, la probabilidad de ocurrencia de un suceso en el intervalo es proporcional a la longitud del intervalo, lo que equivale a plantear la relacin 𝑃 = 𝜃∆𝑡, donde ∆𝑡 indica unintervalo muy pequeo y 𝜃 una constante que representa el promedio de sucesos que ocurren en el intervalo. Por otra parte, la probabilidad de que ocurra ms de un suceso en el intervalo pequeo es despreciable, lo cual se puede expresar mediante la relacin 𝑃 ≈ 0 (Ramrez et al.,, 2013).
El siguiente aspecto trata de la devianza que es una medida de la bondad de ajuste de los modelos lineales generalizados R nos da medidas de devianza, la devianza nula y la desviacin residual. La devianza nula muestra qu tan bien la variable de respuesta se predice mediante un modelo que incluye solo la interseccin (AE, 2019). Los supuestos de un modelo de Poisson corresponde a la equidispersin Rstudio cuenta con la funcin glm que permite aplicar modelos lineales generalizados especificando en el argumento family de acuerdo a la distribucin a aplicar poisson (link= log) y quasipoisson (link= log), la distribucin de Poisson tiene un ́nico parmetro a estimar, μ, la media, el cual a veces es llamado parmetro de localizacin. La principal caracterstica de esta distribucin es que la media y la varianza son iguales. Luego cuanto mayor sea la media mayor ser la varianza o variabilidad en los datos, esta propiedad en la distribucin de Poisson es llamada propiedad de equidispersion (Calzada, 2017).
Se debe agregar que un proceso de Poisson es un experimento aleatorio que consiste en observar la ocurrencia de eventos especficos sobre un soporte, tal que el proceso es estable el nmero de ocurrencias, λ es constante a largo plazo y los eventos ocurren de forma aleatoria e independiente. La distribucin de Poisson se usa para modelar el nmero de eventos que ocurren en un proceso de Poisson. Sea XP(λ), esto es, una variable aleatoria con distribucin de Poisson donde el nmero medio de eventos que ocurren en un determinado intervalo es λ (R Coder, 2020). El inters de la investigacin es caracterizar y modelar las muertes en menores de un ao, mediante modelos lineales generalizados a travs de la distribucin de Poisson, as como la importancia que radica el conocimiento con su aplicacin.
Metodologa
Esta investigacin es descriptiva puesto que se aplic un anlisis exploratorio que permiti conocer la tasa de mortalidad y que causas de muerte son las ms influyentes, tambin contar con una investigacin correlacional, es decir, se realizar un anlisis de correlacin se utiliz una regresin de Poisson con nmero de eventos en menores de un ao que va a permitir modelar estos datos de conteo y se verificar la medida de calidad del modelo mediante AIC, para verificar que tan adecuado es con estas bases simuladas y dar una conclusin sobre si aplicar o no este modelo a los datos de mortalidad infantil a nivel Ecuador. La presente investigacin inici con l mtodo cuantitativo de los datos de las defunciones en menores de un ao proporcionados por el Instituto Nacional de Estadsticas y Censos (INEC), iniciando con un anlisis descriptivo, luego un inferencial y por ltimo multivariante tuvo un enfoque cuantitativo puesto que es una investigacin emprica-analista, ya que utiliza datos para probar las hiptesis utilizando anlisis estadstico descriptivo y analtico que permita establecer patrones de comportamiento para predecir la media de defunciones en menores de un ao objeto de estudio. Los datos se obtuvieron del INEC dado que es una base de datos se consider los registros del INEC del ao 2019, considerando las 11 provincias de la regin sierra que son: Azuay, Bolvar, Caar, Carchi, Cotopaxi, Chimborazo Imbabura, Loja, Pichincha, Tungurahua y Santo Domingo de los Tschilas con un total de 119840 nacidos vivos y 1517 defunciones en menores de un ao, no se aplic ninguna tcnica de muestreo. La base datos que se manej para el estudio de modelos GLM son las defunciones de menores de un ao del 2019 recolectadas por el Instituto Nacional de Estadsticas y Censos la informacin conto: provincias, causa de muerte, nmero de muertes, nmero de nacidos vivos; todo esto correspondiente a la regin sierra del Ecuador.
Resultados
En esta seccin se hace referencia los aspectos que se consideraron en la investigacin para desarrollar el modelo generalizado Poisson.
Modelo Lineal Generalizado (Distribucin Poisson)
𝑌𝑖 = 𝑒0 ∗ 𝑒9.467 𝑃𝑟𝑜𝑣𝑖𝑛𝑐𝑖𝑎𝐵𝑜𝑙𝑣𝑎𝑟 ∗ 𝑒5.154 𝑃𝑟𝑜𝑣𝑖𝑛𝑐𝑖𝑎𝐶𝑎𝑎𝑟 ∗ 𝑒8.248 𝑃𝑟𝑜𝑣𝑖𝑛𝑐𝑖𝑎𝐶𝑎𝑟𝑐ℎ𝑖
∗ 𝑒2.884 𝑃𝑟𝑜𝑣𝑖𝑛𝑐𝑖𝑎𝐶ℎ𝑖𝑚𝑏𝑜𝑟𝑎𝑧𝑜 ∗ 𝑒3.716 𝑃𝑟𝑜𝑣𝑖𝑛𝑐𝑖𝑎𝐶𝑜𝑡𝑜𝑝𝑎𝑥 ∗ 𝑒2.640 𝑃𝑟𝑜𝑣𝑖𝑛𝑐𝑖𝑎𝐼𝑚𝑏𝑎𝑏𝑢𝑟𝑎
∗ 𝑒2.499 𝑃𝑟𝑜𝑣𝑖𝑛𝑐𝑖𝑎𝐿𝑜𝑗𝑎 ∗ 𝑒0.002 𝑃𝑟𝑜𝑣𝑖𝑛𝑐𝑖𝑎𝑃𝑖𝑐ℎ𝑖𝑛𝑐ℎ𝑎
∗ 𝑒1.611 𝑃𝑟𝑜𝑣𝑖𝑛𝑐𝑖𝑎𝑆𝑎𝑛𝑡𝑜 𝐷𝑜𝑚𝑖𝑛𝑔𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑇𝑠𝑐ℎ𝑖𝑙𝑎𝑠 ∗ 𝑒1.925 𝑃𝑟𝑜𝑣𝑖𝑛𝑐𝑖𝑎𝑇𝑢𝑛𝑔𝑢𝑟𝑎ℎ𝑢𝑎
∗ 𝑒0.059 𝐶𝑀 𝐶𝑎𝑢𝑠𝑎𝑠 𝑚𝑎𝑙 𝑑𝑒𝑓𝑖𝑛𝑖𝑑𝑎𝑠 ∗ 𝑒0.118 𝐶𝑀 𝐼𝑛𝑓𝑙𝑢𝑒𝑛𝑧𝑎 𝑦 𝑁𝑒𝑢𝑚𝑜𝑛𝑎
∗ 𝑒0.543 𝐶𝑀 𝑀𝑎𝑙𝑓𝑜𝑟𝑚𝑎𝑐𝑖𝑜𝑛𝑒𝑠 ∗ 𝑒0.129 𝐶𝑀 𝑂𝑏𝑠𝑡𝑟𝑢𝑐𝑐𝑖𝑛 𝑟𝑒𝑠𝑝𝑖𝑟𝑎𝑐𝑖𝑛 ∗ 𝑒0.073 𝐶𝑀 𝑅𝑒𝑠𝑟𝑜𝑠 𝑑𝑒 𝑐𝑎𝑢𝑠𝑎𝑠
Tablas
Tabla 1. Tabla de contingencia variables Gnero y Causas de muerte nmero de muertes en menores de un ao. Causas de Muerte
Gnero Afecciones Obstruccin Influenza Resto Causas Total
periodo Malformaciones y de mal
respiratoria prenatal neumona causas definidas
Hombre 440 210 48 53 22 24 797
Mujer 291 186 46 33 31 19
Total 731 396 94 86 53 43
Se identific que en hombres se presenta con mayor porcentaje la principal causa de muerte que es afecciones en periodo prenatal, seguida por malformaciones y se concluye que los hombres son ms propensos a morir.
Tabla 2.
I. Escalas a considerar en los tems
Intercepto -7.702 -9.186 0.000
ProvinciaBolvar |
2.248 |
0.671 |
3.351 |
0.001 |
ProvinciaCaar |
1.640 |
0.565 |
2.902 |
0.004 |
ProvinciaCarchi |
2.110 |
0.698 |
3.022 |
0.003 |
ProvinciaChimborazo |
1.059 |
0.377 |
2.810 |
0.005 |
ProvinciaCotopaxi |
1.313 |
0.380 |
3.458 |
0.001 |
ProvinciaImbabura |
0.971 |
0.391 |
2.479 |
0.013 |
ProvinciaLoja |
0.916 |
0.355 |
2.579 |
0.010 |
ProvinciaPichincha |
-6.343 |
2.136 |
-2.970 |
0.003 |
ProvinciaSanto Domingo de los Tschilas |
0.477 |
0.262 |
1.818 |
0.069 |
ProvinciaTungurahua |
0.655 |
0.298 |
2.200 |
0.028 |
CMuerteCausas mal definidas |
-2.827 |
0.157 |
-18.017 |
0.000 |
CmuerteInfluenza y Neumona |
-2.135 |
0.114 |
-18.724 |
0.000 |
CmuerteMalformaciones |
-0.610 |
0.062 |
-9.777 |
0.000 |
CmuerteObstruccin y Respiracin |
-2.046 |
0.110 |
-18.669 |
0.000 |
CmuerteResto de Causas |
-2.618 |
0.142 |
-18.406 |
0.000 |
Nacidos |
0.000 |
0.000 |
3.052 |
0.002 |
Se visualiza las estimaciones de los coeficientes del modelo de Poisson y se verific que todas las variables son significativas debido a que tiene el valor p menor que el nivel de significancia de
0.05.
Tabla 3.
II. Distribucin de Poisson a partir de la estimacin exponencial
Variables Independientes Estimaciones Exp(Estimacin) Interpretacin
Intercepto |
-7.702 |
0.000 |
|
ProvinciaBolvar |
2.248 |
9.467 |
La media de muertes en menores de un ao en Bolvar es 90.5% menos que la media de Azuay. |
ProvinciaCaar |
1.640 |
5.154 |
La media de muertes en menores de un ao en Caar es 94.8% menos que la media de Azuay. |
ProvinciaCarchi |
2.110 |
8.248 |
La media de muertes en menores de un ao en Carchi es 91.8% menos que la media de Azuay. |
ProvinciaChimborazo |
1.059 |
2.884 |
La media de muertes en menores de un ao en Chimborazo es 97.1% menos que la media de Azuay. |
ProvinciaCotopaxi |
1.313 |
3.716 |
La media de muertes en menores de un ao en Cotopaxi es 96.3% menos que la media de Azuay. |
ProvinciaImbabura |
0.971 |
2.640 |
La media de muertes en menores de un ao en Imbabura es 97.4% menos que la media de Azuay. |
ProvinciaLoja |
0.916 |
2.499 |
La media de muertes en menores de un ao Loja es 97.5% menos que la media de Azuay. |
ProvinciaPichincha |
-6.343 |
0.002 |
La media de muertes en menores de un ao en Pichincha es 99.998% ms que la media de muertes de Azuay. |
ProvinciaSanto Domingo de los Tschilas |
0.477 |
1.611 |
La media de muertes en menores de un ao en Santo Domingo de los Tschilas es 98.4% menos que la media de Azuay. |
ProvinciaTungurahua |
0.655 |
1.925 |
La media de muertes en menores de un ao en Tungurahua es 98.1% menos que la media de Azuay. |
CmuerteCausas mal definidas |
-2.827 |
0.059 |
La media de muertes en menores de un ao por muertes mal definidas aumenta 6% que la media de muertes por afecciones en el periodo prenatal. |
CmuerteInfluenza y Neumona |
-2.135 |
0.118 |
La media de muertes en menores de un ao por influenza y neumona aumenta 11.8% que la media de muertes por afecciones en el periodo prenatal. |
CmuerteMalformaciones |
-0.610 |
0.543 |
La media de muertes en menores de un ao por malformaciones aumenta 54.3% que la media de muertes por afecciones en el periodo prenatal. |
CmuerteObstruccin y Respiracin |
-2.046 |
0.129 |
La media de muertes en menores de un ao por obstruccin y respiracin aumenta 12.9% que la media de muertes por afecciones en el periodo prenatal. |
CmuerteResto de Causas |
-2.618 |
0.073 |
La media de muertes en menores de un ao por otras causas de muerte aumenta 7.3% que la media de muertes por afecciones en el periodo prenatal. |
Nacidos |
0.000 |
1.000 |
|
Se observa que el modelo a partir de la estimacin exponencial una comparacin de medias entre las muertes en menores de un ao de las regiones objeto de estudio.
Tabla 4.
III. Anlisis de Devianza para la variable muertes
|
Grados de libertad |
Devianza |
Devianza media |
Modelo Nulo |
131 |
1676.990 |
12.801 |
Modelo Residual |
115 |
208.930 |
1.817 |
Total Corregido |
210 |
4776.6 |
|
En la tabla 3 se sintetiza la devianza de la bondad de ajuste del modelo generalizado aplicado en la investigacin. Es as que el anlisis de devianza, reportan que el modelo es estadsticamente significativo y concluy lo siguiente: El modelo de regresin de Poisson tiene un pseudo-𝑅2 de 0,858 en comparacin con el de regresin mltiple que tena un 𝑅2 de 0.966. la hiptesis referente al pseudo-𝑅2, es que 𝐻0: 𝑅2 = 0 𝑣𝑠 𝐻1: 𝑅2 ≠ 0, y 𝐻0 es rechazada lo que involucra que los datos observados se ajustan al modelo de regresin de Poisson, adems se cumple con la equidispersin ya que se obtuvo un valor de 𝜙 = 1.002.
Etapas del modelo
Figura 1. Etapas de la construccin del modelo
Discusin
Con el objetivo de dar continuidad a la presente investigacin, es conveniente disear nuevos estudios, de modo que se capacite el aprendizaje de la distribucin de Poisson, el hecho radica en la comparacin que tome como referente el aprendizaje desarrollador de conceptos probabilsticos en el marco de la formacin de los estudiantes. La enseanza de contenidos estadsticos constituye un aspecto importante en la formacin universitaria de los profesionales de pregrado. La modelizacin de cualquier situacin real no es un proceso particular, sino que depende de muchos factores tales como calidad de datos, modelo terico subyacente entre otras. Con esta concentracin se han mostrado las posibilidades y limitaciones de la aplicacin de tcnicas estadsticas para datos de conteo en el campo de la vida real.
Conclusiones
Las simulaciones comparativas permiten verificar si el estudio realizado se puede utilizar a nivel de todo el pas y se concluye que el modelo puede utilizar datos de mortalidad infantil de menores de un ao de todo el Ecuador con regresin de Poisson. Los modelos lineales generalizados son una amplificacin de los modelos lineales que permiten modelar variable que pertenecen a la familia de distribucin de probabilidad exponencial, la misma que contiene distribuciones normal, binomial, poisson y binomial negativa sin embargo se debe considerar el tipo de datos que se va a manipular para emplear el mejor modelo que contribuir al anlisis que deseamos obtener con el propsito de que el modelo propuesto es el indicado para la modelacin de los datos y evitar uno de los supuestos que es la equidispersin.
Finalmente, las simulaciones comparativas son rpidas de realizar, permiten tomar decisiones adecuadas, razonadas, y en el tiempo que se requieren.
Referencias
Rodrguez Rodrguez, M. (2022). Importancia de la distribucin binomial y de Poisson. Colombia: Corporacin Universitaria del Meta .
AE. (9 de febrero de 2019). rstudio-pubs-static.s3.amazonaws.com. Obtenido de https://rstudio-pubs-
static.s3.amazonaws.com/465671_ee66d8ea51e84ba79554f6dd807d2189.html#predicci% C3%B3n-de-probabilidades
Arguello, V. (2022). Modelos lineales generalizados para el anlisis de defunciones en menores de un ao en la regin Sierra del Ecuador. Riobamba : Escuela Superior Politcnica de Chimborazo .
Calzada, P. A. (2017). Modelos de regresin con datos de conteo. Aplicacin a competiciones deportivas . Sevilla: Universidad de Sevilla .
Freund , J. E., Miller, I. R., & Johnson, R. (2006). Probabilidades y Estadstica para Ingenieros. Habana : Flix Varela.
R coder. (2020). R CODER . Obtenido de https://r-coder.com/distribucion-poissonr/#La_distribucion_de_Poisson
Ramrez, M. C., lvarez Reyes, S. E., & Prez Santos, F. J. (2013). Sobre la Enseanza de la Distribucin de Poisson en Carreras de Ingeniera. Bolema, 1117-1134.
READING, C., & REID, J. (2013). An emerging hierarchy of reasoning about distribution:
From a variation perspective. Statistics Education Research Journal, 46-68.
2023 por los autores. Este artculo es de acceso abierto y distribuido segn los trminos y condiciones de la licencia Creative Commons Atribucin-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0)
(https://creativecommons.org/licenses/by-nc-sa/4.0/).
Enlaces de Referencia
- Por el momento, no existen enlaces de referencia
Polo del Conocimiento
Revista Científico-Académica Multidisciplinaria
ISSN: 2550-682X
Casa Editora del Polo
Manta - Ecuador
Dirección: Ciudadela El Palmar, II Etapa, Manta - Manabí - Ecuador.
Código Postal: 130801
Teléfonos: 056051775/0991871420
Email: polodelconocimientorevista@gmail.com / director@polodelconocimiento.com
URL: https://www.polodelconocimiento.com/