����������������������������������������������������������������������������������

 

Estudio estad�stico inferencial del incremento de Homicidios Intencionales para determinar la afectaci�n en el comportamiento delictual a la poblaci�n nacional a partir de la base de datos de Homicidio Intencional utilizando programaci�n en R.

 

Inferential statistical study of the increase in Intentional Homicide to determine the affectation of criminal behavior in the national population from the Intentional Homicide database using programming in R.

 

Estudo estat�stico inferencial do aumento dos Homic�dios Intencionais para determinar a afeta��o do comportamento criminoso na popula��o nacional a partir da base de dados de Homic�dios Intencionais utilizando programa��o em R.

Juan Carlos Yung�n Cazar I
jyungan@espoch.edu.ec
https://orcid.org/0000-0001-5682-0399     
,Katherine Adriana Merino Villa II
kathetine.merino@espoch.edu.ec
https://orcid.org/0009-0001-0616-9611
Edgar Gualberto Salazar �lvarez III
edgar.salazar@espoch.edu.ec
https://orcid.org/0000-0003-0988-0641    
,Diego Alejandro C�ceres Veintimilla IV
diego.caceres@espoch.edu.ec
 https://orcid.org/0000-0003-0498-1240
 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


Correspondencia: jyungan@espoch.edu.ec

 

 

Ciencias Tecnolog�as de la Informaci�n y la Comunicaci�n ���

Art�culo de Investigaci�n

��

* Recibido: 23 de junio de 2023 *Aceptado: 12 de julio de 2023 * Publicado: �28 de agosto de 2023

 

        I.          Escuela Superior Polit�cnica de Chimborazo, Riobamba, Ecuador.

      II.          Ingeniera en Electr�nica Telecomunicaciones y Redes Escuela Superior Polit�cnica de Chimborazo, Riobamba, Ecuador.�����

     III.          Escuela Superior Polit�cnica de Chimborazo. Riobamba, Ecuador.

     IV.          Escuela Superior Polit�cnica de Chimborazo. Riobamba, Ecuador.

 


Resumen

La programaci�n estad�stica en R es un enfoque clave en la ciencia de datos que involucra el uso del lenguaje de programaci�n R para realizar an�lisis estad�sticos, manipulaci�n de datos, visualizaci�n y generaci�n de informes. Es ampliamente utilizado por profesionales en diversas disciplinas para analizar y comprender conjuntos de datos complejos. El proceso de recolecci�n, almacenamiento, an�lisis y visualizaci�n de datos contenidos en Bases de Datos gubernamentales en Ecuador mediante la programaci�n estad�stica en R puede desglosarse de la siguiente manera: Se inicia accediendo a las Bases de Datos p�blicas. Los datos recolectados se importan y almacenan en el entorno de trabajo de R. Es com�n que los datos requieran preparaci�n antes del an�lisis. Esto incluye la limpieza de valores at�picos, el tratamiento de valores faltantes y la transformaci�n de datos en el formato adecuado para su an�lisis. Una vez que los datos est�n preparados, se pueden realizar an�lisis estad�sticos utilizando diversas t�cnicas, como estad�sticas descriptivas, pruebas de hip�tesis, an�lisis de regresi�n, clustering, entre otros. La visualizaci�n de datos es fundamental para comunicar los resultados de manera efectiva. R proporciona paquetes como ggplot2, que permiten crear gr�ficos de alta calidad. La generaci�n de Informes se lo realiza utilizando la herramienta R Markdown. Una vez que se han realizado los an�lisis y generado los informes, los resultados pueden ser compartidos.

Palabras Clave: Programaci�n estad�stica; Bases de datos estructuradas; prueba de hip�tesis; �ndices de homicidio.

 

Abstract

Statistical programming in R is a key approach in data science that involves using the R programming language to perform statistical analysis, data manipulation, visualization, and report generation. It is widely used by professionals in various disciplines to analyze and understand complex data sets. The process of collection, storage, analysis and visualization of data contained in government databases in Ecuador through statistical programming in R can be broken down as follows: It begins by accessing public databases. The collected data is imported and stored in the R framework. It is common for the data to require preparation before analysis. This includes cleaning outliers, handling missing values, and transforming data into the appropriate format for analysis. Once the data is prepared, statistical analyzes can be performed using various techniques, such as descriptive statistics, hypothesis testing, regression analysis, clustering, among others. Data visualization is critical to communicating results effectively. R provides packages such as ggplot2, which allow you to create high-quality plots. Report generation is done using the R Markdown tool. Once the analyzes have been carried out and the reports generated, the results can be shared.

Keywords: Statistical programming; Structured databases; hypothesis testing; homicide rates.

 

Resumo

A programa��o estat�stica em R � uma abordagem chave na ci�ncia de dados que envolve o uso da linguagem de programa��o R para realizar an�lise estat�stica, manipula��o de dados, visualiza��o e gera��o de relat�rios. � amplamente utilizado por profissionais de diversas disciplinas para analisar e compreender conjuntos de dados complexos. O processo de coleta, armazenamento, an�lise e visualiza��o dos dados contidos nas bases de dados governamentais do Equador atrav�s da programa��o estat�stica em R pode ser dividido da seguinte forma: Come�a pelo acesso �s bases de dados p�blicas. Os dados coletados s�o importados e armazenados na estrutura R. � comum que os dados exijam prepara��o antes da an�lise. Isso inclui a limpeza de valores discrepantes, o tratamento de valores ausentes e a transforma��o de dados no formato apropriado para an�lise. Uma vez preparados os dados, as an�lises estat�sticas podem ser realizadas utilizando diversas t�cnicas, como estat�stica descritiva, teste de hip�teses, an�lise de regress�o, agrupamento, entre outras. A visualiza��o de dados � fundamental para comunicar resultados de forma eficaz. R fornece pacotes como ggplot2, que permitem criar gr�ficos de alta qualidade. A gera��o do relat�rio � feita atrav�s da ferramenta R Markdown. Uma vez realizadas as an�lises e gerados os relat�rios, os resultados podem ser compartilhados.

Palavras-chave: Programa��o estat�stica; bases de dados estruturadas; testes de hip�tesis; taxas de homic�dios.

����������������������������������������������������������������������������������������������

Introducci�n

�La programaci�n estad�stica inferencial en R se erige como una herramienta poderosa para extraer conocimientos profundos de los datos. R es un lenguaje de programaci�n y un entorno especializado en estad�sticas y an�lisis de datos, que permite realizar an�lisis inferenciales con eficiencia y precisi�n.

En este contexto, la utilizaci�n de bases de datos estructuradas cobra vital importancia. Estas bases organizan la informaci�n en tablas con filas y columnas, lo que facilita la gesti�n y manipulaci�n de datos. R se integra de manera perfecta con bases de datos estructuradas, permitiendo la conexi�n directa y la extracci�n de informaci�n relevante para el an�lisis estad�stico.

Mediante la programaci�n estad�stica inferencial en R, es posible realizar estimaciones de par�metros, pruebas de hip�tesis y modelado predictivo a partir de los datos estructurados. Las librer�as y funciones especializadas en estad�sticas de R proporcionan las herramientas necesarias para llevar a cabo an�lisis sofisticados y visualizar los resultados de manera efectiva.

 

Estad�stica Inferencial - Descripci�n �Contrastes de Hip�tesis�.

Muchos problemas requieren decidir si se acepta o rechaza un enunciado acerca de alg�n par�metro (estad�stico). Para esto, se considera hip�tesis, y el procedimiento para la toma de decisiones en torno a probar o no la hip�tesis, recibe el nombre de prueba de hip�tesis. (Triola, 2004)

 

Contrastar una hip�tesis consiste en probar un valor observado con un valor definido por el investigador, los mismos que se han desarrollado en muchos campos tales como:

       Agricultura, para decidir que fertilizante entrega los mejores resultados

       Medicina, para probar si un medicamento es mejor que otro

       Industria, para validar procesos orientados a mejorar y mantener est�ndares de calidad

       Entre muchos otros.

 

Metodolog�a

Algoritmo para realizar una prueba de hip�tesis:

1.               Definir el valor a contrastar, por lo general es un valor determinado a priori por experiencia, regulaciones o experiencias realizadas anteriormente.

2.               Definir la hip�tesis nula y la alternativa

3.               Determinar el nivel de error de la prueba (esto refiere al Error tipo I)

4.               Determinar la distribuci�n de contraste, por lo general depende del n�mero de observaciones con que estemos trabajando

5.               Definir una regi�n de aceptaci�n o rechazo

6.               Estimar el valor a contrastar de las observaciones disponibles

7.               Decidir si aceptar o no la hip�tesis nula.

 

Modelo para aplicar contraste de hip�tesis

En el Ecuador a partir del a�o 2018, se tiene un incremento en los Homicidios Intencionales (HI), afectando este comportamiento delictual a la poblaci�n nacional, estamos interesados en poder comprobar si este fen�meno delictual afecta a personas j�venes o no, y si afecta a hombres y mujeres j�venes. Para esto se plantear� dos tipos de Contrastes de hip�tesis:

       La primera comprobaremos si la media de las edades de fallecidos es igual a la edad de j�venes que seg�n la Organizaci�n Mundial de la Salud (OMS), se consideran personas j�venes, las comprendidas entre 10 y los 24 a�os, para el prop�sito de nuestro an�lisis consideraremos el punto medio es decir 17 a�os en relaci�n con el total de fallecidos.

       Otra prueba que realizaremos consistir� en probar si las edades medias que se tiene en HI son iguales en hombres y mujeres. (Santana, 2014)

 

Planteamiento del estudio:

El estudio consistir� en dos actividades, la primera probaremos si el promedio de edad de HI en Ecuador es igual a la edad de j�venes definido anteriormente en 17 a�os, es decir nuestra prueba es la siguiente:

Esa ser� nuestra primera estimaci�n, y la segunda consiste en:

El segundo contraste considera dos poblaciones de Hombres y Mujeres de HI, se quiere probar si la edad de los HI es iguale entre hombres y mujeres as�:

 

Tipo de base de datos a recabar para el estudio

Para ejecutar los dos contrastes planteados, se procedi� a recabar la base de datos de Homicidios Intencionales, anonimizada para guardar la reserva de la informaci�n sensible las variables a considerar es la edad y sexo de la v�ctima, se tiene los datos en el periodo de 2018 hasta el 2021, desde Medicina Legal, instituci�n que realiza el protocolo de autopsia sobre toda muerte violenta y particularmente sobre los homicidios intencionales. (Hern�ndez, 2022)

 

Desarrollo del estudio

Para ejecutar los dos Contrastes de hip�tesis, se utilizar� la base de datos de Homicidio Intencional, por edad y sexo de la v�ctima desde el a�o 2018 hasta el a�o 2021 que consta de 6362 registros. Iniciamos con un an�lisis exploratorio, iniciamos con un histograma (Donoso 2023)

Gr�fica 1. Edad de homicidios intencionales

La figura muestra el histograma de las edades en a�os de los Homicidios intencionales registrados entre el 2018 y 2021 en Ecuador.

 

Contraste de la prueba:

data:� pruebah$EDAD

t = 103.36, df = 6300, p-value < 2.2e-16

alternative hypothesis: true mean is not equal to 17

95 percent confidence interval:

�34.24478 34.91154

sample estimates:

mean of x

�34.57816

La prueba rechaza H0 con un nivel de error muy bajo, esto es los homicidios intencionales no se tiene en personas j�venes de 17 a�os, la media estimada es de 35 a�os aproximadamente.

Ahora realicemos la prueba de hip�tesis para determinar si las edades en hombres y mujeres son iguales.

Para esto consideramos dos muestras independientes Hombres y Mujeres (Bruce, 2022)

Gr�fica 2. Edad de homicidios intencionales en hombres y mujeres

 

Se presenta un histograma de homicidios intencionales en hombres y mujeres seg�n la edad.

 

data:� HombresHI and MujeresHI

t = 0.52708, df = 6294, p-value = 0.5982

alternative hypothesis: true difference in means is not equal to 0

95 percent confidence interval:

�-0.7756959� 1.3462156

sample estimates:

mean of x mean of y

�34.61383� 34.32857

 

Al contrastar la prueba se tiene que no se rechaza la igualdad de edades medias, esto ya que, el p-valor es del 0.5982, esto indica que las edades en homicidios intencionales son similares entre hombres y mujeres. (V�squez, 2022).

 

Discusi�n y resultados

Para la realizaci�n del presente taller, se trabaj� con una base de datos reales de homicidios intencionales, adicional a esto para la prueba de la muestra total de edades como para la prueba de igualdad de edades medias entre hombres y mujeres, consideramos que provienen de una distribuci�n normal, as� como la varianza desconocida pero constante y finita.

Los principales resultados que se obtuvo fue que la edad de los homicidios difiere de la edad de joven que es 17 a�os, esto hace suponer que el comportamiento de este tipo de violencia puede estar asociado a diferentes factores que puede aumentar conforme aumenta la edad as� en la prueba se tiene que el promedio de homicidios se tiene alrededor de los 34 a�os.

Adicional a esto, al comparar la edad media de hombres y mujeres, se tiene que son iguales, lo que indica que las edades en hombres y mujeres que sufren este tipo de violencia es la misma, lo interesante ser�a profundizar el an�lisis y poder determinar si existen otros factores asociados a este fen�meno delictual que pueda diferenciar el comportamiento en hombres y mujeres.

 

Conclusiones

1.     La programaci�n estad�stica inferencial en R emerge como una herramienta poderosa para extraer conocimientos profundos de los datos. R, como lenguaje y entorno especializado en estad�sticas y an�lisis de datos, posibilita realizar an�lisis inferenciales con precisi�n y eficiencia.

2.     La utilizaci�n de bases de datos estructuradas cobra vital importancia en este contexto. Estas bases organizan la informaci�n en tablas, facilitando la manipulaci�n y gesti�n de datos. La integraci�n fluida entre R y bases de datos estructuradas permite conexiones directas y extracci�n de informaci�n relevante para an�lisis estad�sticos.

3.     La programaci�n estad�stica inferencial en R permite realizar estimaciones de par�metros, pruebas de hip�tesis y modelado predictivo a partir de datos estructurados. Las librer�as y funciones especializadas en estad�sticas de R proporcionan las herramientas necesarias para an�lisis sofisticados y visualizaci�n efectiva de resultados.

4.     Los contrastes de hip�tesis son esenciales para la toma de decisiones en diferentes campos como agricultura, medicina e industria. En este contexto, el texto presenta ejemplos espec�ficos de contraste de hip�tesis, como la comparaci�n de edades de v�ctimas de homicidios intencionales con una definici�n de personas j�venes y la comparaci�n de edades entre hombres y mujeres.

5.     El an�lisis de los homicidios intencionales en Ecuador revela que las edades de las v�ctimas difieren de la definici�n de j�venes, lo que sugiere que el fen�meno delictual puede estar asociado a diversos factores a medida que aumenta la edad. Adem�s, se concluye que las edades medias de hombres y mujeres v�ctimas son similares, lo que plantea la posibilidad de profundizar en factores que puedan influir en este comportamiento delictivo diferencial entre g�neros.

 

 

 

 

 

 

 

 

 

 

 

 

 

Referencias

Triola, F. M. (2004). Probabilidad y estad�stica - Mario F. Triola - Google Libros. In Probabilidad y estad�stica (Vol. 1).

�Santana Sep�lveda, S., & Mateos Farf�n, E. (2014). El arte de programar en R: un lenguaje para la estad�stica.

Donoso, M. E. A., Maurisaca, N. E. C., & Reyes, J. E. A. (2022). An�lisis de Correspondencias M�ltiples para el Estudio de los Homicidios Intencionales en el Ecuador. Revista Polit�cnica, 50(3), 43-52.

Hern�ndez Bringas, H. (2022). Homicidios en Am�rica Latina y el Caribe: magnitud y factores asociados. Notas de poblaci�n.

Bruce, P., Bruce, A., & Gedeck, P. (2022). Estad�stica pr�ctica para ciencia de datos con R y Python. Marcombo.

V�squez S�nchez, E., & Ortiz Basauri, G. M. (2022). Estad�stica Inferencial en la l�gica de la investigaci�n cient�fica.

 

 

 

 

 

 

 

 

 

 

� 2023 por los autores. Este art�culo es de acceso abierto y distribuido seg�n los t�rminos y condiciones de la licencia Creative Commons Atribuci�n-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0)

(https://creativecommons.org/licenses/by-nc-sa/4.0/).

Enlaces de Referencia

  • Por el momento, no existen enlaces de referencia
';





Polo del Conocimiento              

Revista Científico-Académica Multidisciplinaria

ISSN: 2550-682X

Casa Editora del Polo                                                 

Manta - Ecuador       

Dirección: Ciudadela El Palmar, II Etapa,  Manta - Manabí - Ecuador.

Código Postal: 130801

Teléfonos: 056051775/0991871420

Email: polodelconocimientorevista@gmail.com / director@polodelconocimiento.com

URL: https://www.polodelconocimiento.com/