![]()
Prediccin de Enfermedades Cardacas Utilizando el Teorema de Bayes: Un Enfoque Aplicado en R Studio
Predicting Heart Disease Using Bayes' Theorem: An Approach Applied in R Studio
Previso de doenas cardacas usando o Teorema de Bayes: uma abordagem aplicada no R Studio
![]() |
|
![]() |
Correspondencia: csanchezt3@unemi.edu.ec
Ciencias de la Salud
Artculo de Investigacin
* Recibido: 26 de julio de 2025 *Aceptado: 22 de agosto de 2025 * Publicado: 30 de septiembre de 2025
I. Universidad Estatal de Milagro, Ecuador.
II. Universidad Estatal de Milagro, Ecuador.
Resumen
Este estudio se adentra en la compleja y uso de la aplicacin del Teorema de Bayes para predecir de manera ms precisa la aparicin de diversas enfermedades a partir de variables clnicas que son fcilmente accesibles y pueden ser recogidas en un entorno clnico habitual. Se implement un enfoque estadstico avanzado utilizando R Studio, lo que facilit notablemente el modelado de la probabilidad de desarrollar una enfermedad bajo ciertas condiciones previas y conocidas. A partir de un conjunto de datos pblicos, relacionados con el diagnstico de diversas enfermedades, se desarroll un modelo bayesiano predictivo que permite realizar evaluaciones ms acertadas. Los hallazgos de este estudio demuestran de manera contundente la eficacia del enfoque probabilstico al momento de tomar decisiones clnicas cruciales, proporcionando as una mayor precisin diagnstica, especialmente en contextos en los que los recursos son limitados y es esencial optimizar su uso. El artculo subraya de manera enftica la relevancia del teorema en situaciones concretas e importantes del mbito de la salud pblica, sugiriendo diversas aplicaciones para futuros estudios e investigaciones.
Palabras Clave: Teorema de Bayes; prediccin de enfermedades; estadstica; probabilidad; R Studio.
Abstract
This study delves into the complex application of Bayes' Theorem to more accurately predict the onset of various diseases using clinical variables that are easily accessible and can be collected in a routine clinical setting. An advanced statistical approach was implemented using R Studio, which significantly facilitated the modeling of the probability of developing a disease under certain known preconditions. Using a public dataset related to the diagnosis of various diseases, a predictive Bayesian model was developed that allows for more accurate assessments. The findings of this study strongly demonstrate the effectiveness of the probabilistic approach in making crucial clinical decisions, thus providing greater diagnostic accuracy, especially in contexts where resources are limited and optimizing their use is essential. The article emphatically underlines the relevance of the theorem in specific and important situations in the field of public health, suggesting various applications for future studies and research.
Keywords: Bayes' Theorem; disease prediction; statistics; probability; R Studio.
Resumo
Este estudo investiga a complexa aplicao do Teorema de Bayes para prever com maior preciso o aparecimento de diversas doenas, utilizando variveis clnicas de fcil acesso e que podem ser recolhidas num ambiente clnico de rotina. Foi implementada uma abordagem estatstica avanada utilizando o R Studio, o que facilitou significativamente a modelao da probabilidade de desenvolvimento de uma doena sob determinadas pr-condies conhecidas. Utilizando um conjunto de dados pblicos relacionados com o diagnstico de diversas doenas, foi desenvolvido um modelo bayesiano preditivo que permite avaliaes mais precisas. Os resultados deste estudo demonstram fortemente a eficcia da abordagem probabilstica na tomada de decises clnicas cruciais, proporcionando assim uma maior preciso diagnstica, especialmente em contextos onde os recursos so limitados e a otimizao da sua utilizao essencial. O artigo enfatiza enfaticamente a relevncia do teorema em situaes especficas e importantes no campo da sade pblica, sugerindo diversas aplicaes para estudos e pesquisas futuras.
Palavras-chave: Teorema de Bayes; previso de doenas; estatstica; probabilidade; Estdio R.
Introduccin
En el contexto de la salud pblica y la medicina clnica, la implementacin de decisiones fundamentadas en evidencias estadsticas se vuelve esencial para optimizar el diagnstico y el tratamiento efectivo de diversas patologas. Un mtodo significativo en el anlisis probabilstico es el Teorema de Bayes, que proporciona un mecanismo para ajustar la probabilidad de un evento a partir de un nuevo conjunto de evidencias. Esta herramienta analtica se revela particularmente valiosa cuando existen datos preliminares, tales como sntomas o antecedentes mdicos, y se busca calcular la probabilidad de que un paciente sufra de una enfermedad particular (Polotskaya, Muoz Valencia, Rabasa, & Quesada, 2024).
La utilizacin del Teorema de Bayes en la construccin de modelos predictivos ha evidenciado su eficacia en mltiples reas, siendo especialmente notable su aplicacin en el mbito de la medicina, donde sobresale por su claridad en la interpretacin y su aplicabilidad prctica. En este estudio, se expone una implementacin computacional del enfoque bayesiano centrada en la prediccin de enfermedades mediante el anlisis de datos reales. Empleando R Studio, se desarrolla y valida un modelo que facilita la estimacin de la probabilidad condicional de contraer una enfermedad basada en diversos factores observables.
Aparte de su relevancia desde un enfoque terico, el anlisis busca sealar la manera en que los mtodos estadsticos al alcance pueden influir de manera significativa en la optimizacin del diagnstico clnico, sobre todo en entornos donde los recursos son escasos. Con este propsito, se recurre a un conjunto de datos de acceso pblico que brinda informacin sobre diagnsticos mdicos, lo que facilita tanto la replicacin de estudios como la comprensin accesible por parte de estudiantes e investigadores que se dedican a la estadstica aplicada.
Marco Terico
La estadstica desempea un papel esencial en la medicina y la salud pblica, permitiendo el anlisis sistemtico de datos clnicos para apoyar la toma de decisiones (Vera Damin & Altamirano Mego, 2024). En este marco, la probabilidad se presenta como una herramienta esencial para representar la incertidumbre que caracteriza los procesos de diagnstico y tratamiento. Uno de los mtodos ms slidos para la gestin probabilstica de la informacin mdica es el Teorema de Bayes, el cual es una frmula matemtica que facilita la actualizacin de la probabilidad de un evento a partir de evidencia nueva.
Fundamentos del Teorema de Bayes
El Teorema de Bayes, diseado por el matemtico Thomas Bayes en el siglo XVIII, explica el proceso mediante el cual la probabilidad de ocurrencia de un evento puede ser ajustada al considerar nueva informacin. Desde una perspectiva matemtica, se establece de la siguiente manera:
𝑃(𝐴/𝐵) = 𝑃(𝐵/𝐴) 𝑃(𝐴)
![]()
𝑃(𝐵)
Donde:
P (A∣B) es la probabilidad posterior de que ocurra el evento A dado que ocurri B.
P (B∣A) es la probabilidad de observar B dado que A es verdadero.
P (A) es la probabilidad previa de A.
P (B) es la probabilidad total de B.
Este mtodo se muestra especialmente eficaz en el mbito de la medicina, ya que facilita la estimacin de la probabilidad de que un paciente sufra de una enfermedad (A) basndose en la presencia de un sntoma o hallazgo clnico (B).
El modelo Naive Bayes, fundamentado en este teorema, parte de la premisa de que las caractersticas predictivas son independientes entre s. Aunque esta suposicin puede ser considerada simplista, el modelo ha demostrado un rendimiento sobresaliente en diversas tareas
de clasificacin, incluidas aplicaciones en el mbito mdico, como la prediccin de enfermedades cardiovasculares, debido a su capacidad para generar clasificadores que son tanto eficientes como rpidos (Rumbaut Rangel & Mariduea Arroyave, 2024).
La integracin de este enfoque terico junto con herramientas de software como R Studio proporciona a los analistas una opcin robusta y accesible para aplicar modelos predictivos en situaciones clnicas prcticas.
Aplicaciones del Teorema de Bayes en Medicina
En el campo mdico, el Teorema de Bayes se ha aplicado exitosamente al diagnstico de enfermedades como cncer, enfermedades cardacas y trastornos infecciosos. Por ejemplo, en estudios de deteccin temprana, permite mejorar la interpretacin de pruebas diagnsticas al considerar la prevalencia de la enfermedad en una poblacin determinada (Teng, Zhang, Liu, Shu, & Ye, 2022).
Adems, en contextos de salud pblica, el enfoque bayesiano facilita la toma de decisiones bajo condiciones de incertidumbre, optimizando recursos clnicos limitados. Investigaciones recientes han demostrado que modelos bayesianos bien calibrados pueden superar a los modelos clsicos en precisin diagnstica, especialmente cuando se dispone de muestras pequeas o informacin incompleta (Cerda Lorca, Castro, Bambs, & Balcells, 2025).
La identificacin de los factores de riesgo que influyen en las cadas del adulto mayor puede optimizarse mediante herramientas estadsticas como el teorema de Bayes, el cual permite mejorar la precisin de los diagnsticos a partir de informacin previa y condicional (Escobar Castellanos & Martnez Martnez, 2018).
El teorema de Bayes es una herramienta estadstica fundamental en medicina, ya que permite actualizar la probabilidad de una enfermedad con base en los resultados de pruebas diagnsticas, mejorando as la toma de decisiones clnicas al incorporar la sensibilidad, especificidad y prevalencia de la condicin evaluada (Palomar Morales & Guerrero Morales, 2017).
Modelos Predictivos y R Studio
El software R Studio ha cobrado popularidad como herramienta para el anlisis estadstico y la implementacin de modelos bayesianos. Este entorno de programacin permite construir modelos probabilsticos reproducibles, utilizando bibliotecas especializadas como e1071, caret y bayesrule. Su capacidad de visualizacin y procesamiento de datos lo convierte en una opcin ideal para estudiantes e investigadores en salud interesados en anlisis aplicado (Kabacoff, 2022).
Metodologa
Fuente de los datos
En el presente anlisis se emple el conjunto de datos denominado "Heart Disease UCI", el cual es accesible de forma pblica en el repositorio UCI Machine Learning Repository y ha sido replicado en GitHub. Este conjunto de datos incluye informacin clnica relevante de pacientes, con el propsito de prever la existencia de enfermedades cardacas mediante el uso de diversas variables biomdicas.
Descripcin del conjunto de datos El conjunto original incluye 303 registros y 14 variables, entre las cuales se destacan:
age: edad del paciente (aos),
sex: sexo (1 = hombre; 0 = mujer),
cp: tipo de dolor en el pecho,
trestbps: presin arterial en reposo (mm Hg),
chol: colesterol srico (mg/dl),
fbs: azcar en sangre en ayunas (>120 mg/dl),
restecg: resultados del electrocardiograma,
thalach: frecuencia cardiaca mxima alcanzada,
exang: angina inducida por ejercicio,
oldpeak: depresin ST inducida por ejercicio,
slope: pendiente del segmento ST en el ECG,
ca: nmero de vasos principales coloreados por fluoroscopia,
thal: defecto talmico,
target: presencia de enfermedad cardaca (1 = enfermedad; 0 = sano).
La variable target fue utilizada como variable dependiente (respuesta), mientras que el resto se consider como variables predictoras.
Preparacin de los datos
Se llev a cabo un proceso fundamental de depuracin de datos en R Studio. Se constat que no existan valores nulos en el conjunto de datos analizado, lo que elimin la necesidad de implementar tcnicas de imputacin. A continuacin, el conjunto de datos se segment en dos subconjuntos: uno de entrenamiento, que represent el 80 %, y otro de prueba, correspondiente al 20 %. Esta particin se realiz utilizando la funcin createDataPartition() del paquete caret, garantizando as que la distribucin de la variable objetivo se mantuviera proporcional en ambas divisiones.
Modelo bayesiano
El modelo de clasificacin fue diseado empleando el algoritmo Naive Bayes, que fue implementado en el entorno R utilizando la funcin naiveBayes() del paquete e1071. Este enfoque se basa en la premisa de independencia condicional entre las variables predictoras, lo que facilitala simplificacin del clculo de la probabilidad posterior. La formulacin general del Teorema de Bayes aplicada se expresa como:
𝑃(𝐴/𝐵) = 𝑃(𝐵/𝐴) 𝑃(𝐴)
![]()
𝑃(𝐵)
Evaluacin del modelo
La validacin se llev a cabo utilizando el conjunto de prueba, donde se realiz una comparacin entre las predicciones generadas por el modelo y los valores reales. Se implement la matriz de confusin y se calcularon diversas mtricas, incluyendo precisin, sensibilidad, especificidad y la exactitud global, con el propsito de evaluar de manera integral el rendimiento predictivo del modelo.
Anlisis de Resultados y Discusin
El modelo Naive Bayes implementado demostr una capacidad predictiva significativa para diagnosticar enfermedades cardacas a partir de variables clnicas bsicas. La precisin general del modelo alcanz un 85%, lo que indica que 85 de cada 100 casos fueron correctamente clasificados como enfermo o no enfermo.
Desde el punto de vista clnico, la sensibilidad del modelo fue del 84.85%, lo cual significa que el algoritmo logr identificar correctamente al 84.85% de los pacientes con enfermedad cardaca. Esta es una mtrica crtica en contextos de salud pblica, ya que una alta sensibilidad implica un bajo nivel de falsos negativos, lo que reduce el riesgo de omitir diagnsticos en pacientes que realmente necesitan atencin mdica.
Por otro lado, la especificidad fue del 85.19%, lo que implica que el modelo tambin fue eficaz al identificar correctamente a los pacientes sanos. Esta caracterstica es relevante para evitar tratamientos innecesarios, optimizando el uso de recursos en entornos clnicos con limitaciones presupuestarias como suele ser el caso en muchas regiones del Ecuador.
La valoracin del Kappa (0.6959) sugiere una concordancia sustancial entre las predicciones del modelo y los diagnsticos reales, y el valor p del test de McNemar (1.00) indica que no hay evidencia de desequilibrio entre falsos positivos y falsos negativos, lo cual refuerza la estabilidad del modelo.
En comparacin con enfoques tradicionales como la regresin logstica o los rboles de decisin, el modelo Naive Bayes tiene la ventaja de requerir menos recursos computacionales y de ofrecer interpretaciones probabilsticas tiles para decisiones clnicas rpidas. Adems, su desempeo es robusto aun cuando algunas de las variables no son independientes, una condicin que raramente se cumple en datos mdicos reales.
Finalmente, este estudio demuestra que herramientas estadsticas simples, accesibles y fcilmente implementables en plataformas como R Studio, pueden tener un impacto tangible en la toma de decisiones clnicas, especialmente en regiones donde el acceso a tecnologas avanzadas es limitado.
Conclusiones
La aplicacin del Teorema de Bayes mediante el modelo Naive Bayes en este estudio permiti demostrar la utilidad de los enfoques probabilsticos para la prediccin de enfermedades a partir de datos clnicos accesibles. Con una precisin del 85%, el modelo evidenci un desempeo slido, caracterizado por una alta sensibilidad (84.85%) y especificidad (85.19%), indicadores clave en contextos donde la precisin diagnstica es fundamental.
Este tipo de herramientas, basadas en la estadstica y la probabilidad, ofrecen soluciones efectivas para entornos clnicos con recursos limitados, como ocurre en diversas zonas de Ecuador. Su facilidad de implementacin en plataformas como R Studio las convierte en aliadas estratgicas para fortalecer la toma de decisiones mdicas, la priorizacin de casos y la optimizacin de los recursos en el sistema de salud.
El presente trabajo tambin destaca la importancia del anlisis estadstico como base para construir modelos matemticos interpretables y replicables, que contribuyan a mejorar el diagnstico temprano, la gestin de enfermedades y, en ltima instancia, la salud pblica.
En futuras investigaciones, podra evaluarse la inclusin de variables contextuales locales, como hbitos alimenticios, factores socioeconmicos o condiciones geogrficas especficas, lo que permitira adaptar el modelo a realidades particulares y mejorar su poder predictivo.
Referencias
Cerda Lorca, J., Castro, R., Bambs, C., & Balcells, M. E. (2025). Anlisis Bayesiano de un ensayo controlado aleatorizado: aspectos matemticos y clnicos. Revista chilena de infectologa.
Kabacoff, R. (2022). R in action, data analysis and graphics with R. Estados Unidos: Manning Publications .
Polotskaya, K., Muoz Valencia, C. s., Rabasa, A., & Quesada, J. A. (2024). Bayesian Networks for the Diagnosis and Prognosis of Diseases: A Scoping Review.
Rumbaut Rangel, D., & Mariduea Arroyave, M. R. (2024). Modelo predictivo de enfermedades cardiovasculares basado en Redes Bayesianas. Dialnet.
Teng, J., Zhang, H., Liu, W., Shu, X., & Ye, F. (2022). A Dynamic Bayesian Model for Breast Cancer Survival Prediction. IEEE Journal of Biomedical and Health Informatics.
Vera Damin, D. V., & Altamirano Mego, G. (27 de Diciembre de 2024). Repositorio Institucional UNPRG. Obtenido de https://repositorio.unprg.edu.pe/handle/20.500.12893/14418
Escobar Castellanos, B., & Martnez Martnez, M. G. (2018). Factores de riesgo de cadas en el adulto mayor. Universidad de Sonora. Recuperado de https://www.researchgate.net/publication/327881264_Factores_de_riesgo_de_caidas_en_el_adul to_mayor
Saavedra Lpez, D., Leyva Vzquez, M., & Armentero Moreno, Y. (2013). Representacin del conocimiento causal. Aplicaciones en la medicina. IX Congreso
Internacional Informtica en Salud. Universidad de las Ciencias Informticas. https://eventos.sld.cu/informaticasalud2013/.
2025 por los autores. Este artculo es de acceso abierto y distribuido segn los trminos y condiciones de la licencia Creative Commons Atribucin-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0)
(https://creativecommons.org/licenses/by-nc-sa/4.0/).
Enlaces de Referencia
- Por el momento, no existen enlaces de referencia
Polo del Conocimiento
Revista Científico-Académica Multidisciplinaria
ISSN: 2550-682X
Casa Editora del Polo
Manta - Ecuador
Dirección: Ciudadela El Palmar, II Etapa, Manta - Manabí - Ecuador.
Código Postal: 130801
Teléfonos: 056051775/0991871420
Email: polodelconocimientorevista@gmail.com / director@polodelconocimiento.com
URL: https://www.polodelconocimiento.com/














