Evaluacin de la
severidad de accidentes de trfico de Autocares y Autobuses en Argentina y Espaa
mediante el estudio matemtico con rboles de clasificacin
Evaluation of the severity of traffic accidents of Coaches and Buses in
Argentina and Spain by means of the mathematical study with classification
trees
Avaliao da gravidade dos acidentes
de trnsito de Autocarros e
Autocarros na Argentina e Espanha por meio do estudo matemtico com rvores de classificao
Correspondencia: victormtv@gmail.com
Ciencias
Tcnicas y Aplicadas
Artculos
de investigacin
*Recibido: 16 de julio de 2021
*Aceptado: 30 de agosto de 2021 * Publicado: 30 de septiembre de 2021
I.
Escuela Superior Politcnica de Chimborazo, Sede Morona Santiago, Macas
- Ecuador.
II.
Universidad Politcnica de Madrid INSIA- UPM, Madrid Espaa.
III.
Universidad Politcnica de Madrid-Espaa.
Resumen
El transporte
colectivo de personas en autobs y autocar es muy importante en la mayora los
pases de Iberoamrica, y los accidentes de trfico con implicacin de estos
vehculos involucran prdidas elevadas si se consideran las prdidas humanas,
materiales y productividad de las empresas del transporte. En cualquier pas
del mundo en el que stos eventos ocurren, tienen un alto impacto meditico y
avivan la preocupacin por la mejora de la seguridad y la proteccin de los
ocupantes. En la regin de Amrica del Sur, la mejora de la seguridad vial
necesita alcanzar un mayor nivel de desarrollo de los sistemas de informacin
que permitan llevar a cabo una investigacin detallada y en profundidad. Para
suplir la escasez de informacin detallada de los accidentes con implicacin de
autobuses y autoca transporte colectivo de personas
(AT-TCP), cinco equipos de investigadores de universidades: UPM de Espaa, UPS
de Ecuador y UTN, UNSa y UNTDF de Argentina,
participaron en un proyecto cooperativo de investigacin de accidentes en
transporte co de pasajeros (COOPERAXVII-12) ocurridos
en los tres pases y desarrollaron metodologa de anlisis de datos tomados de
publicaciones en medios de comunicacin y datos oficiales disponibles, enfocado
en el desarrollo de estudios de patrones y aplicacin de modelos estadsticos.
En este trabajo se
evalu la severidad de una sub-muestra de 94 accidentes AT-TCP ocurridos en
Argentina y Espaa entre los aos 2017 y 2018. Los datos fueron analizados con
modelos de minera de datos: rboles de clasificacin y bosques aleatorios. Los
modelos permiten identificar los factores de influencia en la severidad del
accidente y algunos patrones segn el contexto y concurrencia de diferentes
factores. De los resultados, se destaca que los accidentes de mayor severidad
han ocurrido en vas interurbanas y son de tipo colisin entre vehculos,
vuelco sobre la calzada y salidas de la va con desbarranco.
Palabras claves: Severidad; accidentes; rboles de decisin.
Abstrac
The collective
transport of people by bus and coach is very important in most Latin American
countries, and traffic accidents involving these vehicles involve high losses if
the human, material and productivity losses of transport companies are
considered. In any country in the world in which these events occur, they have
a high media impact and fuel concern for the improvement of safety and the
protection of the occupants. In the South American region, the improvement of
road safety needs to reach a higher level of development of information systems
that allow a detailed and in-depth investigation to be carried out. To make up
for the scarcity of detailed information on accidents involving buses and
buses, collective transport of people (AT-TCP), five teams of researchers from
universities: UPM from Spain, UPS from Ecuador and UTN, UNSa
and UNTDF from Argentina, participated in a cooperative project for the
investigation of accidents in passenger transport (COOPERAXVII-12) that
occurred in the three countries and developed a methodology for analyzing data
taken from publications in the media and available official data, focused on
the development of pattern studies. and application of statistical models.
In this work, the
severity of a sub-sample of 94 AT-TCP accidents that occurred in Argentina and
Spain between 2017 and 2018 was evaluated. The data were analyzed with data
mining models: classification trees and random forests. The models make it
possible to identify the factors influencing the severity of the accident and
some patterns according to the context and concurrence of different factors.
From the results, it stands out that the most severe accidents have occurred on
interurban roads and are of the collision type between vehicles, overturning on
the road and exits from the road with a ravine.
Keywords: Severity; accidents; decision trees.
Resumo
O transporte coletivo
de pessoas por nibus muito importante na maioria dos pases latino-americanos, e os acidentes de trnsito envolvendo esses veculos envolvem grandes perdas se consideradas as perdas
humanas, materiais e de produtividade
das transportadoras. Em qualquer
pas do mundo onde esses
eventos ocorram, eles tm grande
repercusso miditica e alimentam a preocupao com a melhoria da segurana e proteo dos
ocupantes. Na regio da
Amrica do Sul, a melhoria da segurana
viria precisa atingir um nvel mais alto de desenvolvimento de sistemas de informao
que permitam uma investigao detalhada e aprofundada. Para suprir a escassez de informaes detalhadas sobre acidentes envolvendo nibus e nibus, transporte coletivo de pessoas (AT-TCP), participaram
cinco equipes de pesquisadores de universidades: UPM
da Espanha, UPS do Equador
e UTN, UNSa e UNTDF da Argentina. em
projeto cooperativo de investigao
de acidentes no transporte de passageiros
(COOPERAXVII-12) ocorrido nos trs
pases e desenvolveu metodologia
de anlise de dados retirados de publicaes
na mdia e de dados oficiais disponveis, com foco no desenvolvimento de estudos de padres. e aplicao de modelos estatsticos.
Neste trabalho, avaliou-se a gravidade de uma subamostra de 94 acidentes AT-TCP ocorridos na Argentina e na Espanha entre 2017 e 2018. Os dados foram
analisados com
modelos de minerao de dados: rvores
de classificao e florestas aleatrias.
Os modelos permitem identificar os fatores que influenciam a gravidade do acidente e alguns padres de acordo com o contexto e a simultaneidade dos diferentes fatores.
Dos resultados, destaca-se que os acidentes
mais graves ocorreram em vias interurbanas e so do tipo coliso entre veculos, capotamento na via e sadas
da via com ravina.
Palavras-chave: Severidade; acidentes; rvores de deciso.
Introduccin
Los accidentes de trfico que implica
autobuses y autocares estn involucrados en todo lugar que exista medios de
transporte terrestre y presente en toda clase social, provincia o pas. Dichos
sucesos superan los millones en todo el mundo y cada vez va en aumento, lo cual
tiene consecuencias graves en el aspecto humano y econmico dentro de la
colectividad.
En
referencia a prdidas humanas en Espaa, durante el ao 2017, los diferentes
miembros policiales notificaron 102.233 accidentes con vctimas. Estos
accidentes ocasionaron 1.830 fallecidos (en el momento del accidente o hasta 30
das despus del mismo); adems, 9.546 personas fueron ingresadas en un centro
hospitalario y 129.616 resultaron heridas no hospitalizadas. (DGT, 2018)
Sobre la actividad asistencial de las unidades
de soporte vital avanzado a accidentes de trfico en Asturias en el ao 2010,
indica que en Espaa los accidentes de trfico son la segunda causa de muerte,
y la primera dentro de la poblacin juvenil comprendida entre 15 a 29 aos,
siendo uno de los principales problemas de Salud Pblica. (Villar Fernndez,
2012)
Segn
la Asociacin Civil Luchemos por la vida de Argentina en el ao 2017, reporta
accidentes de trfico con 5.420 personas fallecidas (en el lapso de los 30 das
posteriores al accidente). Con 6.626
heridos graves hospitalizados; 51.945 con heridas leves.
Argentina reporta:5.472 vctimas fatales;
113.805 heridos, de los cuales 8.174 son graves que requeran hospitalizacin,
en un total de 81.592 siniestros ocurridos. Las principales causas de muerte
por accidentes de trnsito fueron: la velocidad y el consumo de bebidas
alcohlicas. Para los peatones y los conductores, el problema principal es la
distraccin. (Anuario estadstico de siniestralidad vial)
Fundamentacin
Dentro del mbito de la investigacin de
accidentes de trfico de TCP este trabajo tiene como principal utilidad
identificar las variables que influyen en la severidad de los accidentes en la
cual estn implicados autobuses y autocares en Argentina y Espaa.
El desarrollo de este estudio, que permitirn
analizar y extraer de una manera ms profunda los fenmenos causales, y as
adoptar las mejores decisiones sobre el origen que incurre y reducir el nivel
de accidentabilidad o reducir sus consecuencias.
Materiales y mtodos
Metodologa de
recoleccin de la informacin
El estudio toma como base el proyecto
COOPERA-TCP que estandariz una herramienta de recoleccin de datos de
accidentes de trfico de autocares y autobuses (Arenas et al., 2018), y ahora
se toma en cuenta vehculos adicionales como microbs, combi, autocar de un
piso, microbs y autocar de dos pisos; La recoleccin de datos se realiz entre
2017 2018, relacionados con victimas (heridos graves y fallecidos) en los
pases de Argentina y Espaa; para la cual se utiliz la metodologa de
bsqueda, localizacin y anlisis de medios de comunicacin masivos. Esta
informacin se contrast con las bases de datos disponibles en el pas y la
informacin se recogi en el instrumento destinado para la recopilacin de
datos en formato digital. En la base disponible para este trabajo se han
recogido datos de mas de 200 accidentes ocurridos en
Espaa y Argentina, lo cual da a notar la potencialidad de las herramientas
propuestas. Siendo uno de los objetivos de este trabajo la evaluacin de la
metodologa planteada, con los resultados obtenidos se pretende demostrar que
puede ser aplicada a otros colectivos de inters (motos, ciclistas, peatones)
en contestos en los que la informacin de accidentes es limitada y poco
accesible para estudio de investigacin cientfica. En la figura 1 se presentan
los factores que se tienen en cuenta en el formulario del proyecto COOPERA-TCP.
La muestra de anlisis consta de 94 accidentes
de trfico con implicacin de autobuses y autocares y constituye la base de
datos que contiene ms de 80 variables. Se ha realizado una seleccin de
variables con varios criterios (como evitar repeticin de la informacin,
valores nulos o vacos, etc.) resultando del proceso un total de 13 variables
explicativas que se han agrupado en 4 grupos:
factor infraestructura, vehculo, entorno y factor humano. Con las
variables seleccionadas, se desarrollar un modelo de anlisis de la severidad
del accidente.
Del conjunto de 4 factores se han seleccionado
las variables de mayor importancia mediante Random Forest (RF) considerando su error de clasificacin. Se
seleccionan las 13 variables superiores en la clasificacin con las que se
elabora un modelo final.
Metodologa
estadstica para el anlisis
Modelos de bosques
aleatorios (Random Forest
(RF))
Es una versin sofisticada del procedimiento bagging, sealada por (Breiman,
2001), que replica subconjuntos de registros y elige al azar un subconjunto de
las variables de entrada (Hastie, Tibshirani,
& Friedman, 2008). Esta metodologa tambin se usa para anlisis de
sensibilidad (Grmping, 2009). Adems, se indica que
es la tcnica de conjuntos de rboles tienen enfoque clsico o frecuencista, con el algoritmo RF (Random
Forest de R Core, 2016).
Este algoritmo optimiza la precisin en la clasificacin mediante la
incorporacin de aleatoriedad en la construccin de cada clasificador
individual. La herramienta indicada se enfoca en la tcnica de aprendizaje
automtico estndar denominada rbol de decisiones. Para la seleccin y
optimizacin se utilizan dos ndices: criterio de Gini
y de clasificacin.
El
mecanismo de construccin de RF establece un baremo que prioriza cada variable
en la prediccin final. Para ello se calcula el error de la muestra. Para cada
variable de la muestra, se intercambia un par de elementos y se calcula el
error de la muestra permutada. El resultado debera ser peor que para la
muestra original. Este procedimiento se realiza para todos los valores de cada
variable y se calcula el promedio. El proceso es realizado para todas las variables.
Las variables de menor importancia deberan alterar menos la diferencia entre
el error y el error permutado, que las variables importantes.
Mediante la funcin Rpart
se analiza el modelo de clasificacin con las 13 variables seleccionadas previamente
en RF y se ejecuta la poda del rbol en funcin del % de error relativo y del
ndice de complejidad de divisin CP ptimo para generar el rbol de
clasificacin final.
Los modelos de rboles de clasificacin es una
tcnica de aprendizaje controlado, no paramtrica, de segmentacin binaria, es
decir, las particiones se hacen de forma permanente hasta alcanzar un criterio
de parada, es decir que el rbol se construye dividiendo los datos
repetidamente, en cada nueva divisin los datos son divididos otra vez en dos
grupos.
Mutuamente excluyentes. Por lo que se aplican
para modelar relaciones entrada salida. El enfoque algortmico ms habitual
para el CART creado por (Breiman, Friedman, Stone,
& Olshen, 1984) produce de manera inicial un
rbol muy grande, para consecutivamente podarlo; es decir, recorta ramas que no
incrementen su capacidad predictiva. El grado de poda se define en funcin de
un compromiso entre bondad de ajuste y confusin del rbol, o incluyendo
tambin criterios de precisin de una validacin cruzada.
La
figura 2 muestra un nodo raz o madre, que se divide despus en nodos hijos, y
finalmente el procedimiento de particin se aplica a cada nodo hijo por
separado, estas divisiones se seleccionan, de modo que la impureza de los
grupos hijos sea menor que la del grupo madre, este procedimiento tiene por
objetivo, discriminar la respuesta en grupos homogneos, de tal manera que se
pueda mantener el rbol relativamente pequeo. (Pillajo
et al., 2018).
Fig. 2 Descripcin de objetos de un rbol de
clasificacin (Zhang / Singer, 2010)
Resultados y
discusin
Se analizan los datos concernientes a una
muestra de 94 accidentes de trfico de autocares y autobuses ocurridos en las
carreteras de Argentina y Espaa implicados entre los aos 2013
2018.
Tabla 1 Descripcin accidentes de TCP en Argentina y
Espaa
Se ha encontrado dentro del anlisis en
referencia a accidentes de trfico que estn implicados Autocar/Micro que es
mayor en Espaa, con un total de 39.36% en comparacin con Argentina que posee
el 31.91%. Por otra parte, en lo que concierne a accidentes de trfico que
involucra Colectivo/Autobs se ha hallado mayor incidencia en Argentina con el
21.28 % en relacin de Espaa con el 7.45%. Los porcentajes se han tomado en
base a los 94 accidentes en los dos pases.
Con
respecto a Argentina aparece ms accidentes de trfico en los que estn
involucrados Autocar/Micro con el 60% en comparacin con Colectivo/Autobs que
posee el 40%. Lo mismo sucede en Espaa que el mayor nmero de accidentes estn
implicados Autocar/Micro con el 84%.
Se puede identificar que en cualquier relacin
ya sea en funcin de los 94 accidentes o por pas, en Espaa existe mayor
nmero de accidentes en referencia a Autocar/Micro.
Se genera dos graficas de rbol de
clasificacin (Fig. 3 y 4) para Argentina y Espaa respectivamente, Con
respecto a Argentina indica que la variable ms importante es el Tipo de arcn,
en segundo lugar el tipo de accidente, tercer lugar el tipo de va y posterior
las restantes, mientras que para Espaa la variable ms importante es el Tipo
de va, seguido de Tipo de accidente y en tercer lugar Responsable; con lo cual
se aprecia que dentro de los tres primeros lugares estn presentes en los dos
pases las variables Tipo de accidente y Tipo de va, lo cual indica qu e estos dos son la factores que ms inciden dentro de la
severidad de accidentes de trfico en autocares y autobuses.
Figura 3. rbol de severidad de Argentina
En sntesis, en Argentina cuando el tipo de
arcn es natural, o a su vez, cuando est en mal estado, pavimentado u otros,
segn el tipo de accidente es por alcance, e implicado en una interseccin
resultara una alta lesividad.
Figura 4. rbol de severidad de Espaa
Para finalizar, en Espaa cuando el tipo de
va es autopista o carretera de doble sentido y tipo de accidente es por
alcance al auto bus, salidad de la va con
desbarranco, salida de la va u vuelco a severidad es alta, similar a que si el
tipo de accidentes, es por alcance del autobs, choque o vuelco sobre la
calzada, ambos vehculos implicados son responsables y el estado de la va es
mojado.
Referencias
Libro
1.
HOYLE, B.S. y
KNOWLES, R.D. (1992). Modern Geography.BelhavenPress,
London.
Artculo de revista
2.
SOLOMON,K.T.
(1978).Sand in concrete mixe.Australian Road
Research7(3),pp2730.
Un captulo de un autor recogido en un
libro editado por otros
3.
EULER, G.W. (1992).
Intelligent vehicle-highway systems. En: J.L. PLINE (ed.) Traffic Engineering Handbook, 4th edition. Prentice Hall, Englewood
Cliffs, N.J. pp. 448-463.
Ponencia en Congreso
4.
OBRIEN, A. (1992).
Safety audit for rural intersections. Workshop on Road Safety Audit, 14-16
April 1993, ponencia 6. Monash
Transport Group, Clayton, Victoria.
Series
5.
DEMPSEY, B.
Climatic Effects of Airport Pavement Systems: State of the Art. Report
DOT-RD-75-196. FHWA. U.S. Department of Transportation, 1976.
2021 por los autores. Este artculo es de acceso abierto y distribuido segn
los trminos y condiciones de la licencia Creative Commons Atribucin-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0)
(https://creativecommons.org/licenses/by-nc-sa/4.0/)
Enlaces de Referencia
- Por el momento, no existen enlaces de referencia
Polo del Conocimiento
Revista Científico-Académica Multidisciplinaria
ISSN: 2550-682X
Casa Editora del Polo
Manta - Ecuador
Dirección: Ciudadela El Palmar, II Etapa, Manta - Manabí - Ecuador.
Código Postal: 130801
Teléfonos: 056051775/0991871420
Email: polodelconocimientorevista@gmail.com / director@polodelconocimiento.com
URL: https://www.polodelconocimiento.com/