Evaluacin de la severidad de accidentes de trfico de Autocares y Autobuses en Argentina y Espaa mediante el estudio matemtico con rboles de clasificacin

 

Evaluation of the severity of traffic accidents of Coaches and Buses in Argentina and Spain by means of the mathematical study with classification trees

 

Avaliao da gravidade dos acidentes de trnsito de Autocarros e Autocarros na Argentina e Espanha por meio do estudo matemtico com rvores de classificao

 

Blanca del Valle Arenas-Ramrez III

blanca.arenas@upm.es

https://orcid.org/0000-0003-0446-6417

 

 
 

 

 

 

 

 

 

 

 

 

 

 

 


Correspondencia: victormtv@gmail.com

 

Ciencias Tcnicas y Aplicadas

Artculos de investigacin

 

*Recibido: 16 de julio de 2021 *Aceptado: 30 de agosto de 2021 * Publicado: 30 de septiembre de 2021

 

        I.            Escuela Superior Politcnica de Chimborazo, Sede Morona Santiago, Macas - Ecuador.

     II.            Universidad Politcnica de Madrid INSIA- UPM, Madrid Espaa.

   III.            Universidad Politcnica de Madrid-Espaa.

 


Resumen

El transporte colectivo de personas en autobs y autocar es muy importante en la mayora los pases de Iberoamrica, y los accidentes de trfico con implicacin de estos vehculos involucran prdidas elevadas si se consideran las prdidas humanas, materiales y productividad de las empresas del transporte. En cualquier pas del mundo en el que stos eventos ocurren, tienen un alto impacto meditico y avivan la preocupacin por la mejora de la seguridad y la proteccin de los ocupantes. En la regin de Amrica del Sur, la mejora de la seguridad vial necesita alcanzar un mayor nivel de desarrollo de los sistemas de informacin que permitan llevar a cabo una investigacin detallada y en profundidad. Para suplir la escasez de informacin detallada de los accidentes con implicacin de autobuses y autoca transporte colectivo de personas (AT-TCP), cinco equipos de investigadores de universidades: UPM de Espaa, UPS de Ecuador y UTN, UNSa y UNTDF de Argentina, participaron en un proyecto cooperativo de investigacin de accidentes en transporte co de pasajeros (COOPERAXVII-12) ocurridos en los tres pases y desarrollaron metodologa de anlisis de datos tomados de publicaciones en medios de comunicacin y datos oficiales disponibles, enfocado en el desarrollo de estudios de patrones y aplicacin de modelos estadsticos.

En este trabajo se evalu la severidad de una sub-muestra de 94 accidentes AT-TCP ocurridos en Argentina y Espaa entre los aos 2017 y 2018. Los datos fueron analizados con modelos de minera de datos: rboles de clasificacin y bosques aleatorios. Los modelos permiten identificar los factores de influencia en la severidad del accidente y algunos patrones segn el contexto y concurrencia de diferentes factores. De los resultados, se destaca que los accidentes de mayor severidad han ocurrido en vas interurbanas y son de tipo colisin entre vehculos, vuelco sobre la calzada y salidas de la va con desbarranco.

Palabras claves: Severidad; accidentes; rboles de decisin.

 

Abstrac

The collective transport of people by bus and coach is very important in most Latin American countries, and traffic accidents involving these vehicles involve high losses if the human, material and productivity losses of transport companies are considered. In any country in the world in which these events occur, they have a high media impact and fuel concern for the improvement of safety and the protection of the occupants. In the South American region, the improvement of road safety needs to reach a higher level of development of information systems that allow a detailed and in-depth investigation to be carried out. To make up for the scarcity of detailed information on accidents involving buses and buses, collective transport of people (AT-TCP), five teams of researchers from universities: UPM from Spain, UPS from Ecuador and UTN, UNSa and UNTDF from Argentina, participated in a cooperative project for the investigation of accidents in passenger transport (COOPERAXVII-12) that occurred in the three countries and developed a methodology for analyzing data taken from publications in the media and available official data, focused on the development of pattern studies. and application of statistical models.

In this work, the severity of a sub-sample of 94 AT-TCP accidents that occurred in Argentina and Spain between 2017 and 2018 was evaluated. The data were analyzed with data mining models: classification trees and random forests. The models make it possible to identify the factors influencing the severity of the accident and some patterns according to the context and concurrence of different factors. From the results, it stands out that the most severe accidents have occurred on interurban roads and are of the collision type between vehicles, overturning on the road and exits from the road with a ravine.

Keywords: Severity; accidents; decision trees.

 

Resumo

O transporte coletivo de pessoas por nibus muito importante na maioria dos pases latino-americanos, e os acidentes de trnsito envolvendo esses veculos envolvem grandes perdas se consideradas as perdas humanas, materiais e de produtividade das transportadoras. Em qualquer pas do mundo onde esses eventos ocorram, eles tm grande repercusso miditica e alimentam a preocupao com a melhoria da segurana e proteo dos ocupantes. Na regio da Amrica do Sul, a melhoria da segurana viria precisa atingir um nvel mais alto de desenvolvimento de sistemas de informao que permitam uma investigao detalhada e aprofundada. Para suprir a escassez de informaes detalhadas sobre acidentes envolvendo nibus e nibus, transporte coletivo de pessoas (AT-TCP), participaram cinco equipes de pesquisadores de universidades: UPM da Espanha, UPS do Equador e UTN, UNSa e UNTDF da Argentina. em projeto cooperativo de investigao de acidentes no transporte de passageiros (COOPERAXVII-12) ocorrido nos trs pases e desenvolveu metodologia de anlise de dados retirados de publicaes na mdia e de dados oficiais disponveis, com foco no desenvolvimento de estudos de padres. e aplicao de modelos estatsticos.

Neste trabalho, avaliou-se a gravidade de uma subamostra de 94 acidentes AT-TCP ocorridos na Argentina e na Espanha entre 2017 e 2018. Os dados foram analisados ​​com modelos de minerao de dados: rvores de classificao e florestas aleatrias. Os modelos permitem identificar os fatores que influenciam a gravidade do acidente e alguns padres de acordo com o contexto e a simultaneidade dos diferentes fatores. Dos resultados, destaca-se que os acidentes mais graves ocorreram em vias interurbanas e so do tipo coliso entre veculos, capotamento na via e sadas da via com ravina.

Palavras-chave: Severidade; acidentes; rvores de deciso.

 

Introduccin

Los accidentes de trfico que implica autobuses y autocares estn involucrados en todo lugar que exista medios de transporte terrestre y presente en toda clase social, provincia o pas. Dichos sucesos superan los millones en todo el mundo y cada vez va en aumento, lo cual tiene consecuencias graves en el aspecto humano y econmico dentro de la colectividad.

En referencia a prdidas humanas en Espaa, durante el ao 2017, los diferentes miembros policiales notificaron 102.233 accidentes con vctimas. Estos accidentes ocasionaron 1.830 fallecidos (en el momento del accidente o hasta 30 das despus del mismo); adems, 9.546 personas fueron ingresadas en un centro hospitalario y 129.616 resultaron heridas no hospitalizadas. (DGT, 2018)

Sobre la actividad asistencial de las unidades de soporte vital avanzado a accidentes de trfico en Asturias en el ao 2010, indica que en Espaa los accidentes de trfico son la segunda causa de muerte, y la primera dentro de la poblacin juvenil comprendida entre 15 a 29 aos, siendo uno de los principales problemas de Salud Pblica. (Villar Fernndez, 2012)

Segn la Asociacin Civil Luchemos por la vida de Argentina en el ao 2017, reporta accidentes de trfico con 5.420 personas fallecidas (en el lapso de los 30 das posteriores al accidente). Con 6.626 heridos graves hospitalizados; 51.945 con heridas leves.

Argentina reporta:5.472 vctimas fatales; 113.805 heridos, de los cuales 8.174 son graves que requeran hospitalizacin, en un total de 81.592 siniestros ocurridos. Las principales causas de muerte por accidentes de trnsito fueron: la velocidad y el consumo de bebidas alcohlicas. Para los peatones y los conductores, el problema principal es la distraccin. (Anuario estadstico de siniestralidad vial)

 

Fundamentacin

Dentro del mbito de la investigacin de accidentes de trfico de TCP este trabajo tiene como principal utilidad identificar las variables que influyen en la severidad de los accidentes en la cual estn implicados autobuses y autocares en Argentina y Espaa.

El desarrollo de este estudio, que permitirn analizar y extraer de una manera ms profunda los fenmenos causales, y as adoptar las mejores decisiones sobre el origen que incurre y reducir el nivel de accidentabilidad o reducir sus consecuencias.

 

Materiales y mtodos

Metodologa de recoleccin de la informacin

El estudio toma como base el proyecto COOPERA-TCP que estandariz una herramienta de recoleccin de datos de accidentes de trfico de autocares y autobuses (Arenas et al., 2018), y ahora se toma en cuenta vehculos adicionales como microbs, combi, autocar de un piso, microbs y autocar de dos pisos; La recoleccin de datos se realiz entre 2017 2018, relacionados con victimas (heridos graves y fallecidos) en los pases de Argentina y Espaa; para la cual se utiliz la metodologa de bsqueda, localizacin y anlisis de medios de comunicacin masivos. Esta informacin se contrast con las bases de datos disponibles en el pas y la informacin se recogi en el instrumento destinado para la recopilacin de datos en formato digital. En la base disponible para este trabajo se han recogido datos de mas de 200 accidentes ocurridos en Espaa y Argentina, lo cual da a notar la potencialidad de las herramientas propuestas. Siendo uno de los objetivos de este trabajo la evaluacin de la metodologa planteada, con los resultados obtenidos se pretende demostrar que puede ser aplicada a otros colectivos de inters (motos, ciclistas, peatones) en contestos en los que la informacin de accidentes es limitada y poco accesible para estudio de investigacin cientfica. En la figura 1 se presentan los factores que se tienen en cuenta en el formulario del proyecto COOPERA-TCP.

 

 

La muestra de anlisis consta de 94 accidentes de trfico con implicacin de autobuses y autocares y constituye la base de datos que contiene ms de 80 variables. Se ha realizado una seleccin de variables con varios criterios (como evitar repeticin de la informacin, valores nulos o vacos, etc.) resultando del proceso un total de 13 variables explicativas que se han agrupado en 4 grupos: factor infraestructura, vehculo, entorno y factor humano. Con las variables seleccionadas, se desarrollar un modelo de anlisis de la severidad del accidente.

Del conjunto de 4 factores se han seleccionado las variables de mayor importancia mediante Random Forest (RF) considerando su error de clasificacin. Se seleccionan las 13 variables superiores en la clasificacin con las que se elabora un modelo final.

 

Metodologa estadstica para el anlisis

Modelos de bosques aleatorios (Random Forest (RF))

Es una versin sofisticada del procedimiento bagging, sealada por (Breiman, 2001), que replica subconjuntos de registros y elige al azar un subconjunto de las variables de entrada (Hastie, Tibshirani, & Friedman, 2008). Esta metodologa tambin se usa para anlisis de sensibilidad (Grmping, 2009). Adems, se indica que es la tcnica de conjuntos de rboles tienen enfoque clsico o frecuencista, con el algoritmo RF (Random Forest de R Core, 2016). Este algoritmo optimiza la precisin en la clasificacin mediante la incorporacin de aleatoriedad en la construccin de cada clasificador individual. La herramienta indicada se enfoca en la tcnica de aprendizaje automtico estndar denominada rbol de decisiones. Para la seleccin y optimizacin se utilizan dos ndices: criterio de Gini y de clasificacin.

El mecanismo de construccin de RF establece un baremo que prioriza cada variable en la prediccin final. Para ello se calcula el error de la muestra. Para cada variable de la muestra, se intercambia un par de elementos y se calcula el error de la muestra permutada. El resultado debera ser peor que para la muestra original. Este procedimiento se realiza para todos los valores de cada variable y se calcula el promedio. El proceso es realizado para todas las variables. Las variables de menor importancia deberan alterar menos la diferencia entre el error y el error permutado, que las variables importantes.

Mediante la funcin Rpart se analiza el modelo de clasificacin con las 13 variables seleccionadas previamente en RF y se ejecuta la poda del rbol en funcin del % de error relativo y del ndice de complejidad de divisin CP ptimo para generar el rbol de clasificacin final.

Los modelos de rboles de clasificacin es una tcnica de aprendizaje controlado, no paramtrica, de segmentacin binaria, es decir, las particiones se hacen de forma permanente hasta alcanzar un criterio de parada, es decir que el rbol se construye dividiendo los datos repetidamente, en cada nueva divisin los datos son divididos otra vez en dos grupos.

Mutuamente excluyentes. Por lo que se aplican para modelar relaciones entrada salida. El enfoque algortmico ms habitual para el CART creado por (Breiman, Friedman, Stone, & Olshen, 1984) produce de manera inicial un rbol muy grande, para consecutivamente podarlo; es decir, recorta ramas que no incrementen su capacidad predictiva. El grado de poda se define en funcin de un compromiso entre bondad de ajuste y confusin del rbol, o incluyendo tambin criterios de precisin de una validacin cruzada.

La figura 2 muestra un nodo raz o madre, que se divide despus en nodos hijos, y finalmente el procedimiento de particin se aplica a cada nodo hijo por separado, estas divisiones se seleccionan, de modo que la impureza de los grupos hijos sea menor que la del grupo madre, este procedimiento tiene por objetivo, discriminar la respuesta en grupos homogneos, de tal manera que se pueda mantener el rbol relativamente pequeo. (Pillajo et al., 2018).

 

Fig. 2 Descripcin de objetos de un rbol de clasificacin (Zhang / Singer, 2010)

 

Resultados y discusin

Se analizan los datos concernientes a una muestra de 94 accidentes de trfico de autocares y autobuses ocurridos en las carreteras de Argentina y Espaa implicados entre los aos 2013

2018.

 

 

 

 

Tabla 1 Descripcin accidentes de TCP en Argentina y Espaa

 

Se ha encontrado dentro del anlisis en referencia a accidentes de trfico que estn implicados Autocar/Micro que es mayor en Espaa, con un total de 39.36% en comparacin con Argentina que posee el 31.91%. Por otra parte, en lo que concierne a accidentes de trfico que involucra Colectivo/Autobs se ha hallado mayor incidencia en Argentina con el 21.28 % en relacin de Espaa con el 7.45%. Los porcentajes se han tomado en base a los 94 accidentes en los dos pases.

Con respecto a Argentina aparece ms accidentes de trfico en los que estn involucrados Autocar/Micro con el 60% en comparacin con Colectivo/Autobs que posee el 40%. Lo mismo sucede en Espaa que el mayor nmero de accidentes estn implicados Autocar/Micro con el 84%.

Se puede identificar que en cualquier relacin ya sea en funcin de los 94 accidentes o por pas, en Espaa existe mayor nmero de accidentes en referencia a Autocar/Micro.

Se genera dos graficas de rbol de clasificacin (Fig. 3 y 4) para Argentina y Espaa respectivamente, Con respecto a Argentina indica que la variable ms importante es el Tipo de arcn, en segundo lugar el tipo de accidente, tercer lugar el tipo de va y posterior las restantes, mientras que para Espaa la variable ms importante es el Tipo de va, seguido de Tipo de accidente y en tercer lugar Responsable; con lo cual se aprecia que dentro de los tres primeros lugares estn presentes en los dos pases las variables Tipo de accidente y Tipo de va, lo cual indica qu e estos dos son la factores que ms inciden dentro de la severidad de accidentes de trfico en autocares y autobuses.

 

 

 

 

Figura 3. rbol de severidad de Argentina

 

En sntesis, en Argentina cuando el tipo de arcn es natural, o a su vez, cuando est en mal estado, pavimentado u otros, segn el tipo de accidente es por alcance, e implicado en una interseccin resultara una alta lesividad.

Figura 4. rbol de severidad de Espaa

 

Para finalizar, en Espaa cuando el tipo de va es autopista o carretera de doble sentido y tipo de accidente es por alcance al auto bus, salidad de la va con desbarranco, salida de la va u vuelco a severidad es alta, similar a que si el tipo de accidentes, es por alcance del autobs, choque o vuelco sobre la calzada, ambos vehculos implicados son responsables y el estado de la va es mojado.

 

 

 

Referencias

Libro

1.      HOYLE, B.S. y KNOWLES, R.D. (1992). Modern Geography.BelhavenPress, London.

Artculo de revista

2.      SOLOMON,K.T. (1978).Sand in concrete mixe.Australian Road Research7(3),pp2730.

 

Un captulo de un autor recogido en un libro editado por otros

3.      EULER, G.W. (1992). Intelligent vehicle-highway systems. En: J.L. PLINE (ed.) Traffic Engineering Handbook, 4th edition. Prentice Hall, Englewood Cliffs, N.J. pp. 448-463.

Ponencia en Congreso

4.      OBRIEN, A. (1992). Safety audit for rural intersections. Workshop on Road Safety Audit, 14-16 April 1993, ponencia 6. Monash Transport Group, Clayton, Victoria.

Series

5.      DEMPSEY, B. Climatic Effects of Airport Pavement Systems: State of the Art. Report DOT-RD-75-196. FHWA. U.S. Department of Transportation, 1976.

 

 

 

2021 por los autores. Este artculo es de acceso abierto y distribuido segn los trminos y condiciones de la licencia Creative Commons Atribucin-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0)

(https://creativecommons.org/licenses/by-nc-sa/4.0/)

Enlaces de Referencia

  • Por el momento, no existen enlaces de referencia
';





Polo del Conocimiento              

Revista Científico-Académica Multidisciplinaria

ISSN: 2550-682X

Casa Editora del Polo                                                 

Manta - Ecuador       

Dirección: Ciudadela El Palmar, II Etapa,  Manta - Manabí - Ecuador.

Código Postal: 130801

Teléfonos: 056051775/0991871420

Email: polodelconocimientorevista@gmail.com / director@polodelconocimiento.com

URL: https://www.polodelconocimiento.com/