Data Mart para los estndares del componente estudiantado del modelo de evaluacin externa CACES
Data Mart for the standards of the student component of the CACES external assessment model
Data Mart para os padres do componente do aluno do modelo de avaliao externa CACES
Telmo Ramiro Vintimilla-Rodrguez I
telmovintimilla@ucacue.edu.ec
https://orcid.org/0000-0002-3326-5887
Martin Geovanny Zhindn-Mora II
mgzhindonm@ucacue.edu.ec
https://orcid.org/0000-0003-4475-830X
Correspondencia: telmovintimilla@ucacue.edu.ec
Ciencias tcnicas y aplicadas
Artculo de investigacin
*Recibido: 13 de septiembre de 2020 *Aceptado: 09 de octubre de 2020 * Publicado: 06 de noviembre de 2020
I. Ingeniero de Sistemas, Jefatura de Posgrados, Universidad Catlica de Cuenca, Cuenca, Ecuador.
II. Ingeniero de Sistemas, Jefe de Tecnologas de la Informacin, Universidad Catlica de Cuenca, Cuenca, Ecuador.
Resumen
El sector empresarial, tradicionalmente ha considerado la incorporacin de tecnologa como herramienta e instrumento para la automatizacin de procesos, con el objetivo de que esta sirva como apoyo y soporte operacional. Sin embargo, esta adopcin tecnolgica puede ampliarse, planteando soluciones estratgicas como resultado del anlisis de datos y de la consecuente generacin de conocimiento. Un adecuado estudio y anlisis de los datos potenciar los procesos acadmicos y administrativos mejorando la calidad de los mismos y por consiguiente en la obtencin de mejores resultados en los procesos de evaluacin externa o de autoevaluacin de la Universidad Catlica de Cuenca. El objetivo del Data Mart es analizar los datos del Sistema de informacin institucional, aplicando las frmulas del modelo de evaluacin externa, que permita una toma de decisiones estratgicamente efectivas, sobre los indicadores del componente estudiantado: Tasa de Permanencia del Estudiantado y Tasa de Titulacin de Grado. Se aplic la arquitectura DW/BI de Ralph Kimball, mediante la ejecucin de los pasos establecidos en el diagrama del ciclo de vida, que describe la secuencia de las tareas que se deben realizar para implementacin exitosa de un sistema Data Warehouse. En lo correspondiente a al indicador de tasa de permanencia del estudiantado, en los ltimos cuatro perodos acadmicos culminados a nivel institucional se obtuvo un promedio ponderado del 63,62%, es decir que aproximadamente, del total de estudiantes nuevos que ingresan en cada periodo, dos tercios continan estudiando en la misma carrera dos aos despus de su primera matrcula. Adicionalmente, podemos destacar un crecimiento de 4.51% en el porcentaje de tasa de permanencia, entre los periodos que iniciaron en septiembre de 2016 y marzo 2018; as tambin, un aumento en el nmero de estudiante de cohorte, correspondiente a un promedio de 23.87% anual. En el indicador tasa de titulacin de grado, de un total de 4.863 estudiantes pertenecientes a la cohorte 2010 se graduaron 1.673, de los cuales nicamente 1.488 son considerados para el clculo del indicador, obteniendo un 27.31% en su desempeo. Es evidente que el uso de estas herramientas permitir obtener una mirada distinta de los procesos relacionados con los indicadores de desempeo analizados, en los cuales se ejecutarn acciones que permitan mejorar estratgicamente sus resultados, adems de traducirse en una mejora en cuanto a la valoracin de los procesos de evaluacin externa.
Palabras claves: Inteligencia de negocios; analtica de datos; data warehouse; almacn de datos; data mart; modelo de evaluacin.
Abstract
The business sector has traditionally considered the incorporation of technology as a tool and instrument for the automation of processes, with the aim that it serves as operational support and support. However, this technological adoption can be expanded, proposing strategic solutions as a result of data analysis and the consequent generation of knowledge. An adequate study and analysis of the data will enhance the academic and administrative processes, improving their quality and, consequently, obtaining better results in the external evaluation or self-evaluation processes of the Catholic University of Cuenca. The objective of the Data Mart is to analyze the data of the Institutional Information System, applying the formulas of the external evaluation model, which allows strategically effective decision-making, on the indicators of the student component: Student Permanence Rate and Graduate Degree Rate. Degree. Ralph Kimball's DW / BI architecture was applied, by executing the steps established in the life cycle diagram, which describes the sequence of tasks that must be performed for a successful implementation of a Data Warehouse system. Regarding the indicator of the rate of permanence of the student body, in the last four academic periods completed at the institutional level, a weighted average of 63.62% was obtained, that is, approximately, of the total of new students who enter each period, two thirds continue studying in the same career two years after their first enrollment. Additionally, we can highlight a growth of 4.51% in the percentage of permanence rate, between the periods that began in September 2016 and March 2018; also, an increase in the number of students in the cohort, corresponding to an annual average of 23.87%. In the degree graduation rate indicator, out of a total of 4,863 students belonging to the 2010 cohort, 1,673 graduated, of which only 1,488 are considered for the calculation of the indicator, obtaining 27.31% in their performance. It is evident that the use of these tools will allow obtaining a different view of the processes related to the performance indicators analyzed, in which actions will be carried out that allow to strategically improve their results, in addition to translating into an improvement in terms of the assessment of the results. external evaluation processes.
Keywords: Business intelligence; data analytics; data warehouse; data warehouse; data mart; evaluation model.
Resumo
O setor empresarial tem tradicionalmente considerado a incorporao da tecnologia como ferramenta e instrumento para a automao de processos, com o objetivo de servir de suporte e suporte operacional. Porm, essa adoo tecnolgica pode ser ampliada, propondo-se solues estratgicas a partir da anlise dos dados e consequente gerao de conhecimento. Um estudo e anlise adequados dos dados iro potenciar os processos acadmicos e administrativos, melhorando a sua qualidade e, consequentemente, obtendo melhores resultados nos processos de avaliao externa ou autoavaliao da Universidade Catlica de Cuenca. O objetivo do Data Mart analisar os dados do Sistema de Informao Institucional, aplicando as frmulas do modelo de avaliao externa, que permite uma tomada de deciso estrategicamente eficaz, sobre os indicadores da componente discente: Taxa de Permanncia de Alunos e Taxa de Graduao. Grau. Foi aplicada a arquitetura DW / BI de Ralph Kimball, executando as etapas estabelecidas no diagrama de ciclo de vida, que descreve a seqncia de tarefas que devem ser realizadas para uma implementao bem-sucedida de um sistema de Data Warehouse. Quanto ao indicador da taxa de permanncia do corpo discente, nos ltimos quatro perodos letivos cumpridos a nvel institucional, obteve-se uma mdia ponderada de 63,62%, ou seja, aproximadamente, do total de novos alunos que ingressam em cada perodo, dois teros continuam estudando na mesma carreira dois anos aps a primeira matrcula. Adicionalmente, podemos destacar um crescimento de 4,51% no percentual de taxa de permanncia, entre os perodos iniciados em setembro de 2016 e maro de 2018; tambm, um aumento no nmero de alunos da coorte, correspondendo a uma mdia anual de 23,87%. No indicador taxa de graduao, de um total de 4.863 alunos pertencentes coorte de 2010, 1.673 concluram, dos quais apenas 1.488 so considerados para o clculo do indicador, obtendo 27,31% no desempenho. evidente que a utilizao destas ferramentas permitir obter uma viso diferenciada dos processos relacionados com os indicadores de desempenho analisados, nos quais sero realizadas aes que permitem melhorar estrategicamente os seus resultados, para alm de se traduzirem numa melhoria ao nvel da avaliao dos resultados. processos de avaliao externa.
Palavras-chave: Business intelligence; anlise de dados; armazm de dados; Armazem de dados; data mart; modelo de avaliao.
Introduccin
El anlisis de datos e informacin para apoyar los procesos estratgicos y de toma de decisiones efectiva es una actividad fundamental en la presente transformacin tecnolgica empresarial. Las grandes cantidades de informacin disponible, as como su constante incremento y su disponibilidad a travs de los sistemas informticos transaccionales, constituyen uno de los activos ms valiosos para la institucin. Concomitante a esto, por el volumen de los datos, se torna en uno de los mayores inconvenientes al momento de identificar la informacin relevante que influye directamente en los indicadores de desempeo de los procesos estratgicos, as como los requerimientos tecnolgicos necesarios para la manipulacin de altos volmenes de datos.
El sector empresarial, tradicionalmente ha considerado la incorporacin de tecnologa como herramienta e instrumento para la automatizacin de procesos, con el objetivo de que esta sirva como apoyo y soporte operacional. Sin embargo, esta adopcin tecnolgica puede ampliarse, planteando soluciones estratgicas como resultado del anlisis de datos y de la consecuente generacin de conocimiento. Para ello, es importante el uso de herramientas y aplicaciones que permitan realizar este proceso, orientadas a la extraccin, transformacin, limpieza y carga de la informacin, gestin de repositorios y bases de datos, Data Warehouse y Data Mart; y, aplicaciones de Business Intelligence (BI).
Un Data Mart se define como la aplicacin de un proceso de Data Warehouse con un alcance limitado y definido, orientado a un problema o proceso en particular [1]. Un adecuado estudio y anlisis de los datos potenciar los procesos acadmicos y administrativos mejorando la calidad de los mismos y por consiguiente en la obtencin de mejores resultados en los procesos de evaluacin externa o de autoevaluacin de la Universidad Catlica de Cuenca.
El modelo de Evaluacin de Universidades y Escuelas Politcnicas, es la herramienta metodolgica de evaluacin que utiliza el Consejo de Aseguramiento de la Calidad de la Educacin Superior [2], con el fin de medir y valorar las condiciones institucionales para el ejercicio de las funciones sustantivas (Academia, Investigacin e Innovacin y Vinculacin con la Sociedad), de las Instituciones de Educacin Superior (IES), en comparacin con altos estndares de calidad.
El modelo aplica frmulas en funcin del tiempo, por lo que se debe tener una planificacin estratgica que considere realizar acciones inmediatas y obtener resultados a largo plazo, que permitan cumplir con los estndares del modelo. El proceso de evaluacin institucional articula aspectos acadmicos y administrativos, donde las variables utilizadas para el clculo de los indicadores cuantitativos, afectan directa o indirectamente los resultados de indicadores de las otras funciones sustantivas.
La evaluacin de las Instituciones de Educacin Superior, es un proceso que obedece a parmetros establecidos en ciertos indicadores que se someten a la aplicacin del modelo de evaluacin externa, esto permite que varios aspectos a verificar por las entidades de control, sean controlables y puedan ser reforzados a travs de acciones estratgicas emprendidas por la institucin.
Se debe aprovechar la especificidad metodolgica expresada en el modelo de evaluacin, para fortalecer estratgicamente las condiciones institucionales, para el ejercicio de las funciones sustantivas de la educacin. Una toma de decisiones efectiva, en el momento oportuno, garantizar un impacto positivo y como resultado una valoracin alta en el cumplimiento de los estndares de calidad.
Conocer y analizar la realidad institucional, es un paso muy importante en la toma de decisiones, pero mucho ms relevante es realizar acciones en el momento adecuado, de forma que el impacto sea evidente y significativo en la valoracin de los indicadores, es por ello que un modelo de anlisis predictivo permitir planteamiento de escenarios para optimizar los recursos que la IES debe invertir, para obtener los mejores resultados.
Metodologa
Este proyecto de Data Mart se desarroll mediante la implementacin de la arquitectura DW/BI de Ralph Kimball [3], mediante la ejecucin de los pasos establecidos en el diagrama del ciclo de vida de la Ilustracin 1, planteado por el mismo autor [4], el cual presenta una hoja de ruta con la secuencia de las tareas que se deben realizar para implementacin exitosa de un sistema Data Warehouse.
Ilustracin 1: Diagrama del ciclo de vida de la arquitectura DW/BI Kimball[4]
Planificacin y gestin del proyecto
El objetivo del Data Mart es analizar los datos del Sistema de informacin institucional, aplicando las frmulas del modelo de evaluacin externa, que permita una toma de decisiones estratgicamente efectivas, sobre los indicadores del componente estudiantado: Tasa de Permanencia del Estudiantado y Tasa de Titulacin de Grado.
Tomados los datos del Sistema de informacin Institucional, el modelo proyectar diferentes situaciones de desempeo especficas, donde se podr mejorar la asignacin de distribucin de actividades, los procesos de admisin y nivelacin, acompaamiento acadmico, eficiencia terminal de grado, procesos de titulacin, refrendacin y registro de ttulos, etc.
El Sistema de Informacin Institucional, contiene gran cantidad de informacin, relacionada con: expedientes acadmicos de estudiantes, matriculacin, cohortes, procesos de titulacin. Datos que pueden ser tiles para retroalimentar estratgicamente la gestin directiva institucional, si son reestructurados y articulados adecuadamente en base a la metodologa de clculo de los indicadores del modelo de evaluacin externa.
Definicin de requerimientos empresariales
Tradicionalmente, la forma de medir el desempeo de una empresa estaba directamente vinculado con su estado financiero; es decir, que giraba en torno a sus ganancias, sin considerar aspectos intangibles como la relacin con los clientes o el grado de satisfaccin de sus empleados. Robert Kaplan y David Norton con el concepto de Balanced Scorecard [5], plantean la identificacin de mtricas articuladas a un objetivo, conocidas como indicadores clave de desempeo o Key Performance Indicator (KPI), donde las decisiones que se tomen en torno a estas afectaran estratgicamente a sus resultados.
Para identificar la informacin relevante y necesaria para realizar el estudio de los indicadores determinados, se debe analizar lo correspondiente al componente estudiantado en el modelo de evaluacin externa; y, lo relacionado con la organizacin y estructura del Sistema de Informacin Institucional.
La Tabla 1, presenta la informacin relacionada con el indicador Tasa de permanencia del estudiantado, definiendo su forma.
Tabla 1: Indicador Tasa de permanencia del estudiantado
Funcin sustantiva |
Docencia |
Dimensin |
Ejecucin |
Estndar |
6. Ejecucin de los procesos del estudiantado |
Indicador |
Tasa de permanencia del estudiantado |
Calculo del estndar |
|
Variables |
EMA: Total de estudiantes matriculados en la institucin en el periodo de evaluacin que fueron admitidos dos aos antes.
EA: Total de estudiantes que fueron admitidos en la institucin dos aos antes del periodo de evaluacin. |
De igual forma, la Tabla 2, corresponde al indicador Tasa de titulacin de grado, presentando el mismo detalle de informacin que el indicador anterior.
Tabla 2: Indicador Tasa de titulacin del estudiantado
Funcin sustantiva |
Docencia |
Dimensin |
Resultados |
Estndar |
7. Titulacin del estudiantado |
Indicador |
Tasa de titulacin de grado |
Calculo del estndar |
|
Variables |
TETG1: Total de estudiantes matriculados en primer nivel en la(s) cohorte(s) definida(s) (2010) que se graduaron en el tiempo reglamentario (se entender por el tiempo reglamentario la duracin de la carrera ms tres periodos acadmicos ordinarios establecidos en el RRA[6])
TETG2: Total de estudiantes matriculados en primer nivel en la(s) cohorte(s) definida(s) (2010) que se graduaron hasta un ao despus del tiempo reglamentario.
TECG: Total de estudiantes de la cohorte definida (para doctorados cohorte 2010 y para maestras cohorte 2013) que se graduaron en el tiempo reglamentario (se entender por el tiempo reglamentario la duracin del programa de posgrado de acuerdo con los reglamentos aplicables) RRA [6]
|
Luego de definir los indicadores, se debe identificar las fuentes de datos, para ello consideramos el proceso de recoleccin de informacin [7], en la fase de Registro en el proceso de evaluacin, cada una de las Instituciones de Educacin Superior reporta al Sistema de Informacin Integral de Educacin Superior (SIIES) [8], una coleccin de datos, en forma de carga masiva, que contiene aspectos esenciales de las funciones sustantivas como: estudiantes matriculados, estudiantes matriculados por periodo, cohortes, graduados, becas, etc.
En consecuencia, la Institucin genera reportes especializados desde su Sistema de Informacin Institucional, en los formatos establecidos en el Sistema SIIES para realizar las cargas masivas, estos archivos son hojas de clculo, con una fila cabecera que corresponde a los campos solicitados; una vez agregados los registros, se aplica un filtro a travs de una herramienta validadora, igualmente proporcionada por las entidades de control, esta herramienta realiza un barrido verificando que formato de los tipos de datos corresponda a lo solicitado, que los valores de campos especficos correspondan a las tablas proporcionada en el instructivo, el uso de caracteres especiales no permitidos, algoritmos de validacin de identificaciones, etc. Una vez concluido este proceso, la aplicacin permite generar un archivo. XML, que ser la carga a ser subida en la interfaz del sistema SIIES.
El Sistema de Informacin Institucional, entrega de forma detallada las cargas masivas relacionadas con:
Estudiantes
Estudiantes Matriculados
Carreras
Sedes
Sin embargo, la informacin relacionada con estudiantes graduados debe ser recolectada de un registro en hoja de clculo, que contiene informacin del proceso de refrendacin y registro de ttulos.
En base a lo solicitado por el modelo de evaluacin y los orgenes de datos, podemos determinar la siguiente informacin que es clave para el anlisis de los indicadores
Reporte Estudiantes
Nmero de estudiantes de cohorte (matriculados en carrera por primera vez en un periodo definido)
Reporte Estudiantes Matriculados
Nmero de estudiantes matriculados dos aos despus de su primera matricula
Listado de refrendacin y registro de ttulos
Nmero de estudiantes graduados
Nmero de estudiantes graduados dentro del tiempo reglamentario
Nmero de estudiantes graduados fuera del tiempo reglamentario
Se debe considerar que el CACES aprovecha la informacin existente en la base SIIES, para entregar a los equipos evaluadores una visin contextual de la Universidad que van a evaluar, y, del conjunto del sistema, a fin de que un mejor conocimiento les posibilite mayor agudeza y profundidad en su tarea evaluativa.
Diseo de la arquitectura tcnica
En este punto, con una clara concepcin de las necesidades institucionales, se debe articular lo planteado en los pasos anteriores con la arquitectura tcnica de un Data Mart. En la Ilustracin 2, observamos que esta arquitectura se divide en dos entornos, el back room, que hace referencia a los componentes propios de un Data Warehouse y el front room que se orienta a la parte de inteligencia de negocios.
Ilustracin 2: Diagrama simplificado de la arquitectura Data Mart[3]
En el back room se definen todos los aspectos transparentes al usuario, desde el origen de los datos, los mtodos de adquisicin, transformacin, limpieza, validacin, clculos y carga de datos al Data Mart. El front room es la presentacin de datos al usuario a travs de una interfaz simplificada con una aplicacin de BI.
En base a los campos de los archivos de carga masiva, los instructivos, diagramas de flujo de carga de informacin; y, el comportamiento del sistema SIIES, de forma conceptual se ha determinado el modelo de la fuente de datos. La ilustracin 3, presenta un esquema relacional permite un acercamiento a su lgica, organizacin, articulacin y distribucin de informacin.
Ilustracin 3: Modelo relacional cargas masivas MODELO SIIES
Instalacin y seleccin de productos
En esta actividad, se deben precisar especficamente las aplicaciones y productos adecuados para la implementacin del proyecto. Dentro de los entornos de la arquitectura tcnica de un Data Mart, se definen componentes y, cada uno de ellos necesita herramientas apropiadas que soporten de forma conjunta el anlisis de datos.
Ilustracin
4: Modelo de arquitectura de sistema DW/BI de alto nivel
[4]
Los productos seleccionados son de libre distribucin, a excepcin de Tableau Software. En la Tabla 3, se puede ver el detalle de estos productos.
Tabla 3: Productos seleccionados para Data Mart
Fuentes de informacin |
Back Room |
Sourse System |
ERP University Listados de hojas de calculo |
Integracin y repositorio de datos |
ETL System |
phpMyAdmin 5.0.2 MariaDB 10.4.13 Hoja de calculo |
|
Anlisis |
Front Room |
BI Application |
Tableau Software 2020.3.2 |
|
Otras aplicaciones |
|
PHP 7.4.8 Apache 2.4.43 |
Modelamiento dimensional
Se generaron dos modelos dimensionales a partir de los anlisis realizados a cada uno de los indicadores, siguiendo lo sugerido en la arquitectura Kimball [4], hay cuatro pasos para disear el modelo dimensional:
1. Seleccin del proceso de negocio
2. Definicin de la granularidad de la informacin
3. Eleccin de las dimensiones de anlisis
4. Identificacin de los hechos o mtricas
Estas cuatro decisiones clave en el desarrollo del diseo lgico del modelamiento dimensional, en resumen, se encuentran en las siguientes tablas:
Tabla 4: Proceso de diseo dimensional del indicador Tasa de permanencia del estudiantado
Indicador |
Tasa de permanencia del estudiantado. |
Objetivo |
Mide el seguimiento al desempeo estudiantil, y las acciones para mejorar su retencin. |
Granularidad |
Registro de matriculas |
Dimensiones |
Estudiantes Periodos Sedes Carreras Fechas |
Tabla de hechos |
Matriculas |
Mtricas |
Estudiante Retenido= Cdigo Periodo Matricula Periodo Inicio = 2 (aos) |
En lo relacionado con el indicador Tasa de permanencia del estudiantado, se defini la tabla de hechos Matriculas, en donde periodo a periodo, se ingresan los registros de todos los estudiantes que acceden a una matrcula en una carrera especfica, se determinaron tambin cinco dimensiones considerando los atributos descriptivos que estn asociados, Estudiantes, Periodos, Sedes, Carreras y Fechas.
La forma de identificar un estudiante retenido, consiste en determinar a qu cohorte pertenece, es decir, cul fue el periodo en el que se matriculo por primera vez en una carrera especfica, y verificar dos aos despus si el estudiante realiz nuevamente un proceso de matrcula en la misma carrera, independientemente del ciclo de estudios.
Tabla 5: Proceso de diseo dimensional del indicador Tasa de titulacin del estudiantado
Indicador |
Tasa de Titulacin de grado |
Objetivo |
Mide la eficiencia terminal de carreras, al lograr que sus estudiantes culminen y se titulen en el plazo establecido. |
Granularidad |
Registro de actas de grado |
Dimensiones |
Estudiantes Sedes Carreras Fechas |
Tabla de hechos |
Graduados |
Mtricas |
Duracin de estudios= Fecha de Graduacin Fecha Inicio Primer Nivel Tiempo Reglamentario = Duracin de la Carrera (aos) + 1.5 (aos) Tiempo Extendido = Tiempo Reglamentario + 1 (aos) Fuera de Tiempo > Tiempo Extendido |
En lo relacionado con el indicador Tasa de titulacin de grado, se defini la tabla de hechos Graduados, la que se ingresan los registros de todos los estudiantes se gradan en determinada carrera, se determinaron tambin cuatro dimensiones considerando los atributos descriptivos que estn asociados, Estudiantes, Sedes, Carreras y Fechas.
La forma de identificar un estudiante graduado que aporte a la eficiencia terminal, consiste en determinar a qu cohorte pertenece, considerando el periodo en el que se matricul por primera vez en una carrera especfica, y verificando si se gradu dentro de los plazos establecidos. Los plazos se establecen en base a lo normado en el Reglamento de Rgimen Acadmico, el tiempo reglamentario es la suma de la duracin oficial de la carrera ms 18 meses correspondientes a su proceso de titulacin, el tiempo extendido, considera a los estudiantes que se graduaron un ao despus del tiempo reglamentario, posterior a ello, los estudiantes graduados no son considerados con eficiencia terminal satisfactoria.
Para ello, es necesario determinar el tiempo que el estudiante estuvo en la carrera, que consiste en obtener la diferencia entre la fecha de graduacin y la fecha de la primera matrcula.
Tabla 6: Enterprise Data Warehouse Bus Matrix [9]
|
Dimensiones |
||||
Procesos |
Fechas |
Estudiantes |
Carreras |
Sedes |
Periodo |
Tasa de Titulacin |
X |
X |
X |
X |
|
Tasa de Permanencia |
X |
X |
X |
X |
X |
Todas las consideraciones anteriores nos permiten definir el esquema de base de datos dimensional que vamos a disear, en el esquema Estrella se utiliza una nica tabla de hechos central, que contiene los campos definidos como mtricas y una tabla relacionada por cada dimensin definida, que nos permitir analizar los datos desde cada perspectiva [10].
Diseo fsico
En esta etapa, se procede a crear una base de datos fsica a partir del diseo dimensional lgico realizado en el paso anterior.
La creacin de las tablas de dimensiones y hechos se realizaron a partir de la elaboracin de un script SQL, se mantuvieron los tipos de datos definidos en el modelo transaccional SIIES.
En la tabla de hechos, se defini el uso de un ndice compuesto, integrado por todas las claves primarias de cada una de las tablas dimensionales. Adicionalmente, se crearon campos para almacenar las mtricas.
Como se puede apreciar en las ilustraciones 5 y 6, esto se aplic en esquemas definidos para los dos indicadores.
Ilustracin 5: Esquema en estrella de Tasa de Permanencia
Ilustracin 6: Esquema en estrella de Tasa de Titulacin
Diseo y desarrollo ETL
A continuacin, en base a los pasos descritos en el Mapa de flujo de proceso ETL, propuesto por Kimball [4], se elabora un esquema del flujo origen-destino de la informacin.
Ilustracin
7: Diagrama esquemtico del flujo origen-destino
Como se puede observar en la ilustracin 7, el esquema presenta una instancia de datos intermedia, denominada staging area (rea de preparacin) [11], una base de datos que permite mantener un respaldo hasta que todos los datos hayan sido cargados con xito en el almacn de datos. Esta rea puede ser temporal, denominada transitoria, o mantener de forma permanente un historial completo de la fuente de datos, denominada persistente. En este caso el staging area ser persistente.
Iniciamos con el proceso de extraccin de datos desde las dos fuentes definidas. La informacin extrada del Sistema de Informacin Institucional, se genera en formato hoja de clculo, en el caso de sedes y carreras se mantiene se estructura e integridad completa. En el caso de estudiantes y matrculas, se obtiene un archivo por cada periodo acadmico, una vez obtenidos se deben consolidar en una sola hoja de clculo, definiendo el formato aaaa-mm-dd a los campos que contiene datos de fecha. En lo correspondiente a estudiantes, se debe eliminar los campos duplicados considerando como campos claves el nmero de identificacin del estudiante; el cdigo de carrera y la primera fecha de inicio de estudios.
De igual forma se produce con la carga de estudiantes graduados, que se genera a partir los listados del proceso de refrendacin y registro de ttulos.
Una vez realizado este proceso de transformacin, se procede a guardar las matrices en archivos planos separados por comas para luego ser importados en la base de datos de staging area, finalizando el primer proceso de transferencia, representado en la Ilustracin 8.
Ilustracin
8: Diagrama del proceso ETL origen-staging area
El objetivo de crear un staging area, es tener un repositorio con informacin depurada, en donde se pueden remover errores, corregir datos perdidos, ajustar la data que proviene de mltiples fuentes, estructurar datos para que sean utilizables por el usuario final, facilita la extraccin, transformar y depuracin de los datos. Esta base contiene informacin con mayor nivel de detalle que no es parte del Data Mart y permite poseer la capacidad de recuperarse ante fallas.
Concluido el proceso ETL correspondiente a staging area, procedemos a iniciar un segundo proceso ETL para el Data Mart, en el que, de forma directa, a travs del uso de sentencias SQL, realizamos los procesos de carga de las dimensiones, conforme a la ilustracin 9.
Ilustracin
9: Flujo de carga de las tablas dimensionales
Finalizado el proceso de carga de las dimensiones, de forma similar, se procede a realizar una sentencia SQL para realizar el proceso de carga a las tablas de hechos, ver Ilustracin 10.
Ilustracin 10: Flujo de carga de las tablas de hechos
Con los registros completos dentro de las tablas de hechos del indicador permanencia, se ejecutan los procesos de identificacin de mtricas para determinar los periodos y estudiantes retenidos en cada periodo.
Ilustracin
11: Secuencia de clculo de mtricas de la
tabla de hechos permanencia
Se procede de igual forma para la tabla de hechos del indicador titulacin, para obtener las mtricas de identificacin de estudiantes graduados, duracin de estudios, estudiantes graduados en tiempo reglamentario, tiempo extendido y fuera de tiempo.
Ilustracin
12: Secuencia de clculo de mtricas de la
tabla de hechos titulacin
Diseo de BI
El proceso de anlisis y visualizacin de indicadores (front room), se realiz con Tableau Software, que, a travs de una conexin con la base de datos, puede usar datos en tiempo real o realizar una extraccin, que crea una instancia comprimida para almacenar temporalmente en memoria los datos utilizados para las representaciones grficas, a fin de mejorar el rendimiento en la ejecucin de consulta.
Ilustracin
13: Conexin Data Mart - Tableau
Tableau Software permite la creacin de hojas de trabajo, y en cada una de estas se puede plantear una forma de representar la informacin, combina campos de forma cruzada en un entorno grfico, presentando un anlisis visual en tiempo real.
Ilustracin 14: Hoja de trabajo Tableau representacin en texto
Ilustracin
15: Hoja de trabajo en Tableau representacin
en barras
La aplicacin permite la creacin de campos calculados, en los que se puede aplicar frmulas y funciones e interactuar con las mtricas.
Ilustracin 16: Campo calculado para obtener la Tasa de Titulacin
Ilustracin
17: Campo calculado para obtener la Tasa de
Permanencia
Desarrollo de aplicacin BI
Definidos las diferentes formas de representar la informacin, considerando las diferentes perspectivas (dimensiones) del modelo que permite realizar los anlisis, se procede a estructurar los tableros o cuadros de mando (dashboards), que se integran en una sola lmina y admiten la aplicacin de filtros para una representacin conjunta de los indicadores de desempeo.
Resultados
En lo correspondiente a al indicador de tasa de permanencia del estudiantado, la representacin obtenida es muy relevante, llegando a un detalle que permite determinar los resultados a nivel institucional, sedes, carreras y sexo.
Ilustracin 18: Dashboard tasa de permanencia del estudiantado
Como resultados de los ltimos cuatro perodos acadmicos culminados obtenemos a nivel institucional un promedio ponderado del 63,62%, es decir que aproximadamente, del total de estudiantes nuevos que ingresan en cada periodo, dos tercios continan estudiando en la misma carrera dos aos despus de su primera matrcula.
Ilustracin
19: Resumen de resultados por periodo de tasa
de permanencia
Revisando los datos cronolgicos presentados en la Ilustracin 19, podemos destacar un crecimiento de 4.51% en el porcentaje de tasa de permanencia, entre los periodos que iniciaron en septiembre de 2016 (calculado a septiembre 2018) y marzo 2018 (calculado a marzo 2020); as tambin, un aumento en el nmero de estudiante de cohorte, correspondiente a un promedio de 23.87% anual.
Esta retroalimentacin ayudar a fortalecer los procesos de acompaamiento estudiantil, tomando como objetivo las carreras con mayor desercin, para determinar causas y tomar acciones para mejorar su retencin. Tambin, se puede analizar los procesos de nivelacin y admisin, considerando que varias veces los abandonos se producen por una eleccin de carrera no acorde a la vocacin del estudiante.
En los resultados del indicador de tasa de titulacin de grado, podemos mencionar los siguientes hallazgos, de un total de 4.863 estudiantes pertenecientes a la cohorte 2010, se graduaron 1.673 de los cuales nicamente 1.488 son considerados para el clculo del indicador, siendo nuevamente discriminados en base a su duracin de estudios, 1.168 con un peso del 100% y 320 con un peso del 50%.
Ilustracin
20: Resumen de resultados de tasa de
titulacin
La tasa de titulacin del estudiantado correspondiente a la cohorte 2010 es de un 27.31%
Ilustracin
20: Dashboard tasa de titulacin del
estudiantado
Conclusiones
Es evidente que el uso de estas herramienta permiten obtener una mirada distinta de los procesos relacionados con los indicadores de desempeo analizados, sobre los que ser posible tomar decisiones y planes de accin que permitirn mejorar estratgicamente sus resultados, adems de que implica una mejora en la valoracin de los procesos de evaluacin externa, considerando que estas decisiones son directamente de gestin administrativa interna, no representaran inversin alguna, y al contrario representaran una mejora en los ingresos de la institucin al garantizar la continuidad de estudios de la comunidad universitaria, que dentro de sus obligaciones econmicas realizan pagos por diferentes conceptos.
La metodologa planteada por Ralph Kimball, permite una aplicacin prctica y gil de un Data Mart para realizar un anlisis especifico, ya sea de corto o mediano alcance; sin embargo, a travs de su concepcin, esto puede evolucionar en Data Warehouse integral con el crecimiento incremental y la articulacin de otros Data Mart.
Dentro de las limitaciones del Data Mart se encuentra que debe ser concebido y planificado de forma adecuada, considerando todos los aspectos necesarios para su desarrollo, ya que una vez iniciada la etapa de diseo fsico, no se posible su modificacin.
Referencias
1. D. Bernabeu and G. Matto, Introduccin DATA WAREHOUSING : Marco Conceptual HEFESTO : Metodologa Data Warehouse, p. 182, 2017.
2. CACES (Consejo de Aseguramiento de la Calidad de la Educacin Superior), Modelo de evaluacin externa de Universidades y Escuelas Politcnicas 2019, Resolucin No. 016-SE-07-CACES-2019, p. 148, 2019, [Online]. Available: www.caces.gob.ec.
3. R. Kimball and M. Ross, The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling (3nd Edition). John Wiley & Sons, Inc., 2013.
4. R. Kimball, L. Reeves, M. Ross, and W. Thornthwaite, The Data Warehouse Lifecycle Toolkit, vol. 58, no. 12. 2011.
5. R. S. Kaplan and D. P. Norton, BSC - Measures that drive performance, Harv. Bus. Rev., no. February, pp. 7179, 1992.
6. CES (Consejo de Educacin Superior), Reglamento de Rgimen Acadmico Consejo Educacin Superior, Lexis Finder, no. 051, p. 46, 2019, [Online]. Available: http://www.utpl.edu.ec/sites/default/files/documentos/reglamento-de-regimen-academico-2015.pdf.
7. Unidad de Tecnologas de la Informacin;, CACES (Consejo de Aseguramiento de la Calidad de la Educacin Superior), Superior), CES (Consejo de Educacin, and SENESCYT (Secretaria Nacional de Educacion Superior Ciencia Tecnologa e Innovacin), Flujo de ingreso de datos institucionales al SIIES, no. 2, p. 3.
8. Unidad de Tecnologas de la Informacin, CACES (Consejo de Aseguramiento de la Calidad de la Educacin Superior), CES (Consejo de Educacin Superior), Innovacin), and SENESCYT (Secretaria Nacional de Educacion Superior Ciencia Tecnologa e Innovacin), Instructivo carga masiva Sistema de Informacin Integral de la Educacin Superior, https://siies.caces.gob.ec/, pp. 184, 2018.
9. R. Kimball and M. Ross, The Data Warehouse toolkit. 2013.
10. S. Ramos, Data Warehouse, Data Marts y Modelos Dimensionales. Un pilar fundamental para la toma de decisiones. 2016.
11. R. Kimball and J. Caserta, The Data Warehouse ETL Toolkit. 2011.
2020 por los autores. Este artculo es de acceso abierto y distribuido segn los trminos y condiciones de la licencia Creative Commons Atribucin-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0) (https://creativecommons.org/licenses/by-nc-sa/4.0/).
Enlaces de Referencia
- Por el momento, no existen enlaces de referencia
Polo del Conocimiento
Revista Científico-Académica Multidisciplinaria
ISSN: 2550-682X
Casa Editora del Polo
Manta - Ecuador
Dirección: Ciudadela El Palmar, II Etapa, Manta - Manabí - Ecuador.
Código Postal: 130801
Teléfonos: 056051775/0991871420
Email: polodelconocimientorevista@gmail.com / director@polodelconocimiento.com
URL: https://www.polodelconocimiento.com/