Un ejemplo pr�ctico de almac�n de datos en Sistemas DJ A practical example of a data warehouse in DJ Systems Um exemplo pr�tico de um data warehouse em DJ Systems



 

Oscar Danilo Gavil�nez-�lvarez III oscar.gavilanez@espoch.edu.ec https://orcid.org/0000-0002-7245-5640

 

 

 

Correspondencia: diego.bastidas@espoch.edu.ec

 

Ciencias T�cnicas y Aplicadas Art�culo de Investigaci�n

 

 

* Recibido: 25 de marzo de 2022 *Aceptado: 20 de abril de 2022 * Publicado: 27 de mayo de 2022

 

I.            Ingeniero en Gerencia de Sistemas, Mag�ster en Tecnolog�as de la Informaci�n, Mag�ster en Gesti�n de Proyectos. Docente Investigador, Escuela Superior Polit�cnica de Chimborazo (ESPOCH), Riobamba, Ecuador.

II.             Ingeniera en Sistemas. Magister en Sistemas de Informaci�n Gerencial. Docente Investigador, Escuela Superior Polit�cnica de Chimborazo (ESPOCH), Riobamba, Ecuador.

III.             Ingeniero en Sistemas, Mag�ster en Interconectividad de Redes. Docente Investigador, Escuela Superior Polit�cnica de Chimborazo (ESPOCH), Riobamba, Ecuador.

 

 

 

 

 

 


http://polodelconocimiento.com/ojs/index.php/es


 

Resumen

Este trabajo pretende analizar los aspectos pertinentes al Data Ware House, tomando como caso pr�ctico el sistema desarrollado para la empresa SISTEMASDJ (www.sistemasdj.com). El realizar la implementaci�n de una �ptima aportando informaci�n que permitir� mejorar su an�lisis. La metodolog�a est� orientada a amortiguar el tedio que provoca seguir pasos sin comprender el porqu� de la ejecuci�n de una data ware house que posibilite a los usuarios de la empresa contar con mejores prestaciones e informaci�n y mejorar su trabajo. Hoy en d�a, el uso del DW en el mundo es un boom que nos proporciona informaci�n clave para la toma de decisiones, mejorar la calidad de las decisiones tomadas permitiendo mayor flexibilidad y rapidez en el acceso a la informaci�n.

Palabras clave: An�lisis de datos; Almac�n de datos

 

 

Abstract

This work tries to analyze the pertinent aspects to the Data Ware House, taking as a practical case the system developed for the company SISTEMASDJ (www.sistemasdj.com). Realization of the implementation of an optimal supply of information that improves its performance. The objective of the methodology is to cushion the tedium caused by following steps without understanding the reason for the execution of a data storage house that allows the users of the company to have better services and information and improve their work. Today, the use of DW in the world is a boom that provides us with key information for decision-making, improving the quality of decisions made, allowing greater flexibility and speed in accessing information..

Keywords: Data Analysis; Data Warehouse

 

 

Resumo

Este trabalho pretende analisar os aspectos relevantes do Data Ware House, tomando como caso pr�tico o sistema desenvolvido para a empresa SISTEMASDJ (www.sistemasdj.com). Realizar a implementa��o de um �timo fornecimento de informa��es que ir�o melhorar sua an�lise. A metodologia visa amortecer o t�dio causado por seguir etapas sem entender o motivo da execu��o de um data ware house que permita aos usu�rios da empresa ter melhores recursos e informa��es e melhorar seu trabalho. Hoje, o uso de DW no mundo um boom que nos fornece informa��es


 

fundamentais para a tomada de decis�es, melhora a qualidade das decis�es tomadas, permitindo maior agilidade e agilidade no acesso �s informa��es.

Palavras-chave: An�lise de dados; Armazem de dados

 

 

Introducci�n

Este trabajo pretende analizar los aspectos pertinentes al Data Ware House, tomando como caso pr�ctico el sistema desarrollado para la empresa de empe�os SISTEMASDJ (www.sistemasdj.com). El realizar la implementaci�n de una �ptima aportando informaci�n que permitir� mejorar su performance. La metodolog�a est� orientada a amortiguar el tedio que provoca seguir pasos sin comprender el porqu� de la ejecuci�n de una data warehouse que posibilite a los usuarios de la empresa contar con mejores prestaciones e informaci�n y mejorar su trabajo. Hoy en d�a. Brinda una informaci�n fiable entre todos los departamentos de la empresa para que el Data Warehouse sea exitoso se necesita una limpieza continua, transformaci�n e integraci�n de los datos. Adem�s, requiere sistemas, aplicaciones y almacenamiento espec�fico. SISTEMASDJ una Pymes, en la cual se ha optado por seleccionar un conjunto significativo cercano a las necesidades de la misma. Seg�n la investigaci�n realizada, no existe ning�n servicio igual o similar al propuesto que permita disponer de servicios de data warehouse, Cabe destacar que, de la inteligencia de negocios (business intelligence) se desprenden el an�lisis de big data y miner�a de datos. De esta forma, big data es una colecci�n de conjuntos de datos muy grandes con una gran diversidad de tipos y de dif�cil procesamiento mediante plataformas de procesamiento de datos tradicionales. A su vez, su an�lisis se considera como un subproceso dentro del proceso general de obtenci�n de ideas de una gran cantidad de datos. En consecuencia, el an�lisis de big data permite una toma de decisiones basada en evidencias e implementaci�n de soluciones, puesto que las empresas necesitan procesos eficientes para convertir grandes vol�menes de datos r�pidos y diversos en percepciones significativas. (Mukherjee, Kumar, & Goswami, 2019). Adem�s, en el �rea de marketing de acuerdo a la captura datos abundantes sobre el comportamiento del consumidor en tiempo real y encuentra patrones ocultos en los datos; porque �stos brindan informaci�n conductual sobre los consumidores y los especialistas en marketing traducen esas ideas en la ventaja dentro del mercado. (Colin, 2012).

A continuaci�n, se plantea el siguiente objetivo General: �Implementar la data ware house para


 

tener flexibilidad y rapidez en el acceso a la informaci�n en la empresa SISTEMASDJ�.

Una vez analizado el objetivo general y para dar cumplimiento al mismo se proponen los siguientes Objetivos Espec�ficos:

Estudio Preliminar del Data Ware House Identificar las caracter�sticas del Data Ware House Implementar el Data Ware House

 

Metodolog�a

Dise�o de investigaci�n Marco Metodol�gico

En este cap�tulo se presenta la metodolog�a que permiti� desarrollar el proyecto del data ware house en la empresa Sistemasdj.

Tipo De Investigaci�n

Este proyecto puede catalogarse en su primera instancia como una investigaci�n de tipo exploratoria ya que se realizar� lo siguiente:

Se formula un problema: Dificultad al buscar la informaci�n sobre aplicaciones desarrolladas en tecnolog�a y plataformas poco usadas en el Pa�s sobre data ware house. Se re�ne informaci�n sobre el tema: se recopilar� informaci�n de diversas fuentes bibliogr�ficas y electr�nicas para hacer un estudio detallado del tema. Se aclaran conceptos: es muy importante tener bien claros muchos conceptos de la tecnolog�a que se va a aplicar antes de empezar a experimentar con la misma.

Una vez que la parte exploratoria haya concluido, se catalogar� a la investigaci�n como experimental por las siguientes razones:

Se provocar� un fen�meno con el fin de probar algo: una vez que se sintetice la informaci�n usando Data Ware House, se establecer� las respectivas modificaciones, mejoras e implementaci�n. Se requiere de un m�todo l�gico y sistem�tico para realizar experiencias cient�ficas: el mejoramiento de la investigaci�n acad�mica se demostrar� a partir de la experimentaci�n con las diversas tecnolog�as y plataformas que Data Ware House brinda para implementarlas con open source.


 

Fuentes de Informaci�n

Se las ha clasificado en dos: Fuentes Primarias Fuentes Secundarias

Fuentes Primarias

Es necesario utilizar las siguientes t�cnicas de recopilaci�n de informaci�n:

Observaci�n: Esta t�cnica junto con la experiencia adquirida en pr�cticas pre profesionales anteriores ser� una importante fuente de informaci�n.

Fuentes Secundarias

Para el desarrollo del presente trabajo se recopilar� la suficiente informaci�n escrita y en formato electr�nico referente al tema, la que puede ser catalogada en las siguientes categor�as:

Libros: libros formato digital de Data Warehouse y otras tecnolog�as de desarrollo de software en ambientes virtuales, manuales Data warehouse.

E-books: proporcionar�n la informaci�n m�s actualizada acerca de Data Ware House Revistas, art�culos y documentos t�cnicos: informaci�n relacionada con Data Ware

House.

Documentaci�n en pantalla: ayudas y documentaci�n principalmente sobre los paquetes y

kits de desarrollo que sean utilizados para la ejecuci�n de este trabajo.

 

 

M�todo de Investigaci�n Exploratorio

Se reunir� toda la informaci�n sobre la implementaci�n de Data Ware House, como sea posible.

Estructuras de dn Data Warehouse

La arquitectura de una data warehouse puede ser dividida en tres estructuras simplificadas: b�sica, b�sica con un �rea de ensayo y b�sica con �rea de ensayo y data marts. Con una estructura b�sica, sistemas operativos y archivos planos proporcionan datos en bruto que se almacenan junto con metadatos. (Mukherjee, Kumar, & Goswami, 2019) Los usuarios finales pueden acceder a ellos para su an�lisis, generaci�n de informes y miner�a. Al a�adir un �rea de ensayo que se puede colocar entre las fuentes de datos y el almac�n, �sta proporciona un lugar donde los datos se pueden limpiar antes de entrar en el almac�n. Es posible personalizar la arquitectura del almac�n para diferentes grupos dentro de la organizaci�n. Se puede hacer agregando data marts, que son sistemas dise�ados para una l�nea de negocio en particular. Se pueden tener data marts


 

separados para ventas, inventario y compras, por ejemplo, y los usuarios finales pueden acceder a datos de uno o de todos los data marts del departamento. (Back, Goodman , & Hyde , 2013)

 

Resultados y Discusi�n

An�lisis e Interpretaci�n de Resultados Dimensiones Sistemasdj

Figura.N�1 iimensiones de la empresa

 

Procesos del negocio

fecha

skus

formas

clientes

provincias

categorias

tipos

ubicaciones

conceptos

�rdenes de compra

X

X

X

 

 

X

 

X

 

Entregas al centro de distribuci�n

X

X

 

 

 

X

 

 

 

Inventario del centro de distribuci�n

X

X

 

 

 

X

 

 

 

Entregas hacia el Almac�n

X

X

 

 

 

 

 

 

 

Inventario del Almac�n

X

X

 

X

X

 

X

 

 

Despacho en Ventas

X

X

X

X

X

 

X

X

X

TOTAL

5

5

2

2

2

3

2

2

1

 

Fuente: Diego Javier Bastidas Logro�o, Edwin Villamar�n Rojas

 

 

 

Preguntas

  �Cu�l es el problema del �rea, departamento?

No tener un sistema de data anal�tica que provea generar reportes sin estar consultando al �rea de sistemas.

  �C�mo hace el negocio para abordarlo ahora?

Utilizar por medio de este proyecto el desarrollo de data anal�tica por medio de pentaho server

  �Los datos est�n disponibles?

Se necesitaba siempre consultar al �rea de tics este tipo de reportes, v�a email o llamada, ya que siempre se deb�a consultar a la base de datos esta �rea por medio de consultas SQL.

  �C�mo se podr�a usar los resultados?

Se requerida hacer un an�lisis de los productos tienen m�s salida y menos salida, para recibir

  �Qui�n es el custodio de los datos? El �rea de tics


 

  �Qui�n es el due�o de los datos? Gerencia

 

Hefesto

       Los objetivos y resultados esperados en cada fase se distinguen f�cilmente y son sencillos de comprender.

       La piedra fundamental la constituyen los requerimientos de los usuarios, por lo cual, se adapta con facilidad y rapidez a los cambios del negocio.

       Reduce dr�sticamente la resistencia al cambio, ya que involucra a los usuarios finales en cada etapa para que tomen decisiones respecto al comportamiento y funciones del DW, y adem�s expone resultados inmediatos.

       Utiliza modelos conceptuales y l�gicos, los cuales son sencillos de interpretar y analizar. Es independiente del tipo de ciclo de vida que se emplee para contener la metodolog�a. Es independiente del software/hardware que se utilicen para su implementaci�n.

       Cuando se culmina con una fase, los resultados obtenidos se constituyen en la entrada de la fase siguiente.

       Se aplica en Data Warehouse Directorios de p�ginas blancas o amarillas

 

 

Mapeo

En el Data Source de la empresa analizada, el proceso de venta est� representado por el siguiente Diagrama de Entidad Relaci�n (representa la informaci�n a trav�s de Entidades, Relaciones, Cardinalidades, Claves, Atributos y Jerarqu�as de generalizaci�n. (Moser, Bruner, & Day, 2017)


 


Imagen 1. Power Architect Dise�o

Fuente: Diego Javier Bastidas Logro�o, Edwin Villamar�n Rojas

 

 

 

Resultados del Proyecto

El resultado principal del proyecto es una herramienta poderosa y flexible, dentro del marco de trabajo de una plataforma Data Anal�tica, capaz de mantener gestionar los datos para la empresa. En la tabla hecho utilizamos un inner join, que permite combinar registros de una o m�s tablas en una base de datos. En el Lenguaje de Consultas Estructurado hay tres tipos de JOIN: interno, externo y cruzado. El est�ndar ANSI Del SQL especifica cinco tipos de JOIN: INNER, LEFT OUTER, RIGHT OUTER, FULL OUTER y CROSS

 

selectconcat(substring(ve.ven_fechaactual,1,4),substring(ve.ven_fechaactual,6,2), substring(ve.ven_fechaactual,9,2))����������������� as���������������� sk_fecha,������������������������������������������������������������������������ ve.ven_fechaactual, date_format(ve.ven_fechaactual,"%Y") as pk_anio_ped, ca.cat_id, ub.ubi_id, ti.tip_id, pr.pro_id,


 

cl.cli_id, fo.for_id, dve.vde_identificacionbien, dve.vde_precioventa FROM ventas ve INNER JOIN ventadetalles dve on ve.ven_id=dve.ven_id INNER JOIN categorias ca on ca.cat_id = dve.cat_id INNER JOIN ubicaciones ub on ub.ubi_id = dve.ubi_id INNER JOIN tipos ti on ti.tip_id=ve.tip_id INNER JOIN clientes cl on cl.cli_id=ve.cli_id INNER JOIN provincias pr on pr.pro_id=cl.pro_id INNER JOIN formas fo on fo.for_id=ve.for_id

 

Conclusiones

         La implementaci�n de data anal�tica en la actualidad en las empresas es necesario ya que sin esta la empresa no podr�a cumplir sus objetivos econ�micos a alcanzar ni de creaci�n.

         Es relevante este tipo de estudio ya que se ven nuevas t�cnicas de an�lisis de datos, que para muchos son desconocidas hasta el momento.

         El mundo actual de la tecnolog�a de la informaci�n se encuentra en el umbral de una revoluci�n, los trabajos poco cualificados se est�n automatizando y pronto se volver�n superfluos, el trabajo en campos tradicionales como el mantenimiento de aplicaciones, la gesti�n de la infraestructura y la programaci�n manual se est� trasladando a trabajos de alta calidad.

 

Referencias

1.      Back, W., Goodman , N., & Hyde , J. (2013). O�Reilly Media, Inc. Recuperado el 2021, de Mondrian in Action: Open source business analytics: https://learning.oreilly.com/library/view/mondrian-in-action/9781617290985/

2.      Colin,����� W.����� (2012).����� O�Reilly����� Media,����� Inc.����� Recuperado��������������� el������� 2021,�������� de https://learning.oreilly.com/library/view/information-visualization- 3rd/9780123814647/xhtml/CHP001.html#CHP001tit1

3.      Moser, A., Bruner, J., & Day, B. (2017). O�Reilly Media, Inc. Recuperado el 2021, de Geospatial Data and Analysis: https://learning.oreilly.com/library/view/geospatial-data- and/9781491984314/titlepage01.html

4.      Mukherjee, S., Kumar, A., & Goswami, S. (2019). O�Reilly Media, Inc. Recuperado el 2021, de Big Data Simplified: https://learning.oreilly.com/library/view/big-data- simplified/9789353941505/chapter-01.html


 

a.      ation-visualization-3rd/9780123814647/xhtml/CHP001.html#CHP001tit1

5.      Mukherjee, S., Kumar, A., & Goswami, S. (2019). O�Reilly Media, Inc. Recuperado el 2021, de Big Data Simplified: https://learning.oreilly.com/library/view/big-data- simplified/9789353941505/chapter-01.html

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2022 por los autores. Este art�culo es de acceso abierto y distribuido seg�n los t�rminos y condiciones de la licencia Creative Commons Atribuci�n-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0) (https://creativecommons.org/licenses/by-nc-sa/4.0/).

Enlaces de Referencia

  • Por el momento, no existen enlaces de referencia
';





Polo del Conocimiento              

Revista Científico-Académica Multidisciplinaria

ISSN: 2550-682X

Casa Editora del Polo                                                 

Manta - Ecuador       

Dirección: Ciudadela El Palmar, II Etapa,  Manta - Manabí - Ecuador.

Código Postal: 130801

Teléfonos: 056051775/0991871420

Email: polodelconocimientorevista@gmail.com / director@polodelconocimiento.com

URL: https://www.polodelconocimiento.com/