Implementación de un data warehouse en arquitectura pentaho: un caso práctico aplicado a una empresa de educación de la Región del Maule
Autor
Tapia Torres, Waleska
Profesor Guía
Urrutia Sepúlveda, AngélicaFecha
2012Resumen
El trabajo, dirigido por la Dra. Angélica Urrutia, y tiene como objetivo aportar conocimiento, en el área del Business Intelligence, Data Warehouse con la herramienta Open Source Pentaho.
En las organizaciones actuales la información toma relevancia, por lo cual, es necesario contar con procesos y herramientas que permitan analizar rápida y efectiva la información de las distintas fuentes de datos, con el fin de entregar conocimiento para una mejor toma de decisiones a corto y largo plazo.
Un Data Warehouse es un sistema íntimamente ligado a organizaciones medianas o grandes. Y, al igual que las organizaciones a las que están ligados los DW son sistemas vivos y en constante evolución. Para comprender el potencial de un DW, lo mejor es empezar a construirlo y comprender que es y que se puede hacer con él.
Esta Memoria tiene como objetivo implementar un Data Warehouse que sirva de apoyo a la toma de decisiones de una organización educacional de la región del Maule, seleccionando cada una de las capas para la arquitectura del DW con una herramienta Business Intelligence Open Source:Pentaho. Donde se identifican los requerimientos KPI, a partir de un caso educacional en particular.
La elección de una herramientas Open Source, tienen grandes ventajas comparativas frente a las privativas, como lo son la adaptabilidad a los requerimientos de la empresa, nuevas versiones de los software más rápido y mejor, la reducción de costos, la seguridad, y entornos de desarrollo flexibles, descentralizados y transparentes.
La metodología utilizada para este trabajo, comienza con un análisis de la problemática, seguida de una selección e implementación de la arquitectura y metodología. Para el caso en estudio se dividió en cuatro capas:
Capa 1: Compuesta por la base de datos operacional OLTP en la cual se realizan todas las operaciones diarias de la organización.
Capa 2: Compuesta por el proceso ETL, el cual se encarga de extraer, transformar y cargar los datos hacia el Data Warehouse en un diseño estrella y creado a partir de la organización, se realizan además limpieza de datos proveniente de la OLTP.
Capa 3: Compuesta por el Data Warehouse de la organización en modelo multidimensional, aquí se tienen los datos necesarios para realizar un correcto y real análisis de la organización. Se diseña para satisfacer los requerimientos de los indicadores de gestión.
Capa 4: Resultados para la gestión la información solicitada por usuarios.
Como conclusión del caso de estudió, se obtienen los resultados solicitados y esperados mediante la implementación del DW en arquitectura Pentaho, pudiendo obtener todas las incidencias por alumno de un determinado día y en un rango de hora especifica. Además permite generar gráficos que representan la información que es consultada.
Tesis para optar al título de Ingeniero de Ejecución en Computación e Informática
Link de Acceso
Click aquí para ver el documentoLa publicación tiene asociados los siguientes ficheros de licencia: