MODELOS
Representación del Data Warehouse
Existen varias formas de representación o implementación del modelo dimensional dentro de las diferentes bases de datos que existen en el mercado.
En el caso de contarse con un ambiente netamente relacional, es decir, una base de datos relacional sobre la cual se hará la implementación del data warehouse, se suele utilizar una representación denominada “esquema en estrella”, la cual proporciona simpleza y flexibilidad para el uso de cualquier herramienta de usuario final.
ESQUEMA EN ESTRELLA
El modelo de esquema en estrella puede verse como una simple estrella en la cual existe una tabla central que contiene los hechos del negocio que se desean modelar, y multiples tablas radiantes, llamadas dimensiones, conectadas a la central a través de las respectivas llaves primarias y foraneas. A diferencia de la estructura de otros esquemas de base de datos, un esquema en estrella contiene dimesiones denormalizadas.
Los esquemas en estrella presentan las siguientes características:
- El modelo es fácil de entender para los usuarios.
- La llave primaria representa a cada una de las dimensiones.
- Las columnas que no son llaves foraneas son valores.
- Las tablas de hechos están usualmente altamente normalizadas.
- Las dimensiones estan completamente denormalizadas.
- Proveen una respuesta rápida a las consultas.
- El rendimiento de las consultas es mejorado reduciendo las uniones entre tablas.
- Los usuarios pueden expresar consultas complejas.

En la figura anterior se muestra la secuencia que el proceso ETL ejecuta para realizar el mantenimiento del DW, en el cual el primer proceso es la extracción de los datos necesarios para el análisis de la información, una vez hecho la extracción el proceso siguiente es la transformación de los datos en datos basados según el formato estandarizado dentro del DW y por último se realiza la carga de los datos en el DW.
La limpieza de los datos “sucios” es un proceso multifacético y complejo que consiste en analizar los datos corporativos para descubrir inexactitudes, anomalías y transformar los datos para asegurar que sean precisos y coherentes. Asegurar la integridad referencial, le proporciona al DW la capacidad de identificar correctamente al instante, cada objeto del negocio, tales como un producto, un cliente o un empleado.
Los Sistemas ETL realizan las funciones de extracción de las fuentes de datos transaccionales o externas), transformación (limpieza, consolidación, etc.) y la carga de los datos una vez fue ya hayan pasado por los dos anteriores pasos, para así almacenarse en el DW.

DATA MINING.
Está asociado al escalón más alto de la pirámide (Nivel Estratégico) y tiene por objeto eliminar los errores cometidos por las personas al analizar los datos debido a prejuicios y dejar que sean los datos los que muestren los modelos subyacentes en ellos. La Minería de Datos ayuda a crear nuevos modelos no percibidos por el analista hasta ese momento pero que realmente existen en los datos.
DATA MART
El almacén de datos de un hecho en particular se denomina Data Mart (DM), es clásicamente una iniciativa de un solo departamento con un área específica.