El normalizador es una transformación activa, que se utiliza para convertir una sola fila en varias filas y viceversa. Es una forma inteligente de representar sus datos de una manera más organizada.
Si en una sola fila hay datos repetidos en varias columnas, entonces se puede dividir en varias filas. A veces tenemos datos en varias columnas que ocurren. Por ejemplo
Nombre del estudiante | Puntuación de la clase 9 | Puntuación de clase 10 | Puntuación de la clase 11 | Puntuación de la clase 12 |
Estudiante 1 | 50 | 60 | sesenta y cinco | 80 |
Estudiante 2 | 70 | 64 | 83 | 77 |
En este caso, la columna de puntuación de la clase se repite en cuatro columnas. Usando el normalizador, podemos dividirlos en el siguiente conjunto de datos.
Nombre del estudiante | Clase | Puntaje |
Estudiante 1 | 9 | 50 |
Estudiante 1 | 10 | 60 |
Estudiante 1 | 11 | sesenta y cinco |
Estudiante 1 | 12 | 80 |
Estudiante 2 | 9 | 70 |
Estudiante 2 | 10 | 64 |
Estudiante 2 | 11 | 83 |
Estudiante 2 | 12 | 77 |
Paso 1 : cree la tabla de origen "sales_source" y la tabla de destino "sales_target" mediante el script e impórtelas en Informatica
Descargue el archivo Sales_Source.txt anterior
Paso 2: cree un mapeo que tenga la fuente "sales_source" y la tabla de destino "sales_target"
Paso 3 : desde el menú de transformación, cree una nueva transformación
- Seleccionar normalizador como transformación
- Ingrese el nombre, "nrm_sales"
- Seleccione la opción de crear
Paso 4 : se creará la transformación, seleccione la opción Listo
Paso 5 : haga doble clic en la transformación del normalizador, luego
- Seleccione la pestaña del normalizador
- Haga clic en el icono para crear dos columnas
- Ingrese los nombres de las columnas
- Establezca el número de ocurrencias en 4 para las ventas y 0 para el nombre de la tienda
- Seleccione el botón Aceptar
Las columnas se generarán en la transformación. Verá 4 columnas de número de ventas cuando establezcamos el número de ocurrencias en 4.
Paso 6 - Luego en el mapeo
- Vincula las cuatro columnas del calificador de origen del cuarto trimestre a las columnas del normalizador, respectivamente.
- Vincular la columna del nombre de la tienda a la columna del normalizador
- Vincular las columnas store_name y sales del normalizador a la tabla de destino
- Vincular la columna GK_sales del normalizador a la tabla de destino
Guarde el mapeo y ejecútelo después de crear la sesión y el flujo de trabajo. Para cada venta trimestral de una tienda, la transformación del normalizador creará una fila separada.
La salida de nuestro mapeo será como -
Nombre de la tienda | Cuarto | Ventas |
DELHI | 1 | 150 |
DELHI | 2 | 240 |
DELHI | 3 | 455 |
DELHI | 4 | 100 |
MUMBAI | 1 | 100 |
MUMBAI | 2 | 500 |
MUMBAI | 3 | 350 |
MUMBAI | 4 | 340 |
Los datos de origen tenían columnas repetidas, a saber, TRIMESTRE1, TRIMESTRE2, TRIMESTRE3 y TRIMESTRE4. Con la ayuda del normalizador, hemos reorganizado los datos para que quepan en una sola columna de QUARTER y para un registro de origen se crean cuatro registros en el destino.
De esta forma, puede normalizar los datos y crear varios registros para una única fuente de datos.