El mapeo es una colección de objetos de origen y destino vinculados entre sí por un conjunto de transformaciones. Estas transformaciones consisten en un conjunto de reglas, que definen el flujo de datos y cómo se cargan los datos en los destinos.
Un mapeo consiste en el siguiente conjunto de objetos
- Definición de fuente: la definición de fuente define la estructura y las características de la fuente, sus tipos de datos subyacentes, el tipo de fuente de datos, etc.
- Transformación : los objetos de transformación definen cómo se transforman los datos de origen y se pueden aplicar varias funciones durante el proceso
- Definición de destino: la definición de destino define el destino final donde se cargarán los datos.
- Enlaces : los enlaces conectan la definición de origen con diferentes transformaciones y tablas de destino. Define cómo fluyen los datos desde el origen al destino y las transformaciones.
En este tutorial, aprenderá
- ¿Por qué necesita Mapeo?
- Componentes de la cartografía
- ¿Qué es el mapeo de etapas?
- Cómo crear un mapeo
- Mapeo de parámetros y variables
- Cómo crear un parámetro de mapeo
- Cómo crear una variable de mapeo
¿Por qué necesita Mapeo?
El mapeo es un objeto en Informatica con la ayuda del cual puede definir cómo se modifican los datos de origen antes de que lleguen al destino o al objeto de destino. Por ejemplo, si tiene un nombre de empleado como "Bill Clinton" en su sistema de origen y en el sistema de destino el requisito es tener el nombre de empleado en el formato "Bill Clinton", dichas operaciones se pueden diseñar a nivel de mapeo. En términos básicos, lo que hace con los datos de origen se define a nivel de mapeo.
El mapeo es el objeto básico de Informatica con la ayuda del cual podemos definir los detalles de la transformación de datos y las características del objeto de origen / destino. Las asignaciones nos ayudan a definir la transformación de datos en los niveles de columna individuales para cada fila. Incluso en un solo mapeo, puede manejar múltiples fuentes y destinos.
Componentes de la cartografía
Los componentes básicos de un mapeo son
- Tablas de origen
- Mapeo de parámetros y variables
- Objetos de destino
- Mapeo de transformaciones
Hay varios objetos que constituyen un mapeo. Un mapeo puede constar de fuentes, objetivos, parámetros y variables de mapeo, mapplets, diversas transformaciones y funciones definidas por el usuario .
- Fuente de mapeo : las fuentes de mapeo son los objetos desde donde obtiene los datos de origen. Puede ser una tabla de base de datos, un archivo plano, una fuente XML o una fuente de archivo COBOL
- Destino del mapeo : El destino del mapeo son nuestros objetos de destino donde se cargan los datos procesados finales. El destino del mapeo puede ser una tabla relacional de una base de datos, un archivo plano o un archivo XML. Las fuentes y los objetivos son obligatorios en cualquier mapeo, su tipo puede diferir
- Mapeo de parámetros y variables : Mapear parámetros y variables le ayuda a crear objetos variables temporales que le ayudarán a definir y almacenar valores temporales mientras mapea el procesamiento de datos. Los parámetros y variables de mapeo son tipos de datos opcionales definidos por los usuarios, que pueden crearse para un mapeo y pueden ser referenciados y actualizados para un requisito específico. Aprenderemos más sobre el mapeo de parámetros y variables en esta sección.
- Mapplets : Son objetos que consisten en un conjunto de transformación, fuente u objetivos. Los mapplets se crean generalmente para reutilizar la funcionalidad existente de un conjunto de transformaciones. Se puede utilizar en cualquier número de asignaciones.
¿Qué es el mapeo de etapas?
Un mapeo de escenario es un mapeo en el que creamos la réplica de la tabla de origen. Por ejemplo, en un sistema de producción, si tiene una tabla de "empleados", puede crear una tabla idéntica "employee_stage" en el esquema ETL.
Tener una tabla de escenario local ofrece varias ventajas, como el tiempo de inactividad de producción, no afectará su sistema ETL porque tiene su propia tabla "employee_stage", en lugar de referirse a la tabla de producción "employee". En un sistema de producción, puede haber otras operaciones y procesos que afecten el desempeño. Sin embargo, cuando tiene una tabla de preparación de réplicas, solo los procesos ETL accederán a ella. Esto ofrece beneficios de rendimiento.
En mapeos de escenario,
- Las tablas de origen y destino tienen estructuras idénticas
- Los datos de la tabla de destino son una réplica de los datos de la tabla de origen o
- Los datos de la tabla de etapa (destino) son un subconjunto de los datos de origen.
Por ejemplo, si su tabla de origen contiene detalles de empleados de los departamentos 10, 20, 30 y 40. La tabla de preparación puede ser una tabla que tenga registros de empleados de los departamentos 10 y 30 únicamente.
El propósito de crear tablas de etapas en el almacén de datos es hacer que el proceso de transformación de datos sea eficiente al obtener solo aquellos datos que son relevantes para nosotros y también minimizar la dependencia de ETL / almacén de datos del sistema operativo en tiempo real.
Cómo crear un mapeo
En este ejercicio, crearemos un mapeo de etapas, en el que la fuente será "emp table" y el destino será "emptgt".
Convención de nomenclatura : los nombres de asignación tienen el prefijo 'm_' seguido de los nombres de las tablas de origen y destino separados por un signo de subrayado.
Ejemplo: si está cargando la tabla emp_target desde la tabla emp, el nombre de la asignación puede ser 'm_emp_emp_target'.
Paso 1 : lanzamiento de Mapping Designer
- Abra la herramienta de diseñador de Informatica
- Haga clic en el icono de Mapping Designer para iniciar Mapping Designer
Paso 2 : en el diseñador de mapas
- Haga clic en el menú Mappings
- Seleccione Crear opción
Paso 3 : ingrese el nombre de la asignación como 'm_emp_emp_target' y seleccione el botón Aceptar.
La asignación se creará y se enumerará en la carpeta de asignaciones.
Un mapeo debe tener al menos una fuente y un destino , agregará fuentes y destinos al mapeo.
Paso 4 : en este paso,
- Seleccione la tabla de origen "emp" en la carpeta de fuentes.
- Arrastre y suelte la tabla "emp" en el diseñador de mapas.
En el diseñador de mapas, se mostrará la tabla de origen importada.
Nota : cuando importe cualquier tabla relacional (base de datos) en una asignación, también se creará un objeto adicional del tipo de calificador de origen. Esta transformación del calificador de origen es necesaria y ayuda al servicio de integración de Informatica a identificar la tabla de la base de datos de origen y sus propiedades. Siempre que importe una tabla de origen, también se creará una transformación de calificador de origen. Nunca debe eliminar un objeto calificador de origen en una asignación.
Paso 5 : en este paso,
- Seleccione la tabla de origen "emp_target" en la carpeta Destinos.
- Arrastre y suelte la tabla "emp_target" en el diseñador de mapas
En el diseñador de mapas, se importará y mostrará la "tabla de destino".
Para administrar el espacio de visualización, puede iconizar estos objetos en el mapeo.
Paso 6: haga clic con el botón derecho en cualquier lugar del espacio de trabajo vacío del diseñador de mapas y seleccione la opción: Organizar todo icónico.
Después de seleccionar la opción "Organizar todos los icónicos", el espacio de trabajo se verá así.
Paso 7 - En Informatica, diseñamos con el flujo de izquierda a derecha. Por lo tanto, las tablas de origen deben estar en el lado izquierdo y las tablas de destino deben estar a la derecha. Para organizar las tablas en nuestro espacio de trabajo, seleccione la tabla "emp_target", luego arrástrela y suéltela en el lado derecho de la tabla emp.
Después de esta reorganización, el espacio de trabajo se verá así.
Nota : utilice periódicamente el acceso directo "ctrl + s" para guardar los cambios en el repositorio.
Paso 8: ahora tiene tablas de origen y destino en su mapeo, pero el mapeo aún no está completo. Las tablas de origen y destino deben estar vinculadas para completar un mapeo.
Para vincular la fuente y los destinos
Haga doble clic en la tabla SQ_EMP y la tabla EMP_TARGET para cambiar la vista de las mismas de icónica a gráfica.
Paso 9: haga clic con el botón derecho en el espacio de trabajo del diseñador de mapas y seleccione la opción "Autolink" por nombre.
Paso 10: vincular la fuente con la tabla de destino
- Seleccione Columnas de la tabla de origen.
- Arrastre y suelte columnas en la tabla de destino.
Las tablas de origen y destino se vincularán y aparecerán flechas de conexión desde el origen a la tabla de destino.
Nota : aquí ha vinculado todas las columnas de origen a la columna de la tabla de destino respectiva. Significa que, por cada registro de origen obtenido, se cargarán todas las columnas del destino. Si desea excluir una columna específica para que no se cargue, haga clic en el enlace de esa columna y presione la tecla Eliminar del teclado. El enlace se eliminará y la columna de destino no se cargará.
Paso 11 : use el atajo "ctrl + s" para guardar los cambios en su mapeo. En la ventana de salida, puede ver el mensaje de validación / análisis de mapeo. Confirma que su mapeo es válido. Además, habrá una marca de verificación verde temporal junto al nombre de la asignación en el árbol de carpetas de asignación que indica que la asignación se realizó correctamente.
En los mapeos puede haber un requisito, en el que debamos pasar la variable al mapeo o puede haber un escenario en el que necesitemos calcular variables temporales y, además, se requiera almacenarlas para la siguiente sesión de ejecución del mapeo. Para estos fines, creamos parámetros y variables de mapeo.
Mapeo de parámetros y variables
Como todos los lenguajes de programación, Informatica tiene su propia forma de definir parámetros y variables. Pero a diferencia de otros lenguajes de programación, Informatica no es un lenguaje basado en código. Para crear parámetros y variables en Informatica, debe seguir la sintaxis y la navegación predefinidas.
Diferencia entre parámetros y variables -
Parámetros de mapeo |
Asignación de variables |
Los parámetros de mapeo son aquellos tipos de datos cuyo valor una vez asignado permanece constante durante la ejecución de mapeo. Como si hubiera creado un parámetro de mapeo deptno = 20, entonces el valor 20 será constante para toda la ejecución de mapeo. El parámetro donde sea que se haga referencia siempre devolverá el valor 20 para esa instancia de ejecución de mapeo. Para una nueva instancia de mapeo, el valor del parámetro se puede redefinir. |
Las variables de mapeo son objetos a los que se puede hacer referencia a lo largo de la ejecución de mapeo (para acceder a sus valores) y sus valores se pueden reasignar. Por ejemplo, una variable de mapeo de total_salary se puede utilizar en un mapeo y su valor se puede actualizar en función de los salarios. |
Los parámetros y variables de mapeo son específicos de un mapeo únicamente. No se pueden hacer referencia a ellos en otro mapeo.
Cómo crear un parámetro de mapeo
Cuando crea un parámetro de mapeo, durante la ejecución del mapeo, el servicio de integración busca su valor asignado. Estos valores se pueden asignar a los siguientes lugares.
- Archivo de parámetros interno
- En la asignación de variables previa a la sesión
- Valor inicial en repositorio
- Valor predeterminado asignado durante la creación de la variable
Paso 1: para crear un parámetro de mapeo : en el diseñador de mapeo,
- Seleccionar menú de asignaciones
- Seleccionar menú de parámetros y variables
Paso 2 : en la siguiente pantalla,
- Haga clic en el menú Agregar nueva variable
- Desde el menú desplegable, seleccione el tipo como parámetro
- Ingrese el nombre del parámetro como $$ Deptno
- Ingrese un valor inicial de 10
- Seleccione el botón Aceptar
Ahora, ha creado un parámetro de mapeo deptno, con un valor inicialmente asignado de 10, y este parámetro puede ser referenciado dentro del mapeo.
Cómo crear una variable de mapeo
Paso 1: en el diseñador de mapas
- Seleccionar menú de asignaciones
- Seleccionar menú de parámetros y variables
Paso 2 : en la siguiente pantalla
- Haga clic en el menú Agregar nueva variable
- Desde el menú desplegable, seleccione el tipo como variable
- Ingrese el nombre de la variable como $$ TotalSalary
- Seleccione DataType como decimal
- Ingrese un valor inicial de 0
- Seleccione el botón Aceptar
Esto creará una variable de mapeo.
Nota : los nombres de variables y parámetros de mapeo siempre comienzan con $$.
Resumen
Las asignaciones son importantes en Informatica para hacer coincidir los datos de origen con el destino según los requisitos del proyecto. Hemos discutido mapeos de etapas y el concepto de mapeo de variables y parámetros.