Flujo de trabajo en Informatica: creación, tarea, parámetro, reutilizable, administrador

Tabla de contenido:

Anonim
¿Qué es el flujo de trabajo?

El flujo de trabajo es un grupo de instrucciones / comandos para el servicio de integraciones en Informatica. El servicio de integración es una entidad que lee la información del flujo de trabajo del repositorio, obtiene datos de las fuentes y, después de realizar la transformación, los carga en el destino.

Flujo de trabajo: define cómo ejecutar tareas como tarea de sesión, tarea de comando, tarea de correo electrónico , etc.

Para crear un flujo de trabajo

  1. Primero necesitas crear tareas
  2. Y luego agregue esas tareas al flujo de trabajo.

Un flujo de trabajo es como un contenedor vacío, que tiene la capacidad de almacenar un objeto que desea ejecutar. Agrega tareas al flujo de trabajo que desea ejecutar. En este tutorial, haremos lo siguiente en el flujo de trabajo.

La ejecución del flujo de trabajo se puede realizar de dos formas

  • Secuencia : las tareas se ejecutan en el orden en que se definen
  • Basado en eventos: las tareas se ejecutan en función de las condiciones del evento.

Cómo abrir Workflow Manager

Paso 1 : en Informatica Designer, haga clic en el icono del administrador de flujo de trabajo

Paso 2 : esto abrirá una ventana de Workflow Manager. Luego, en el Administrador de flujo de trabajo.

  1. Vamos a conectarnos al repositorio "guru99", así que haga doble clic en la carpeta para conectarse.
  2. Ingrese el nombre de usuario y la contraseña y luego seleccione "Botón Conectar".

Paso 3 : en el administrador de flujo de trabajo.

  1. Haga clic derecho en la carpeta
  2. En el menú emergente, seleccione la opción abierta

Esto abrirá el espacio de trabajo del administrador de flujo de trabajo.

Cómo crear conexiones para Workflow Manager

Para ejecutar cualquier tarea en el administrador de flujo de trabajo, debe crear conexiones . Al usar estas conexiones, el servicio de integración se conecta a diferentes objetos.

Por ejemplo, en su mapeo, si tiene una tabla de origen en la base de datos de Oracle, entonces necesitará una conexión de Oracle para que el servicio de integración pueda conectarse a la base de datos de Oracle para obtener los datos de origen.

Se pueden crear los siguientes tipos de conexiones en el administrador de flujo de trabajo.

  • Conexión relacional
  • Conexión ftp
  • Cola
  • Solicitud

La elección de la conexión que creará dependerá del tipo de sistemas de origen y destino que desee conectar. Más a menudo, utilizaría conexiones relacionales.

Para crear una conexión relacional

Paso 1 : en el Administrador de flujo de trabajo

  1. Haga clic en el menú Conexión
  2. Seleccione la opción relacional

Paso 2 : en la ventana emergente

  1. Seleccione Oracle en tipo
  2. Haga clic en el botón nuevo

Paso 3 : en la nueva ventana de definición del objeto de conexión

  1. Ingrese el nombre de la conexión (nuevo nombre-guru99)
  2. Introduzca su nombre de usuario
  3. Introducir la contraseña
  4. Ingrese la cadena de conexión
  5. Deje otras configuraciones como predeterminadas y seleccione el botón Aceptar

Paso 4 : volverá a la ventana anterior. Haga clic en el botón cerrar.

Ahora está configurado con la conexión relacional en el administrador de flujo de trabajo.

Componentes del administrador de flujo de trabajo

Hay tres herramientas de componentes del administrador de flujo de trabajo que ayudan a crear varios objetos en el administrador de flujo de trabajo. Estas herramientas son

  • Desarrollador de tareas
  • Diseñador de Worklet
  • Diseñador de flujo de trabajo

Desarrollador de tareas: el desarrollador de tareas es una herramienta con la ayuda de la cual puede crear objetos reutilizables. Los objetos reutilizables en el administrador de flujo de trabajo son objetos que se pueden reutilizar en múltiples flujos de trabajo. Por ejemplo, si ha creado una tarea de comando en el desarrollador de tareas, puede reutilizar esta tarea en cualquier cantidad de flujos de trabajo.

El rol del diseñador de flujo de trabajo es ejecutar las tareas que se agregan en él. Puede agregar cualquier número de tareas en un flujo de trabajo.

Puede crear tres tipos de tareas reutilizables en el desarrollador de tareas.

  • Tarea de comando
  • Tarea de sesión
  • Tarea de correo electrónico

Tarea de comando: una tarea de comando se utiliza para ejecutar diferentes comandos de Windows / Unix durante la ejecución del flujo de trabajo. Puede crear una tarea de comando para ejecutar varias tareas basadas en comandos. Con la ayuda de esta tarea, puede ejecutar comandos para crear archivos / carpetas, eliminar archivos / carpetas, hacer ftp de archivos, etc.

Tarea de sesión: se requiere una tarea de sesión en Informatica para ejecutar una asignación.

  • Sin una tarea de sesión, no puede ejecutar o ejecutar un mapeo
  • Una tarea de sesión solo puede ejecutar una única asignación. Entonces, existe una relación uno a uno entre un mapeo y una sesión
  • Una tarea de sesión es un objeto con la ayuda del cual informatica llega a saber cómo y dónde ejecutar un mapeo y en qué momento
  • Las sesiones no se pueden ejecutar de forma independiente, se debe agregar una sesión a un flujo de trabajo
  • En la sesión, se pueden configurar las propiedades de la caché de objetos y también la configuración avanzada de optimización del rendimiento.

Tarea de correo electrónico: con la ayuda de la tarea de correo electrónico, puede enviar correos electrónicos a destinatarios definidos cuando el servicio de integración ejecuta un flujo de trabajo. Por ejemplo, si desea controlar cuánto tiempo tarda en completarse una sesión, puede configurar la sesión para enviar un correo electrónico que contenga los detalles de la hora de inicio y finalización de la sesión. O, si desea que el servicio de integración le notifique cuando un flujo de trabajo se completa o falla, puede configurar la tarea de correo electrónico para el mismo.

Cómo crear una tarea de comando

Paso 1 : para crear una tarea de comando, usaremos Task Developer. En Workflow Manager, abra el desarrollador de tareas haciendo clic en la pestaña "desarrollador de tareas" del menú.

Paso 2 : una vez que se abre el desarrollador de tareas, siga estos pasos

  1. Seleccione el menú Tareas
  2. Seleccione la opción Crear

Paso 3 : en la ventana de creación de tareas

  1. Seleccionar comando como tipo de tarea a crear
  2. Ingrese el nombre de la tarea
  3. Seleccionar el botón crear

Esto creará una carpeta de tareas de comando. Ahora tienes que configurar la tarea para agregar comando en ella, que veremos en el siguiente paso.

Paso 4 : para configurar la tarea, haga doble clic en el icono de tarea de comando y se abrirá una "ventana de edición de tareas". En la nueva ventana de tarea de edición

  1. Seleccionar el menú de comandos
  2. Haga clic en el icono de agregar nuevo comando
  3. Ingrese el nombre del comando
  4. Haga clic en el icono de comando para agregar texto de comando

Esto abrirá un cuadro de editor de comandos.

Paso 5 - En el cuadro del editor de comandos, ingrese el comando "mkdir C: \ guru99" (este es el comando de Windows para crear una carpeta llamada "guru99") y seleccione Aceptar.

Después de este paso, volverá a la ventana de edición de tareas y podrá ver el comando que agregó al cuadro de texto del comando.

Paso 6 : haga clic en Aceptar en la ventana de edición de tareas,

La tarea de comando se creará en el desarrollador de tareas en el repositorio "Guru99".

Nota : use el atajo ctrl + s para guardar los cambios en el repositorio

Cómo crear un flujo de trabajo para ejecutar la tarea de comando

Para ejecutar tareas de comando, debe activar el diseñador de flujo de trabajo. Un diseñador de flujo de trabajo es un objeto principal o contenedor en el que puede agregar varias tareas y cuando se ejecuta el flujo de trabajo, se ejecutarán todas las tareas agregadas. Para crear un flujo de trabajo

Paso 1 : abra el diseñador de flujo de trabajo haciendo clic en el menú del diseñador de flujo de trabajo

Paso 2 : en el diseñador de flujo de trabajo

  1. Seleccionar menú de flujos de trabajo
  2. Seleccione la opción de crear

Paso 3 : en la ventana de creación de flujo de trabajo

  1. Ingrese el nombre del flujo de trabajo
  2. Seleccione el botón Aceptar (deje otras opciones como predeterminadas)

Esto creará el flujo de trabajo.

Convención de nomenclatura: los nombres de flujo de trabajo tienen el prefijo ' wkf_' , si tiene una sesión llamada ' s_m_employee_detail ', el flujo de trabajo para el mismo se puede nombrar como ' wkf_s_m_employee_detail' .

Cuando crea un flujo de trabajo, no consta de ninguna tarea. Entonces, para ejecutar cualquier tarea en un flujo de trabajo, debe agregar una tarea en él.

Paso 4 : para agregar la tarea de comando que hemos creado en el desarrollador de tareas al diseño del flujo de trabajo

  1. En el árbol del navegador, expanda la carpeta de tareas
  2. Arrastre y suelte la tarea de comando al diseñador de flujo de trabajo

Paso 5 : seleccione la "opción de tarea de enlace" de la caja de herramientas del menú superior. (La opción de vincular tarea vincula varias tareas en un flujo de trabajo a la tarea de inicio, de modo que se pueda definir el orden de ejecución de las tareas).

Paso 6 : una vez que seleccione el icono de la tarea de enlace, le permitirá arrastrar el enlace entre la tarea de inicio y la tarea de comando. Ahora seleccione la tarea de inicio y arrastre un enlace a la tarea de comando.

Ahora está listo con el flujo de trabajo que tiene una tarea de comando para ejecutar.

Cómo ejecutar el flujo de trabajo

Paso 1 : ejecutar el flujo de trabajo

  1. Seleccione la opción de flujos de trabajo del menú
  2. Seleccione la opción de flujo de trabajo de inicio

Esto abrirá la ventana del monitor de flujo de trabajo y ejecutará el flujo de trabajo.

Una vez que se ejecuta el flujo de trabajo, ejecutará la tarea de comando para crear una carpeta (carpeta guru99) en el directorio definido.

Tarea de sesión

Se requiere una tarea de sesión en Informatica para ejecutar un mapeo.

Sin una tarea de sesión, no puede ejecutar o ejecutar una asignación y una tarea de sesión solo puede ejecutar una única asignación. Entonces, existe una relación uno a uno entre un mapeo y una sesión. Una tarea de sesión es un objeto con la ayuda del cual Informatica sabe cómo y dónde ejecutar un mapeo y en qué momento. Las sesiones no se pueden ejecutar de forma independiente, se debe agregar una sesión a un flujo de trabajo. En la sesión, se pueden configurar las propiedades de la caché de objetos y también la configuración avanzada de optimización del rendimiento.

Cómo crear una tarea de sesión.

En este ejercicio, creará una tarea de sesión para el mapeo "m_emp_emp_target" que creó en el artículo anterior.

Paso 1 : administrador de flujo de trabajo abierto y desarrollador de tareas abiertas

Paso 2 : ahora, una vez que se abre el desarrollador de tareas, en el administrador de flujo de trabajo, vaya al menú principal

  1. Haga clic en el menú de tareas
  2. Seleccione la opción de crear

Esto abrirá una nueva ventana "Crear tarea"

Paso 3 : en la ventana de creación de tareas

  1. Seleccione la tarea de sesión como tipo de tarea.
  2. Ingrese el nombre de la tarea.
  3. Haga clic en el botón crear

Paso 4 : aparecerá una ventana para seleccionar el mapeo. Seleccione la asignación que desea asociar con esta sesión, para este ejemplo seleccione la asignación "m_emp_emp_target" y haga clic en el botón Aceptar.

Paso 5 : después de eso, haga clic en el botón "Listo"

El objeto de sesión aparecerá en el desarrollador de tareas.

Paso 6 : en este paso, creará un flujo de trabajo para la tarea de la sesión. Haga clic en el icono del diseñador de flujo de trabajo.

Paso 7 : en la herramienta de diseño de flujo de trabajo

  1. Haga clic en el menú de flujo de trabajo
  2. Seleccione la opción de crear

Paso 8 : en la ventana de creación de flujo de trabajo

  1. Ingrese el nombre del flujo de trabajo
  2. Seleccione Aceptar. (deje otras propiedades por defecto, no es necesario cambiar ninguna propiedad)

En el administrador de flujo de trabajo aparecerá una tarea de inicio, es un punto de partida de la ejecución del flujo de trabajo.

Paso 9 : en el administrador de flujo de trabajo

  1. Expanda la carpeta de sesiones debajo del árbol de navegación.
  2. Arrastre y suelte la sesión que creó en el espacio de trabajo del administrador de flujo de trabajo.

Paso 10 : haga clic en la opción de tarea de enlace en la caja de herramientas.

Paso 11 : vincule la tarea de inicio y la tarea de sesión mediante el vínculo.

Paso 12 : haga doble clic en el objeto de sesión en el administrador de flujo de trabajo. Abrirá una ventana de tareas para modificar las propiedades de la tarea.

Paso 13 : en la ventana de edición de tareas

  1. Seleccionar pestaña de mapeo
  2. Seleccionar propiedad de conexión
  3. Asigne la conexión al origen y al destino, la conexión que creamos en los primeros pasos.
  4. Seleccione el botón OK

Ahora su configuración de flujo de trabajo está completa y puede ejecutar el flujo de trabajo.

Cómo agregar varias tareas a una tarea de inicio

La tarea de inicio es un punto de partida para la ejecución del flujo de trabajo. Hay dos formas de vincular varias tareas a una tarea inicial.

  1. Paralela
  2. De serie

En paralelo, las tareas se vinculan directamente a la tarea de inicio y todas las tareas comienzan a ejecutarse en paralelo al mismo tiempo.

Cómo agregar tareas en paralelo

Paso 1: en el administrador de flujo de trabajo, abra el flujo de trabajo "wkf_run_command"

Paso 2: en el flujo de trabajo, agregue la tarea de sesión "s_m_emp_emp_target". (seleccionando sesión y luego arrastrando y soltando)

Paso 3: seleccione la opción de tarea de enlace de la caja de herramientas

Paso 4: vincule la tarea de la sesión a la tarea de inicio (haciendo clic en iniciar taks, manteniendo presionado el clic y conectándose a la tarea de la sesión)

Después de vincular la tarea de la sesión, el flujo de trabajo se verá así.

Paso 5: inicie el flujo de trabajo y supervise en el supervisor de flujo de trabajo.

Cómo agregar tareas en modo serial

Pero antes de agregar tareas en modo serie, tenemos que eliminar la tarea que agregamos para demostrar la ejecución paralela de la tarea. Para eso

Paso 1: abra el flujo de trabajo "w.kf_run_command"

  1. Seleccione el enlace a la tarea de la sesión.
  2. Seleccione la opción de edición en el menú
  3. Seleccione la opción de eliminar

Paso 2: el cuadro de diálogo de confirmación aparecerá en una ventana, seleccione la opción sí

Se eliminará el vínculo entre la tarea de inicio y la tarea de sesión.

Paso 3: ahora vuelve a ir al menú superior y selecciona la opción de tarea de enlace de la caja de herramientas

Paso 4: vincule la tarea de sesión a la tarea de comando

Después de vincular el flujo de trabajo se verá así

Paso 5: para que la apariencia visual del flujo de trabajo sea más clara

  1. Haga clic derecho en el espacio de trabajo del flujo de trabajo
  2. Seleccionar menú de organizar
  3. Seleccione la opción Horizontal

Si inicia el flujo de trabajo, la tarea de comando se ejecutará primero y, después de su ejecución, se iniciará la tarea de sesión.

Variable de flujo de trabajo

Las variables de flujo de trabajo permiten que diferentes tareas en un flujo de trabajo intercambien información entre sí y también permite que las tareas accedan a ciertas propiedades de otras tareas en un flujo de trabajo. Por ejemplo, para obtener la fecha actual, puede utilizar la variable incorporada "sysdate".

El escenario más común es cuando tiene varias tareas en un flujo de trabajo y en una tarea accede a la variable de otra tarea. Por ejemplo, si tiene dos tareas en un flujo de trabajo y el requisito es ejecutar la segunda tarea solo cuando la primera se ejecute correctamente. Puede implementar dicho escenario utilizando una variable predefinida en el flujo de trabajo.

Implementando el escenario

Teníamos un flujo de trabajo "wkf_run_command" con tareas agregadas en modo serial. Ahora agregaremos una condición al enlace entre la tarea de sesión y la tarea de comando, de modo que, solo después del éxito de la tarea de comando, se ejecutará la tarea de sesión.

Paso 1: abra el flujo de trabajo "wkf_run_command"

Paso 2: haga doble clic en el enlace entre la sesión y la tarea de comando

Aparecerá una ventana de expresión

Paso 3: haga doble clic en la variable de estado en el menú "cmd_create_folder". Una variable "$ cmd_create_folder.status" aparecerá en la ventana del editor en el lado derecho.

Paso 4 - Ahora estableceremos la condición de variable "$ cmd_create_folder.status" en estado exitoso. lo que significa que cuando se ejecutan las tareas anteriores y la ejecución fue exitosa, solo ejecute la siguiente tarea de sesión.

  1. Cambie la variable al valor "$ cmd_create_folder.status = SUCCEEDED".
  2. Haga clic en el botón Aceptar

El flujo de trabajo se verá así

Cuando ejecuta este flujo de trabajo, la tarea de comando se ejecuta primero y solo cuando tiene éxito, solo se ejecutará la tarea de sesión.

Parámetro de flujo de trabajo

Los parámetros del flujo de trabajo son aquellos valores que permanecen constantes durante la ejecución. una vez que se asigna su valor, permanece igual. Los parámetros se pueden utilizar en las propiedades del flujo de trabajo y sus valores se pueden definir en archivos de parámetros. Por ejemplo, en lugar de utilizar un valor de conexión codificado de forma rígida, puede utilizar un parámetro / variable en el nombre de la conexión y el valor se puede definir en el archivo de parámetros.

Los archivos de parámetros son los archivos en los que definimos los valores de las variables o parámetros de mapeo / flujo de trabajo. Los archivos tienen la extensión ".par". Como estándar general, se crea un archivo de parámetros para un flujo de trabajo.

Ventajas del archivo de parámetros

  • Ayuda en la migración de código de un entorno a otro
  • Permite una fácil depuración y prueba
  • Los valores se pueden modificar con facilidad sin cambiar el código

Estructura del archivo de parámetros

La estructura del archivo de parámetros

  • [nombre_carpeta.WF:nombre_flujo_trabajo]
  • $ Parameter_name = Parameter_value

Folder_name es el nombre de la carpeta del repositorio, el nombre del flujo de trabajo es el nombre del flujo de trabajo para el que está creando el archivo de parámetros.

Crearemos un archivo de parámetros para la conexión de base de datos "guru99" que asignamos en nuestras primeras sesiones para fuentes y destinos.

Cómo crear un archivo de parámetros

Paso 1: cree un nuevo archivo vacío (archivo de bloc de notas)

Paso 2: en el archivo, ingrese el texto como se muestra en la figura

Paso 3: guarde el archivo en una carpeta guru99 en la ubicación "C: \ guru99" como "wkf_run_command.par"

En el archivo hemos creado un parámetro "$ DBConnection_SRC", asignaremos el mismo a una conexión en nuestro flujo de trabajo.

Paso 4- Abra el flujo de trabajo "wkf_run_command"

  1. Seleccionar menú de flujos de trabajo
  2. Seleccione la opción de edición

Paso 5: esto abrirá la ventana de edición del flujo de trabajo, en esta ventana

  1. Ir al menú de la pestaña de propiedades
  2. Ingrese el nombre del archivo de parámetros como "c: \ guru99 \ wkf_run_command.par"
  3. Seleccione el botón OK

Ahora hemos terminado de definir el contenido del archivo de parámetros y apuntarlo a un flujo de trabajo.

El siguiente paso es usar el parámetro en sesión.

Paso 6 - En el flujo de trabajo, haga doble clic en la sesión "s_m_emp_emp_target", luego

  1. Seleccione el menú de la pestaña de asignaciones
  2. Seleccione la propiedad de conexión en el panel izquierdo
  3. Haga clic en la conexión de destino, que ahora está codificada como "guru99".

Paso 7: aparecerá una ventana del navegador de conexión, en esa ventana

  1. Seleccione la opción para usar la variable de conexión
  2. Ingrese el nombre de la variable de conexión como "$ DBConnection_SRC"
  3. Seleccione el botón Aceptar

Paso 8 : en la ventana de edición de tareas aparecerá la variable de conexión para el objetivo, seleccione el botón Aceptar en la ventana de edición de tareas.

Ahora hemos terminado con la creación de parámetros para una conexión y la asignación de su valor al archivo de parámetros.

Cuando ejecutamos el flujo de trabajo, el flujo de trabajo elige el archivo de parámetros busca el valor de sus parámetros / variables en el archivo de parámetros y toma esos valores.