¿Qué son los servicios de datos de SAP?
SAP Data Services es una herramienta ETL que brinda una solución de nivel empresarial único para la integración de datos, transformación, calidad de datos, elaboración de perfiles de datos y procesamiento de datos de texto desde la fuente heterogénea a una base de datos o almacén de datos de destino.
Podemos crear aplicaciones (trabajo) en las que se puede realizar el mapeo y la transformación de datos utilizando el Diseñador. (La última versión de SAP BODS es 4.2).
Características de los servicios de datos
- Proporciona transformaciones paralelas de alto rendimiento.
- Tiene herramientas administrativas integrales y herramienta de informes.
- Es compatible con múltiples usuarios.
- SAP BODS es muy flexible con una aplicación basada en servicios web.
- Permite el lenguaje de secuencias de comandos con un rico conjunto de funciones.
- Los servicios de datos se pueden integrar con SAP LT Replication Server (SLT), con el
Tecnología basada en disparadores. SLT agrega capacidades delta a cada tabla de origen de SAP o no SAP
Lo que permite utilizar la captura de datos para cambiar y transferir los datos delta de
la tabla Fuente.
- Validación de datos con cuadros de mando y auditoría de procesos.
- Herramienta de administración con capacidades de programación y monitoreo / cuadros de mando.
- Depuración y creación de perfiles y visualización de datos integrados.
- SAP BODS admite amplia fuente y destino.
- Cualquier aplicación (por ejemplo, SAP).
- Cualquier base de datos con carga masiva y captura de datos de cambios
- Archivos: ancho fijo, delimitado por comas, COBOL, XML, Excel.
Componente de servicios de datos
Los servicios de SAP DATA tienen el siguiente componente:
- Diseñador: es una herramienta de desarrollo mediante la cual podemos crear, probar y ejecutar un trabajo que llena un almacén de datos.
Permite al desarrollador crear objetos y configurarlos seleccionando un icono en un diagrama de flujo de origen a destino.
Se puede utilizar para crear una aplicación especificando flujos de trabajo y flujos de datos.
Para abrir el Diseñador de servicios de datos, vaya al menú Inicio -> Todos los programas -> Servicios de datos de SAP (4.2 aquí) -> Diseñador de servicios de datos.
- Job Server: es una aplicación que lanza el motor de procesamiento de servicios de datos y sirve como una interfaz para el motor y la suite de servicios de datos.
- Motor- motor de servicio de datos ejecuta trabajos individuales que se definen en la aplicación.
- Repositorio: el repositorio es una base de datos que almacena objetos predefinidos por el diseñador y objetos definidos por el usuario (metadatos de origen y destino, reglas de transformación).
Los repositorios son de dos tipos:
- Repositorio local (utilizado por Designer y Job Server).
- Repositorio central (utilizado para compartir objetos y control de versiones)
- Acceso Servidor- servidor de acceso transmite mensajes entre aplicaciones web, servidor de tareas de servicios de datos y motores.
- Administrador: el administrador web proporciona administración basada en navegador de los recursos de servicios de datos. Los detalles son los siguientes:
- Configurar, iniciar y detener servicios en tiempo real.
- Programación, seguimiento y ejecución de trabajos por lotes.
- Configuración del uso del servidor de tareas, el servidor de acceso y el repositorio.
- Gestión de usuarios.
- Publicar trabajos por lotes y servicios en tiempo real a través de servicios web
- Configuración y gestión de adaptadores.
Arquitectura de servicios de datos -
La arquitectura de servicios de datos tiene el siguiente componente:
- Repositorio central: se utiliza para configuraciones de repositorios en servidores de trabajos, administración de seguridad, control de versiones y uso compartido de objetos.
- Diseñador: se utiliza para crear proyecto, trabajo, flujo de trabajo, flujo de datos y ejecución.
- Repositorio local (aquí puede crear cambios e iniciar trabajos, flujo de trabajo, flujo de datos).
- Servidor y motor de trabajos: gestiona los trabajos.
- Servidor de acceso: se utiliza para ejecutar los trabajos en tiempo real creados por los desarrolladores en los repositorios.
En la imagen de abajo, se muestran los servicios de datos y la relación de componentes.
Arquitectura SAP BODS
Detalle de la ventana del diseñador: primero examinamos el primer componente del servicio de datos de SAP: el diseñador
El detalle de cada sección del diseñador de servicios de datos es el siguiente:
- Barra de herramientas (utilizada para abrir, guardar, retroceder, validar, ejecutar, etc.).
- Área de proyecto (contiene el proyecto actual, que incluye Trabajo, Flujo de trabajo y Flujo de datos. En Servicios de datos, todas las entidades son objetos.
- Espacio de trabajo (el área de la ventana de la aplicación en la que definimos, mostramos y modificamos objetos).
- Biblioteca de objetos locales (contiene objetos del repositorio local, como transformaciones, trabajo, flujo de trabajo, flujo de datos, etc.).
- Paleta de herramientas (los botones de la paleta de herramientas le permiten agregar nuevos objetos al espacio de trabajo).
Jerarquía de objetos
El siguiente diagrama muestra las relaciones jerárquicas para los tipos de objetos clave dentro de los servicios de datos.
>
Nota:
Los flujos de trabajo y el Condicional * son opcionales
Los objetos utilizados en el detalle de los servicios de datos de SAP son los siguientes:
Objetos | Descripción |
Proyecto | Un proyecto es un objeto de nivel superior en la ventana del Diseñador. Los proyectos le brindan una manera de organizar los otros objetos que crea en Servicios de datos. Sólo un proyecto está abierto a la vez (donde "abierto" significa "visible en el área de proyecto"). |
Trabajo | Un "trabajo" es la unidad de trabajo más pequeña que puede programar de forma independiente para su ejecución. |
Guiones | Un subconjunto de líneas en un procedimiento. |
Flujo de trabajo | Un "flujo de trabajo" es la incorporación de varios flujos de datos en un flujo de trabajo coherente para un trabajo completo. El flujo de trabajo es opcional. El flujo de trabajo es un procedimiento.
|
Flujo de datos | Un "flujo de datos" es el proceso mediante el cual los datos de origen se transforman en datos de destino. Un flujo de datos es un objeto reutilizable. Siempre se llama desde un flujo de trabajo o un trabajo.
|
Almacén de datos | Canal lógico que conecta los servicios de datos con las bases de datos de origen y destino de Datastore.
|
Objetivo | Tabla o archivo en el que Data Services carga datos del origen. |
Ejemplo de servicios de datos mediante la carga de datos de la tabla de origen de SAP
Todo en los servicios de datos es un objeto. Necesitamos separar el almacén de datos para cada base de datos de origen y de destino.
Pasos para cargar datos desde la tabla de origen de SAP: SAP BODS tiene muchos pasos, en los que necesitamos crear un almacén de datos para el origen y el destino y mapearlos.
- Crear almacén de datos entre la fuente y los BODS
- Importe los metadatos (estructuras) a BODS.
- Configurar el servidor de importación
- Importe los metadatos al sistema HANA.
- Cree un almacén de datos entre BODS a HANA.
- Crear proyecto.
- Crear trabajo (por lotes / en tiempo real)
- Crear flujo de trabajo
- Crear flujo de datos
- Agregar objeto en el flujo de datos
- Ejecuta el trabajo
- Verifique la vista previa de datos en HANA
Paso 1) Crear un almacén de datos entre SAP Source y BODS
- Para cargar datos de SAP Source a SAP HANA a través de SAP BODS, necesitamos un almacén de datos. Entonces, primero creamos un almacén de datos como se muestra a continuación:
Proyecto -> Nuevo -> Almacén de datos
- Aparecerá una ventana emergente para Crear un nuevo almacén de datos, ingrese los detalles a continuación:
- Introduzca el nombre del almacén de datos "ds_ecc".
- Seleccione el nombre del tipo de almacén de datos como "Aplicaciones SAP".
- Ingrese el nombre del servidor de la base de datos
- Nombre de usuario y contraseña.
- Haga clic en el botón "Aplicar".
- Haga clic en el botón "Aceptar".
- El almacén de datos se creará y verá el almacén de datos creado como se muestra a continuación:
- Ir a la biblioteca de objetos locales
- Seleccione la pestaña DataStore.
- Se mostrará el almacén de datos "ds_ecc".
Paso 2) Importar metadatos (estructura) al servidor BODS.
Hemos creado un almacén de datos para ECC a BODS; ahora importamos metadatos de ECC a BODS. Para importar, siga los pasos a continuación:
- Seleccione Datastore "ds_ecc" y haga clic derecho.
- Seleccione la opción Importar por nombre.
Se mostrará una ventana emergente para Importar por nombre. Ingrese los detalles como se muestra a continuación:
- Seleccione Tipo como tabla.
- Ingrese el nombre de la tabla que queremos importar. Aquí estamos importando la tabla KNA1.
- Haga clic en el botón "Importar". La tabla KNA1 aparecerá debajo del nodo de tabla de la fuente de datos "ds_ecc".
Los metadatos de la tabla se importarán en el almacén de datos ds_ecc como se muestra a continuación:
Paso 3) Configurar el servidor de importación
Hasta ahora hemos importado la tabla a los datos almacenados "ds_ecc" creado para ECC a SAP BODS Connection. Para importar datos a SAP HANA, necesitamos configurar el servidor de importación,
- Para hacer esto, vaya a Vista rápida-> Configurar servidor de importación como se muestra a continuación -
- Aparecerá una ventana emergente para Select System, Select SAP HANA (HDB here) System como se muestra a continuación:
- Haga clic en el botón "Siguiente". Aparecerá otra ventana emergente para la credencial del servicio de datos, ingrese los siguientes detalles
- Dirección del servidor SAP BODS (aquí BODS: 6400)
- Ingrese el nombre del repositorio de SAP BODS (nombre del repositorio de HANAUSER)
- Ingrese la fuente de datos ODBC (ZTDS_DS).
- Ingrese el puerto predeterminado para el servidor SAP BODS (8080).
Haga clic en el botón "Finalizar".
Paso 4) Importar los metadatos al sistema HANA
1. Hasta ahora hemos configurado el servidor de importación, ahora importaremos metadatos del servidor SAP BODS.
- Haga clic en la opción Importar en Vista rápida.
- Se mostrará una ventana emergente para la opción Importar. Seleccione la opción "Importación selectiva de metadatos".
Haga clic en el botón "Siguiente".
2. Se mostrará una ventana emergente para "Importación selectiva de metadatos", en la que seleccionamos el sistema de destino.
- Seleccione Sistema SAP HANA (HDB aquí).
Haga clic en el botón "Siguiente".
Paso 5) Crear un almacén de datos entre BODS y HANA
Como sabemos, en BODS necesitamos crear un almacén de datos separado para el origen y el destino. Ya hemos creado un almacén de datos para la fuente, ahora necesitamos crear un almacén de datos para el destino (entre BODS y HANA). Entonces, creamos un nuevo almacén de datos con el nombre "DS_BODS_HANA".
- Vaya a Proyecto -> Nuevo -> Almacén de datos.
- Aparecerá una pantalla para Crear nuevo almacén de datos como se muestra a continuación.
- Ingrese el nombre del almacén de datos (DS_BODS_HANA).
- Ingrese el tipo de almacén de datos como Base de datos.
- Ingrese el tipo de base de datos como SAP HANA.
- Seleccione la versión de la base de datos.
- Ingrese el nombre del servidor de la base de datos SAP HANA.
- Ingrese el nombre del puerto para la base de datos de SAP HANA.
- Ingrese el nombre de usuario y la contraseña.
- Marque "Habilitar la transferencia automática de datos".
Haga clic en "Aplicar" y luego en el botón "Aceptar".
El almacén de datos "DS_BODS_HANA" se mostrará en la pestaña del almacén de datos de la biblioteca de objetos locales como
Debajo-
- Ahora importamos la tabla en el almacén de datos "DS_BODS_HANA".
- Seleccione el almacén de datos "DS_BODS_HANA" y haga clic derecho.
- Seleccione Importar por nombre.
- Aparecerá una ventana emergente para Importar por nombre como se muestra a continuación:
- Seleccione Tipo como tabla.
- Ingrese el nombre como KNA1.
- El propietario se mostrará como Hanauser.
- Haga clic en el botón Importar.
La tabla se importará en el almacén de datos "DS_BOD_HANA". Para ver los datos en la tabla, siga los pasos a continuación:
- Haga clic en la tabla "KNA1" en el almacén de datos "DS_BODS_HANA".
- Los datos se mostrarán EN formato TABULAR.
Paso 6) Definir proyecto: grupo de proyectos y organización de objetos relacionados. El proyecto puede contener cualquier cantidad de trabajos, flujo de trabajo y flujo de datos.
- Vaya al menú Proyecto de diseñador.
- Seleccione nueva opción.
- Seleccione la opción Proyecto.
Aparecerá una ventana emergente para la creación de un nuevo proyecto como se muestra a continuación. Ingrese el nombre del proyecto y haga clic en el botón Crear. Creará una carpeta de proyecto en nuestro caso BODS_DHK.
Paso 7) Definir trabajo: un trabajo es un objeto reutilizable. Contiene flujos de trabajo y flujo de datos. Los trabajos se pueden ejecutar de forma manual o programada. Para ejecutar el proceso BODS necesitamos definir el trabajo.
Creamos un trabajo como JOB_Customer.
- Seleccione el proyecto (BODS_DHK) creado en el paso 1, haga clic con el botón derecho y seleccione "Nuevo trabajo por lotes".
- Cambie el nombre a "JOB_Customer".
Paso 8) Defina el flujo de trabajo:
- Seleccione el trabajo "JOB_Customer" en el área del proyecto,
- Haga clic en el botón de flujo de trabajo en la paleta de herramientas. Haga clic en el área Black Workspace. Aparecerá un icono de flujo de trabajo en el espacio de trabajo.
- Cambie el nombre del flujo de trabajo a "WF_Customer".
Haga clic en el nombre del flujo de trabajo, aparecerá una vista vacía del flujo de trabajo en el espacio de trabajo.
Paso 9) Defina el flujo de datos:
- Haga clic en Flujo de trabajo "WF_Customer".
- Haga clic en el botón Flujo de datos en la paleta de herramientas. Haga clic en el área Black Workspace. Aparecerá un icono de Dataflow en el espacio de trabajo.
- Cambie el nombre del flujo de datos a "DF_Customer".
- El flujo de datos también aparece en el área del proyecto a la izquierda debajo del nombre del trabajo.
Paso 10) Agregar objeto en el flujo de datos:
Dentro del flujo de datos, podemos proporcionar instrucciones para transformar los datos de origen en la forma deseada para la tabla de destino.
Veremos debajo del objeto -
- Un objeto para la fuente.
- Un objeto para la mesa de destino.
- Un objeto para la transformación de consultas. (Query transform mapea las columnas desde el origen al destino).
Haga clic en el flujo de datos DF_Customer. Aparecerá un espacio de trabajo en blanco como se muestra a continuación:
- Especifique el objeto de la fuente: vaya al almacén de datos "ds_ecc", seleccione la tabla KNA1 y arrastre y suelte en la pantalla en blanco del flujo de datos como se muestra a continuación.
- Especifique el objeto para el destino: seleccione el almacén de datos "DS_BODS_HANA" del repositorio y seleccione la tabla KNA1.
- Arrastre y suelte en el espacio de trabajo y seleccione la opción "Hacer objetivo". Habrá dos tablas para origen y destino. Aquí definiremos la tabla como fuente y destino.
- Transformación de consultas: esta es una herramienta que se utiliza para recuperar datos basados en el esquema de entrada para condiciones específicas del usuario y para transportar datos desde el origen al destino.
- Seleccione el icono de Transformación de consulta de la paleta de herramientas, y arrástrelo y suéltelo entre el objeto de origen y el de destino en el espacio de trabajo como se muestra a continuación:
- Vincular el objeto de consulta a la fuente.
- Vincular el objeto de consulta a la tabla de destino.
- Haga doble clic en el icono de consulta. Con esto, mapeamos una columna del esquema de entrada al esquema de salida.
Cuando hacemos clic en el icono de Consulta, aparecerá una siguiente ventana para el mapeo, en la que hacemos los siguientes pasos:
- Se selecciona la tabla fuente KNA1.
- Seleccione todas las columnas de la tabla de origen, haga clic con el botón derecho y seleccione un mapa para generar.
- Se asignará la salida de destino seleccionada como consulta y la columna.
5. Guarde y valide el proyecto.
1. Haga clic en Validar icono.
2. Aparece una ventana emergente para el éxito de la validación.
Paso 11) Ejecutar trabajo: para ejecutar el trabajo, siga la siguiente ruta:
- Seleccione el icono Área del proyecto para abrir el proyecto y seleccione el proyecto creado.
- Seleccione Trabajo y haga clic derecho.
- Seleccione la opción Ejecutar para ejecutar el trabajo.
- Después de ejecutar el trabajo, se muestra una ventana de registro de trabajos, en la que se mostrarán todos los mensajes relacionados con el trabajo.
- El último mensaje será El trabajo <> se completó correctamente.
Paso 12): validar / verificar datos en la base de datos de SAP HANA.
- Inicie sesión en la base de datos de SAP HANA a través de SAP HANA Studio y seleccione el esquema HANAUSER.
- Seleccione la tabla KNA1 en el nodo Tabla.
- Haga clic con el botón derecho en la tabla KNA1 y seleccione Abrir vista previa de datos.
- Tabla (KNA1) Los datos cargados por los procesos BODS como arriba se mostrarán en la pantalla de vista previa de datos.