1

Oracle Data Integrator 12c para análisis en tiempo real

Oracle apuesta por la nube.
Oracle apuesta por la nube.

Oracle, como una forma de atender los pedidos de los clientes empresariales que claman mayor inmediatez en los reportes de datos, ha actualizado su portafolio de software de integración de datos para que éste pueda entregar de manera más rápida datos a los data warehouses y a las aplicaciones de análisis.

La versión más reciente de su software ETL (extract transform and load), Oracle Data Integrator 12c, ha sido configurada para trabajar con la versión más reciente de la herramienta de replicación de base de datos de Oracle, Oracle GoldenGate 12c, de tal forma que los dos programas puedan funcionar en conjunto para proporcionar datos casi en tiempo real a los sistemas de análisis.

Oracle también le dio a Oracle Data Integrator 12c una forma más sencilla de construir y mantener los flujos de datos, y proporcionó a GoldenGate 12c una manera más rápida de inyectar los datos en las bases de datos Oracle replicadas, sostuvo Brad Adelberg, vicepresidente de desarrollo de Oracle.

Generalmente, los clientes han usado Oracle Data Integrator (ODI) para extraer datos de múltiples fuentes de datos y alimentarlos en los data warehouses y aplicaciones de inteligencia de negocios. La extracción de datos tendía a ser programada durante las horas en las que la organización no trabaja, de tal forma que la operación no ralentice el desempeño de la base de datos durante las horas pico de uso, sostuvo Adelberg. Generalmente, esto se producía durante la noche.

Lo malo con este enfoque es que los datos extraídos siempre serían al menos de un día de antigüedad, lo cual resultaría problemático para los gerentes y analistas que prefieren que los datos se encuentren lo más actualizados que sea posible. Sin embargo, hacer querying en una base de datos a cada hora representaría una carga excesiva para un sistema de base de datos de producción.

Para conseguir actualizaciones más frecuentes, algunos usuarios de Oracle comenzaron a utilizar GoldenGate para tomar los datos de un sistema de base de datos tan pronto como éstos se han actualizado y enviarlos a ODI, que a su vez los rutearía hacia el data warehouse. GoldenGate es una tecnología de replicación de base de datos que no genera mucho overhead para el propio sistema de base de datos fuente, así que puede usarse durante las horas de trabajo pico sin que tenga un efecto pernicioso.

Para el release 12c de ODI, Oracle formalizó esta conexión entre las dos aplicaciones. Ahora, los desarrolladores que usan Oracle Data Integrator Studio tienen un conjunto de controles para generar y administrar las operaciones de GoldenGate, lo que les permite configurar con facilidad los flujos de trabajo que usan GoldenGate para extraer los datos.

Este conjunto de controles debería minimizar la necesidad de tener un experto de GoldenGate a la mano para utilizar el software, indicó Adelberg. Igualmente, las capacidades GoldenGate de ODI pueden reducir en gran forma el número de reuniones entre el administrador de GoldenGate de la organización y el administrador de ODI para facilitar o actualizar el flujo de datos, asumiendo que los dos puestos no se encuentran en manos de la misma persona.

Oracle Data Integrator 12c, que Adelberg describió como un upgrade importante para Oracle, también incluye varias otras características. El software ahora ejecuta más operaciones en paralelo, lo cual acelera el tiempo de desempeño.

También, ODI ahora proporciona una nueva manera de mapear los flujos de los datos, algo llamado declarative flow-based mapping. El declarative flow-based mapping combina los mejores atributos del flow-based mapping -que es fácil de usar pero requiere de mucha configuración manual- con el declarative programming, que es más difícil de dominar pero requiere de menor configuración y mantenimiento manual para realizar cambios de bajo nivel en el sistema.

El declarative flow-based mapping usa el modelo de flujo visual pero no requiere de desarrolladores para añadir o actualizar manualmente las configuraciones de bajo nivel, indicó Adelberg.

GoldenGate 12c también tiene algunas nuevas características. Ahora ofrece una forma más rápida de entregar los datos a un sistema secundario de base de datos Oracle. En lugar de inyectar los datos a través de queries SQL, ahora puede modificar directamente los logs de cambio de la base de datos de replicación, reduciendo el tiempo de transferencia de datos a la mitad o más gracias a que el proceso ya no despliega el motor SQL de la base de datos.

Ambos productos también soportan ahora Oracle 12c, la más reciente versión del sistema de base de datos de Oracle. El rango de soporte de los sistemas de administración de datos, tanto de Oracle como de otras fuentes, también se ha ampliado para ambos productos. Oracle Data Integrator 12c puede ahora trabajar con Apache Hadoop y Oracle Warehouse Builder. GoldenGate puede ahora trabajar con la más reciente versión de Sybase, MySQL y Oracle Coherence.

Joab Jackson, IDG News Service

Conéctese a la actualidad tecnológica e informática cada mañana. ¡Suscríbase gratis a nuestro Newsletter!