ADR  - Patrones de sincronización basados en eventos

Estado

Partes interesadas

TAGS



Pre-releaseVigenteRetiro

 

--


Responsable

Solución Afectada

TODAS

Recursos Asociados



Responsable

Aprobado por

Consultados

Informados

AREA GOBIERNO TECNOLOGICO 

CARLOS GONZALEZ SANTIAGO 

ALBERTO FUENTES GOMEZ 

LUIS MARTINEZ FONTIVEROS 


 



Asunto a Decidir

Se necesita tomar una decisión sobre cuál será el mecanismo de sincronización con un sistema externo de la información de alojada en un sistema origen. 

A continuación se describen los criterios a tener en cuenta para la decisión:
  • Resiliente: Se debe garantizar la entrega de la información actualizada (no puede haber pérdida de datos en la sincronización)
  • Transaccional: En caso de error como vuelvo al estado inicial.
  • Idempotente: Un cambio en la configuración debe tener siempre la misma consecuencia
  • No invasivo:  No debe requerir ningún cambio de código ni de bbdd 
  • Obsolescencia de la sincronía: Es importante mantener la última versión del dato.
  • Desacoplamiento entre sistemas
  • Compatible con la Consistencia Eventual
  • Compatible con las tecnologías actuales definidas en la arquitectura de referencia
    • Baremetal
      • Web Logic 12.2
      • Jdk 8
      • Oracle 19c
    • Contenedores
      • Open Liberty 20.0.0.12
      • Microprofile 3.3
      • Jdk 11
      • Oracle 19c


Identificación de la decisión

Describe brevemente la decisión arquitectónica tomada.

Contexto

Este caso de uso se divide en dos fases:

  • Fase 1: Generación del cambio
    • Persistir el cambio en el sistema origen
  • Fase 2: Sincronización
    • Sistema origen genera un evento de sincronización en base al cambio producido
    • Propagación del evento de sincronización
    • Persistir la sincronización en el/los sistema/s destino

Hay diferentes escenarios que se ven impactados por esta sincronización:

  • Aplicaciones de escritorio
  • Aplicaciones Web Baremetal (WebLogic)
  • Aplicaciones Web Contenedores (OKD)

Dentro de la gestión de los proyectos está el aspecto económico:

  • Con canal de para modificación
  • Sin canal para modificación




El negocio (aplicación, servicio, microservicio), "SYSTEM A"  que hace la persistencia ( nueva inserción u actualización) y después de confirmar la persistencia se notifica un evento de sincronización a un bus externo, dicho evento se consume por un sistema tercero "System B" y se persiste el cambio en el sistema destino. Dándo como resultado final que ambos sistemas quedan sincronizados en base a la gestión del evento.


Diseño para un sistema legacy

Diseño para un sistema nuevo

Evaluación de pros/contras

Pros
No tiene impacto en la BBDD del sistema Origen
Contras
  • La emisión de eventos y su persistencia indicada en el paso 2, conlleva la implementación de mecanismos de resiliencia adicionales de cara a garantizar la entrega. 

(General)   El sistema A, Requiere cambios en el código para poder emitir los eventos de negocio a remitir al bus de eventos externo:

  • Si la tecnología es muy obsoleta (delphi, jdk antiguos, .net antiguos) puede que no exista cliente de conexíon con el event buffer.

En los legacy puede no haber canal para implementar los cambios

(Configura ) Al tener que convivir con la api del legacy (y hacer los cambios desde dos orígenes de datos ) se pueden generar conflictos en la persistencia debido a la concurrencia

(Configura ) Al tener que convivir con al api del legacy, Si la tecnología es muy obsoleta (delphi, jdk antiguos, .net antiguos) puede que no exista cliente de conexíon con el event buffer

Evaluación de requisitos

RequisitoOK/NOK/NADetalle
Resiliente

Aplicación de mecanismos de fault-tolerance en cada uno de los puntos de comunicación (4)

Dificultad para mantener la resiliencia en el paso 2 ya que al no persistirse en ningún sitio la necesidad de sincronización cualquier caída del servidor (apagado, bloqueo, degradación, perdida del POD) podría implicar que la sincronización no se lleve a cabo y cuando se reestablezca el sistema perdida de la trazabilidad de los cambios a sincronizar

Transaccional

En ningún caso se garantiza la transaccionalidad de la sincronización completa.

Se establecen los siguientes tramos transaccionales:

No invasivo - Código

Hay que hacer desarrollos para la implementación de la emisión de los eventos

No invasivo - BBDD

La bbdd del Sistema A no tendría que sufrir ninguna alteración

Compatible con las tecnologías actuales

(general)

Nada que reseñar en cuanto a la BBDD, compatible con la tecnología que estén usando actualmente en el proyecto

Al requerir cambios en el código y que el Sistema A conecte directamente con el event buffer en proyectos legacy con tecnologías muy antiguas puede que no exista cliente de conexíon con el event buffer

El negocio (aplicación, servicio, microservicio) que hace la persistencia ( nueva inserción u actualización) y después en la misma transacción persiste el cambio en la BBDD. Otro servicio del mismo negocio debe leer esa tabla de eventos (técnica polling cada n ms) e ir generando eventos de sincronización a un bus y este se consume y se persiste el cambio en el sistema destino.

Algunos Ejemplos

Evaluación de pros/contras

Pros
Garantiza la creación del evento de sincronización gracias a su transacción con la bbdd desde el sistema origen
Al no comunicarse el código del caso de uso directamente con él event buffer, en caso de aplicaciones legacy, siempre se puede tener un microservicio (el cual podría generalizarse para ser reutilizable) actualizado con una tecnología que disponga de un cliente soportado para conectarse con el event buffer.
Contras

Requiere de un Servicio (Microservicio) para realizar la sincronización. Se puede mitigar con generalidades que hagan que esta contra se pueda reducir o desaparecer.pike

Implica cambios de código como en la BBDD

Implica cambios en la BBDD

En los legacy puede no haber canal para realizar los cambios.

Puede tener un impacto en la performance de la bbdd del sistema. No debería ser mucho el impacto, pero es más que no tener nada nuevo en la BBDD.

El uso de triggers para la generación directa de eventos, dependiendo del escenario, puede implicara que la cantidad de triggers aumenten linealmente con la cantidad de tablas bajo consideración.

Si el tamaño ha aumentado puede suponer un aumento en la complejidad si se necesita hacer un cambio en el modelo de datos base, en el de eventos de sincronización o ante una posible refactorización.

El tamaño puede tener un impacto en el rendimiento cada vez que se produce la modificación (insert, update, delete) en cada registro.

(Configura ) Al tener que convivir con la api del legacy (y hacer los cambios desde dos orígenes de datos ) se pueden generar conflictos en la persistencia en la tabla de configuración debido a la concurrencia

(Configura ) Al tener que convivir con la api del legacy (y hacer los cambios desde dos orígenes de datos ) se pueden generar conflictos en la persistencia en la tabla de eventos de sincronización debido a la concurrencia

Evaluación de requisitos

RequisitoOK/NOKDetalle
Resiliente

Aplicación de mecanismos de fault-tolerance en los 6 puntos.

Al hacer uso de una tabla auxiliar y un event buffer puedes tener la garantía de entrega ante caídas. Si el Sistema A se cae, al estar persistida la necesidad de sincronización, se puede volver a retomar desde la última sincronización correcta. El event buffer (Kafka) al tener persistencia de mensajes y posibilidad de ack de entrega puedes garantizar simplemente la recepción o la lectura del mismo por algún consumidor según se defina la necesidad de confirmación de entrega.

Transaccional

Se establecen los siguientes tramos transaccionales:

  • Persistencia del cambio y persistencia del evento de sincronización (Pasos 1 y 2)
No invasivo - Código

Hay que hacer desarrollos para la implementación de la emisión de los eventos.
No invasivo - BBDD

Hay que crear una nueva tabla que persista los eventos que después un servicio leerá para publicar.

Definir estrategia de lectura, en batch o individual.

Definir el tiempo de polling (ms).

Compatible con las tecnologías actuales

Nada que reseñar en cuanto a la BBDD, compatible con la tecnología que estén usando actualmente en el proyecto.

Evaluación de pros/contras

Pros
Garantiza la creación del evento de sincronización gracias a al trigger que realiza la bbdd que garantiza su ejecución.
Al no comunicarse el código del caso de uso directamente con él event buffer, en caso de aplicaciones legacy, siempre se puede tener un microservicio (el cual podría generalizarse para ser reutilizable) actualizado con una tecnología que disponga de un cliente soportado para conectarse con el event buffer.
No se tiene que realizara ningún cambio en el código del legacy.
Contras

Requiere de un Servicio (Microservicio) para realizar la sincronización. Se puede mitigar con generalidades que hagan que esta contra se pueda reducir o desaparecer.

Implica cambios de código como en la BBDD.

Puede tener un impacto en la performance de la bbdd del sistema. No debería ser mucho el impacto, pero es más que no tener nada nuevo en la BBDD.

La generación de los eventos de sincronización a partir de relaciones complejas, puede ser costoso a nivel de performance y de construcción.

(Configura ) Al tener que convivir con la api del legacy (y hacer los cambios desde dos orígenes de datos ) se pueden generar conflictos en la persistencia en la tabla de configuración debido a la concurrencia.

Evaluación de requisitos

Requisito OK/NOKDetalle
Resiliente

Aplicación de mecanismos de fault-tolerance en los 6 puntos

Al hacer uso de una tabla auxiliar y un event buffer puedes tener la garantía de entrega ante caídas. Si el Sistema A se cae, al estar persistida la necesidad de sincronización, se puede volver a retomar desde la última sincronización correcta. El event buffer (Kafka) al tener persistencia de mensajes y posibilidad de ack de entrega puedes garantizar simplemente la recepción o la lectura del mismo por algún consumidor según se defina la necesidad de confirmación de entrega

Transaccional

Se establecen los siguientes tramos transaccionales:

  • Paso 1 y Paso 2 no necesitan transacción ya que es la propia BBDD la que garantiza con el trigger la creación del evento de sincronización en la tabla de eventos
No invasivo - Código

No requiere cambio de código
No invasivo - BBDD

Requiere la creación de una tabla para persistir los eventos de sincronización

Requiere la creación de un trigger

Compatible con las tecnologías actuales

 Nada que reseñar en cuanto a la BBDD, compatible con la tecnología que estén usando actualmente en el proyecto.

La captura de datos de cambios (CDC) es un patrón de datos que permite producir eventos a partir de los cambios en un almacén de datos.

CDC proporciona un camino para obtener las ventajas de las arquitecturas basadas en eventos reduciendo el esfuerzo de extraer bases de datos de aplicaciones.

La implementación de CDC dependerá de su base de datos, sus casos de uso y el conector que seleccione.:

  •  JDBC: sondean continuamente la base de datos en busca de cambios en las tablas de origen especificadas.
    • Sondear una tabla mutable: puede no ser óptimo, ya que inevitablemente perderá actualizaciones que se completen entre los intervalos de sondeo.
    • Sondear una tabla inmutable
      • La primera es simplemente hacer que la tabla sea inmutable y cambiar el código de la aplicación para manejar esta vista de los datos.
      • La segunda opción es adjuntar un disparador a la tabla mutable primaria. Este activador añade una segunda entrada a una tabla de auditoría inmutable. Luego, el conector puede sondear esta tabla de auditoría para detectar cambios sin que falten registros. En este caso, para ORACLE la opción es el GOLDEN-GATE que no está dentro de la licencia disponible para el SAS

Evaluación de pros/contras

Pros
Garantiza la creación del evento de sincronización a través de los mecanismos de Change Data Capture
Permite extracciones de información mas complejas, abarcando varias tablas por ejemplo.
Se externaliza la gestión de la sincronización por lo que no hace falta implementar un nuevo microservicio

Se externaliza la gestión de algunos aspectos de funcionamiento, a destacar:

Contras

Requiere realizar configuraciones en la BBDD para activar la captura de los dato.

La activación del CDC de forma nativa en la BBDD (ORACLE GOLDEN GATE y CDC ORACLE CONFIG) está fuera de soporte por lo que se tiene que hacer uso de otro sistema externo (Debizum)

La solución al no ser nativa, y sobre una tecnología que no es opensource (ORACLE), aumenta el riesgo de incompatibilidades

Posible impacto en la performance de la bbdd


    

RequisitoOK/NOKDetalle
Resiliente

Aplicación de mecanismos de fault-tolerance en los 6 puntos

Al hacer uso de una tabla auxiliar y un event buffer puedes tener la garantía de entrega ante caídas. Si el Sistema A se cae, al estar persistida la necesidad de sincronización, se puede volver a retomar desde la última sincronización correcta. El event buffer (Kafka) al tener persistencia de mensajes y posibilidad de ack de entrega puedes garantizar simplemente la recepción o la lectura del mismo por algún consumidor según se defina la necesidad de confirmación de entrega

Transaccional

Se establecen los siguientes tramos transaccionales:

  • Paso 1 y Paso 2 no necesitan transacción ya que es la propia BBDD la que garantiza con el trigger la creación del evento de sincronización en la tabla de eventos 
Idempotente

Dependiente de la implementación. Se deberán transmitir claves del evento y estas ser registradas en algún elemento de la transmisión para descartar aquellos mensajes duplicados.

Dependiente de la implementación
Desacoplamiento entre sistemas

Para mantener el desacoplamiento es necesario que los eventos de sincronización sean agnósticos al sistema destino (Sistema B).

Como la comunicación con los sistemas es a través de un event buffer, el sistema origen no conoce a los sistemas destino por lo que queda desacoplado.

No invasivo - Código

No requiere cambios en el código
No invasivo - BBDD

Hay que aplicar los cambios en la BBDD que se indican en el manual de instalación.
Compatible con las tecnologías actuales

  • https://debezium.io/documentation/reference/stable/connectors/oracle.html
  • Debizum Oracle Installation comatibility → compatible con single instance y rac
  • Oracle 19 Deprecated o Desupporter → 
    • Logminer: Deprecated
    • XStreams: unsoported
    • OpenLogReplicator: Según Debezium : "The OpenLogReplicator ingestion adapter is currently in incubating state, i.e. exact semantics, configuration options etc. may change in future revisions, based on the feedback we receive."
  • Ficha técnica Debezium-OpenLogReplicator:
    • Database: 12c, 19c, 21c
    • Driver: 12.2.x, 19.x, 21.x
    • OpenLogReplicator: 1.3.0
    • Supported versions: 11.2, 12.1, 12.2, 18c, 19c, 21c.
    • Supported editions: XE, SE, SE2, PE, EE
    • Database must be in single instance mode (non RAC)
    • The database must be working in ARCHIVELOG mode and having enabled MINIMAL SUPPLEMENTAL LOGGING.
    • Supported platforms: Linux64, Solaris x64, Solaris Sparc
    • Supported storage: file system (ext4, btrfs, zfs, xfs, sshfs)
    • Supported database character set, es probable que que esté soportada (estándar UTF está incluido)


El impacto sobre los siguientes requisitos es el mismo para todas las alternativas

RequisitoOK/NOKDetalle
Resiliente

Definir un ADR con los mecanismo de resiliencia para los puntos críticos:

  • Persistencia del cambio
  • Generación del evento de sincronización
  • Propagación del evento de sincronización
  • Persistencia del evento de sincronización
Transaccional


En ninguna de las alternativas se puede garantizar la transaccionalidad de la sincronización completa.

Se establecen los siguientes tramos transaccionales para cualquiera de las alternativas, dentro de la fase de sincronización

Idempotente

Se necesita un ADR para determinar la estrategia de idempotencia (duplicación de mensajes)

En todas las alternativas analizadas la estrategia de idempotencia es dependiente de la implementación de la fase de sincronización 

 Se deberán transmitir claves del evento y estas ser registradas en algún elemento de la transmisión para descartar aquellos mensajes duplicados.

Desacoplamiento entre sistemas

En todas las alternativas se contempla que la fase de sincronización sea a través de un event buffer por lo que el desacoplamiento con el sistema destino está garantizado siempre y cuando la definición de los eventos de sincronización sean agnósticos al sistema destino (Sistema B).

Obsolescencia del Dato

Necesita de un ADR. En todas las alternativas se contempla que la fase de sincronización sea a través de un event buffer por lo que la estrategia que se determine es compatible con cualquiera de las alternativas.

Posible estrategia, generar un timestamp de la operación por el Sistema A y transmitir dicho timestamp hasta la pieza encargada de valorar la fecha del dato a sincronizar. En caso de ser inferior a la última sincronización confirmada se descartaría el evento.

Compatible con la consistencia eventual

Necesita de un ADR que haga el análisis de impacto y en caso de determinar que hay impacto determinar la estrategia a seguir por el Sistema A (el origen que en este caso es Configura) para que su reacción sea previsible

Esto es algo que no depende de la estrategia de sincronización si no que es inherente al hecho de necesitar sincronización. Eso provocará que el Sistema A (Origen) y el Sistema b (Destino) durante un periodo de tiempo x no tengan la misma información. Esto implica que dependerá del análisis que haga el Sistema A ( en este caso CONFIGURA) de como le impacta dicha consistencia eventual y que contramedidas implementará para que esto no ocurra.

Compatible con las tecnologías actuales


En todas las alternativas so contempla que la fase de sincronización sea a través de un event buffer por lo que la compatibilidad de esta pieza aplica a todas por igual:




Actualiza el estado actual de la decisión y si ha habido algún cambio o evolución.