ADR - Patrones de sincronización basados en eventos

Estado

Partes interesadas

AREA GOBIERNO TECNOLOGICO

Responsable

AREA GOBIERNO TECNOLOGICO

Solución Afectada

TODAS

Recursos Asociados

Responsable

Aprobado por

Consultados

Informados

AREA GOBIERNO TECNOLOGICO

CARLOS GONZALEZ SANTIAGO

ALBERTO FUENTES GOMEZ

LUIS MARTINEZ FONTIVEROS

Asunto a Decidir

Se necesita tomar una decisión sobre cuál será el mecanismo de sincronización con un sistema externo de la información de alojada en un sistema origen.

A continuación se describen los criterios a tener en cuenta para la decisión:

Resiliente: Se debe garantizar la entrega de la información actualizada (no puede haber pérdida de datos en la sincronización)
Transaccional: En caso de error como vuelvo al estado inicial.
Idempotente: Un cambio en la configuración debe tener siempre la misma consecuencia
No invasivo: No debe requerir ningún cambio de código ni de bbdd
Obsolescencia de la sincronía: Es importante mantener la última versión del dato.
Desacoplamiento entre sistemas
Compatible con la Consistencia Eventual
Compatible con las tecnologías actuales definidas en la arquitectura de referencia
- Baremetal
  - Web Logic 12.2
  - Jdk 8
  - Oracle 19c
- Contenedores
  - Open Liberty 20.0.0.12
  - Microprofile 3.3
  - Jdk 11
  - Oracle 19c

Identificación de la decisión

Describe brevemente la decisión arquitectónica tomada.

Contexto

Este caso de uso se divide en dos fases:

Fase 1: Generación del cambio
- Persistir el cambio en el sistema origen
Fase 2: Sincronización
- Sistema origen genera un evento de sincronización en base al cambio producido
- Propagación del evento de sincronización
- Persistir la sincronización en el/los sistema/s destino

Hay diferentes escenarios que se ven impactados por esta sincronización:

Aplicaciones de escritorio
Aplicaciones Web Baremetal (WebLogic)
Aplicaciones Web Contenedores (OKD)

Dentro de la gestión de los proyectos está el aspecto económico:

Con canal de para modificación
Sin canal para modificación

El negocio (aplicación, servicio, microservicio), "SYSTEM A" que hace la persistencia ( nueva inserción u actualización) y después de confirmar la persistencia se notifica un evento de sincronización a un bus externo, dicho evento se consume por un sistema tercero "System B" y se persiste el cambio en el sistema destino. Dándo como resultado final que ambos sistemas quedan sincronizados en base a la gestión del evento.

Gobierno tecnológico > ✔ ADR- Patrones de sincronización basados en eventos > image-2024-5-17_14-58-29.png Diseño para un sistema legacy

Gobierno tecnológico > ✔ ADR- Patrones de sincronización basados en eventos > image-2024-5-17_14-59-8.png Diseño para un sistema nuevo

Evaluación de pros/contras

Pros
No tiene impacto en la BBDD del sistema Origen

Contras
La emisión de eventos y su persistencia indicada en el paso 2, conlleva la implementación de mecanismos de resiliencia adicionales de cara a garantizar la entrega.
*(General)* El sistema A, Requiere cambios en el código para poder emitir los eventos de negocio a remitir al bus de eventos externo: Si la tecnología es muy obsoleta (delphi, jdk antiguos, .net antiguos) puede que no exista cliente de conexíon con el event buffer.
En los legacy puede no haber canal para implementar los cambios
(Configura ) Al tener que convivir con la api del legacy (y hacer los cambios desde dos orígenes de datos ) se pueden generar conflictos en la persistencia debido a la concurrencia
(Configura ) Al tener que convivir con al api del legacy, Si la tecnología es muy obsoleta (delphi, jdk antiguos, .net antiguos) puede que no exista cliente de conexíon con el event buffer

Evaluación de requisitos

Requisito	OK/NOK/NA	Detalle
Resiliente		Aplicación de mecanismos de fault-tolerance en cada uno de los puntos de comunicación (4) Dificultad para mantener la resiliencia en el paso 2 ya que al no persistirse en ningún sitio la necesidad de sincronización cualquier caída del servidor (apagado, bloqueo, degradación, perdida del POD) podría implicar que la sincronización no se lleve a cabo y cuando se reestablezca el sistema perdida de la trazabilidad de los cambios a sincronizar
Transaccional		En ningún caso se garantiza la transaccionalidad de la sincronización completa. Se establecen los siguientes tramos transaccionales: NO - Persistencia del cambio y persistencia del evento de sincronización (Pasos 1 y 2). Si falla la entrega en el buffer habría que realizar una nueva operación de modificación en la bbdd (paso 1) ya que este paso ya ha sido comiteado, por lo que podría aplicarse y tener efectos en la aplicación . SI - Entrega en el Event Buffer(Producer paso 3). Dependiente del tipo de ACK que se establezca en el Producer Tipos de ACK Kafka https://www.geeksforgeeks.org/apache-kafka-producer-acknowledgement-and-min-insync-replicas/ Producer Config SI - Consumo y persistencia del cambio (Paso 5 y 6)
No invasivo - Código		Hay que hacer desarrollos para la implementación de la emisión de los eventos
No invasivo - BBDD		La bbdd del Sistema A no tendría que sufrir ninguna alteración
Compatible con las tecnologías actuales (general)		Nada que reseñar en cuanto a la BBDD, compatible con la tecnología que estén usando actualmente en el proyecto Al requerir cambios en el código y que el Sistema A conecte directamente con el event buffer en proyectos legacy con tecnologías muy antiguas puede que no exista cliente de conexíon con el event buffer

El negocio (aplicación, servicio, microservicio) que hace la persistencia ( nueva inserción u actualización) y después en la misma transacción persiste el cambio en la BBDD. Otro servicio del mismo negocio debe leer esa tabla de eventos (técnica polling cada n ms) e ir generando eventos de sincronización a un bus y este se consume y se persiste el cambio en el sistema destino.

Algunos Ejemplos

Gobierno tecnológico > ✔ ADR- Patrones de sincronización basados en eventos > image-2024-5-13_15-10-57.png

Evaluación de pros/contras

Pros
Garantiza la creación del evento de sincronización gracias a su transacción con la bbdd desde el sistema origen
Al no comunicarse el código del caso de uso directamente con él event buffer, en caso de aplicaciones legacy, siempre se puede tener un microservicio (el cual podría generalizarse para ser reutilizable) actualizado con una tecnología que disponga de un cliente soportado para conectarse con el event buffer.

Contras
Requiere de un Servicio (Microservicio) para realizar la sincronización. Se puede mitigar con generalidades que hagan que esta contra se pueda reducir o desaparecer.pike
Implica cambios de código como en la BBDD
Implica cambios en la BBDD
En los legacy puede no haber canal para realizar los cambios.
Puede tener un impacto en la performance de la bbdd del sistema. No debería ser mucho el impacto, pero es más que no tener nada nuevo en la BBDD.
El uso de triggers para la generación directa de eventos, dependiendo del escenario, puede implicara que la cantidad de triggers aumenten linealmente con la cantidad de tablas bajo consideración.
Si el tamaño ha aumentado puede suponer un aumento en la complejidad si se necesita hacer un cambio en el modelo de datos base, en el de eventos de sincronización o ante una posible refactorización.
El tamaño puede tener un impacto en el rendimiento cada vez que se produce la modificación (insert, update, delete) en cada registro.
(Configura ) Al tener que convivir con la api del legacy (y hacer los cambios desde dos orígenes de datos ) se pueden generar conflictos en la persistencia en la tabla de configuración debido a la concurrencia
(Configura ) Al tener que convivir con la api del legacy (y hacer los cambios desde dos orígenes de datos ) se pueden generar conflictos en la persistencia en la tabla de eventos de sincronización debido a la concurrencia

Evaluación de requisitos

Requisito	OK/NOK	Detalle
Resiliente		Aplicación de mecanismos de fault-tolerance en los 6 puntos. Al hacer uso de una tabla auxiliar y un event buffer puedes tener la garantía de entrega ante caídas. Si el Sistema A se cae, al estar persistida la necesidad de sincronización, se puede volver a retomar desde la última sincronización correcta. El event buffer (Kafka) al tener persistencia de mensajes y posibilidad de ack de entrega puedes garantizar simplemente la recepción o la lectura del mismo por algún consumidor según se defina la necesidad de confirmación de entrega.
Transaccional		Se establecen los siguientes tramos transaccionales: Persistencia del cambio y persistencia del evento de sincronización (Pasos 1 y 2)
No invasivo - Código		Hay que hacer desarrollos para la implementación de la emisión de los eventos.
No invasivo - BBDD		Hay que crear una nueva tabla que persista los eventos que después un servicio leerá para publicar. Definir estrategia de lectura, en batch o individual. Definir el tiempo de polling (ms).
Compatible con las tecnologías actuales		Nada que reseñar en cuanto a la BBDD, compatible con la tecnología que estén usando actualmente en el proyecto.

Gobierno tecnológico > ✔ ADR- Patrones de sincronización basados en eventos > image-2024-5-13_15-14-20.png

Evaluación de pros/contras

Pros
Garantiza la creación del evento de sincronización gracias a al trigger que realiza la bbdd que garantiza su ejecución.
Al no comunicarse el código del caso de uso directamente con él event buffer, en caso de aplicaciones legacy, siempre se puede tener un microservicio (el cual podría generalizarse para ser reutilizable) actualizado con una tecnología que disponga de un cliente soportado para conectarse con el event buffer.
No se tiene que realizara ningún cambio en el código del legacy.

Contras
Requiere de un Servicio (Microservicio) para realizar la sincronización. Se puede mitigar con generalidades que hagan que esta contra se pueda reducir o desaparecer.
Implica cambios de código como en la BBDD.
Puede tener un impacto en la performance de la bbdd del sistema. No debería ser mucho el impacto, pero es más que no tener nada nuevo en la BBDD.
La generación de los eventos de sincronización a partir de relaciones complejas, puede ser costoso a nivel de performance y de construcción.
(Configura ) Al tener que convivir con la api del legacy (y hacer los cambios desde dos orígenes de datos ) se pueden generar conflictos en la persistencia en la tabla de configuración debido a la concurrencia.

Evaluación de requisitos

Requisito	OK/NOK	Detalle
Resiliente		Aplicación de mecanismos de fault-tolerance en los 6 puntos Al hacer uso de una tabla auxiliar y un event buffer puedes tener la garantía de entrega ante caídas. Si el Sistema A se cae, al estar persistida la necesidad de sincronización, se puede volver a retomar desde la última sincronización correcta. El event buffer (Kafka) al tener persistencia de mensajes y posibilidad de ack de entrega puedes garantizar simplemente la recepción o la lectura del mismo por algún consumidor según se defina la necesidad de confirmación de entrega
Transaccional		Se establecen los siguientes tramos transaccionales: Paso 1 y Paso 2 no necesitan transacción ya que es la propia BBDD la que garantiza con el trigger la creación del evento de sincronización en la tabla de eventos
No invasivo - Código		No requiere cambio de código
No invasivo - BBDD		Requiere la creación de una tabla para persistir los eventos de sincronización Requiere la creación de un trigger
Compatible con las tecnologías actuales		Nada que reseñar en cuanto a la BBDD, compatible con la tecnología que estén usando actualmente en el proyecto.

La captura de datos de cambios (CDC) es un patrón de datos que permite producir eventos a partir de los cambios en un almacén de datos.

CDC proporciona un camino para obtener las ventajas de las arquitecturas basadas en eventos reduciendo el esfuerzo de extraer bases de datos de aplicaciones.

La implementación de CDC dependerá de su base de datos, sus casos de uso y el conector que seleccione.:

JDBC: sondean continuamente la base de datos en busca de cambios en las tablas de origen especificadas.
- Sondear una tabla mutable: puede no ser óptimo, ya que inevitablemente perderá actualizaciones que se completen entre los intervalos de sondeo.
- Sondear una tabla inmutable.
  - La primera es simplemente hacer que la tabla sea inmutable y cambiar el código de la aplicación para manejar esta vista de los datos.
  - La segunda opción es adjuntar un disparador a la tabla mutable primaria. Este activador añade una segunda entrada a una tabla de auditoría inmutable. Luego, el conector puede sondear esta tabla de auditoría para detectar cambios sin que falten registros. En este caso, para ORACLE la opción es el GOLDEN-GATE que no está dentro de la licencia disponible para el SAS

Gobierno tecnológico > ✔ ADR- Patrones de sincronización basados en eventos > image-2024-5-13_15-17-50.png

Evaluación de pros/contras

Pros
Garantiza la creación del evento de sincronización a través de los mecanismos de Change Data Capture
Permite extracciones de información mas complejas, abarcando varias tablas por ejemplo.
Se externaliza la gestión de la sincronización por lo que no hace falta implementar un nuevo microservicio
Se externaliza la gestión de algunos aspectos de funcionamiento, a destacar: At-least-once delivery Idempotencia

Contras
Requiere realizar configuraciones en la BBDD para activar la captura de los dato.
La activación del CDC de forma nativa en la BBDD (ORACLE GOLDEN GATE y CDC ORACLE CONFIG) está fuera de soporte por lo que se tiene que hacer uso de otro sistema externo (Debizum)
La solución al no ser nativa, y sobre una tecnología que no es opensource (ORACLE), aumenta el riesgo de incompatibilidades
Posible impacto en la performance de la bbdd

Requisito	OK/NOK	Detalle
Resiliente		Aplicación de mecanismos de fault-tolerance en los 6 puntos Al hacer uso de una tabla auxiliar y un event buffer puedes tener la garantía de entrega ante caídas. Si el Sistema A se cae, al estar persistida la necesidad de sincronización, se puede volver a retomar desde la última sincronización correcta. El event buffer (Kafka) al tener persistencia de mensajes y posibilidad de ack de entrega puedes garantizar simplemente la recepción o la lectura del mismo por algún consumidor según se defina la necesidad de confirmación de entrega
Transaccional		Se establecen los siguientes tramos transaccionales: Paso 1 y Paso 2 no necesitan transacción ya que es la propia BBDD la que garantiza con el trigger la creación del evento de sincronización en la tabla de eventos
Idempotente		Dependiente de la implementación. Se deberán transmitir claves del evento y estas ser registradas en algún elemento de la transmisión para descartar aquellos mensajes duplicados. https://www.geeksforgeeks.org/effective-strategy-to-avoid-duplicate-messages-in-apache-kafka-consumer/ https://medium.com/lydtech-consulting/kafka-deduplication-patterns-1-of-2-ef0371a3331b https://developer.confluent.io/tutorials/message-ordering/kafka.html Dependiente de la implementación
Desacoplamiento entre sistemas		Para mantener el desacoplamiento es necesario que los eventos de sincronización sean agnósticos al sistema destino (Sistema B). Como la comunicación con los sistemas es a través de un event buffer, el sistema origen no conoce a los sistemas destino por lo que queda desacoplado.
No invasivo - Código		No requiere cambios en el código
No invasivo - BBDD		Hay que aplicar los cambios en la BBDD que se indican en el manual de instalación.
Compatible con las tecnologías actuales		https://debezium.io/documentation/reference/stable/connectors/oracle.html Debizum Oracle Installation comatibility → compatible con single instance y rac Oracle 19 Deprecated o Desupporter → Logminer: Deprecated XStreams: unsoported OpenLogReplicator: Según Debezium : "The OpenLogReplicator ingestion adapter is currently in incubating state, i.e. exact semantics, configuration options etc. may change in future revisions, based on the feedback we receive." Ficha técnica Debezium-OpenLogReplicator: Database: 12c, 19c, 21c Driver: 12.2.x, 19.x, 21.x OpenLogReplicator: 1.3.0 Supported versions: 11.2, 12.1, 12.2, 18c, 19c, 21c. Supported editions: XE, SE, SE2, PE, EE Database must be in single instance mode (non RAC) The database must be working in ARCHIVELOG mode and having enabled MINIMAL SUPPLEMENTAL LOGGING. Supported platforms: Linux64, Solaris x64, Solaris Sparc Supported storage: file system (ext4, btrfs, zfs, xfs, sshfs) Supported database character set, es probable que que esté soportada (estándar UTF está incluido)

El impacto sobre los siguientes requisitos es el mismo para todas las alternativas

Requisito	OK/NOK	Detalle
Resiliente		Definir un ADR con los mecanismo de resiliencia para los puntos críticos: Persistencia del cambio Generación del evento de sincronización Propagación del evento de sincronización Persistencia del evento de sincronización
Transaccional		En ninguna de las alternativas se puede garantizar la transaccionalidad de la sincronización completa. Se establecen los siguientes tramos transaccionales para cualquiera de las alternativas, dentro de la fase de sincronización Entrega en el Event Buffer(Producer). Dependiente del tipo de ACK que se establezca en el Producer Tipos de ACK Kafka https://www.geeksforgeeks.org/apache-kafka-producer-acknowledgement-and-min-insync-replicas/ Producer Config Consumo y persistencia del cambio
Idempotente		Se necesita un ADR para determinar la estrategia de idempotencia (duplicación de mensajes) En todas las alternativas analizadas la estrategia de idempotencia es dependiente de la implementación de la fase de sincronización Se deberán transmitir claves del evento y estas ser registradas en algún elemento de la transmisión para descartar aquellos mensajes duplicados. https://www.geeksforgeeks.org/effective-strategy-to-avoid-duplicate-messages-in-apache-kafka-consumer/ https://medium.com/lydtech-consulting/kafka-deduplication-patterns-1-of-2-ef0371a3331b https://developer.confluent.io/tutorials/message-ordering/kafka.html
Desacoplamiento entre sistemas		En todas las alternativas se contempla que la fase de sincronización sea a través de un event buffer por lo que el desacoplamiento con el sistema destino está garantizado siempre y cuando la definición de los eventos de sincronización sean agnósticos al sistema destino (Sistema B).
Obsolescencia del Dato		Necesita de un ADR. En todas las alternativas se contempla que la fase de sincronización sea a través de un event buffer por lo que la estrategia que se determine es compatible con cualquiera de las alternativas. Posible estrategia, generar un timestamp de la operación por el Sistema A y transmitir dicho timestamp hasta la pieza encargada de valorar la fecha del dato a sincronizar. En caso de ser inferior a la última sincronización confirmada se descartaría el evento.
Compatible con la consistencia eventual		Necesita de un ADR que haga el análisis de impacto y en caso de determinar que hay impacto determinar la estrategia a seguir por el Sistema A (el origen que en este caso es Configura) para que su reacción sea previsible Esto es algo que no depende de la estrategia de sincronización si no que es inherente al hecho de necesitar sincronización. Eso provocará que el Sistema A (Origen) y el Sistema b (Destino) durante un periodo de tiempo x no tengan la misma información. Esto implica que dependerá del análisis que haga el Sistema A ( en este caso CONFIGURA) de como le impacta dicha consistencia eventual y que contramedidas implementará para que esto no ocurra.
Compatible con las tecnologías actuales		En todas las alternativas so contempla que la fase de sincronización sea a través de un event buffer por lo que la compatibilidad de esta pieza aplica a todas por igual: Versiones de interoperabilidad Matriz de compatibilidades Compatibilidad Java Soporte Cliente Java

Actualiza el estado actual de la decisión y si ha habido algún cambio o evolución.

ADR - Patrones de sincronización basados en eventos

Estado

Partes interesadas

AREA GOBIERNO TECNOLOGICO

TAGS

13 may 2024

Responsable

Solución Afectada

TODAS

Recursos Asociados

Responsable

Aprobado por

Consultados

Informados

Asunto a Decidir

Identificación de la decisión

Contexto