Estado | ||||
---|---|---|---|---|
TAGS | ||||
Tomada el | ||||
Responsable | ||||
Documentación Asociada | ||||
Solución Afectada | Todas las nuevas soluciones software a partir de la fecha de decisión. | |||
Responsable | Aprobado por | Consultados | Informados | |
Se Requiere una decisión respecto a la estrategia a seguir con respecto a la gestión de logs, en primera instancia, y a toda observabilidad en el escenario objetivo. |
Antes de entrar en detalle hay que contar con que la observabilidad en el escenario objetivo se plantea basada en el estándar Opentelemetry.
Se proponen (2) opciones para no saturar el sistema de gestión de la solución entregada:
|
Las alternativas se consideran en tres aspectos principales además de los aspectos secundarios que se consideren oportunos:
|
En base al análisis de las opciones planteada se concluye que la mejor alternativa es el uso de OpenTelemetry mediante la instrumentación con opentelemetry-javaagent Todas las opciones analizadas diferentes de Opentelémetry o bien amenazan la estabilidad del sistema o bien implican sobrecostes y desarrollos no reutilizables, por lo que los sobrecostes no se recuperarán.
E*: Despliegue temporal de un collector de Opentelemetry propio y exporta la salida a un sistema por definir (file, ELK, EFK, Kafka...) puede ser necesario algún desarrollo si el sistema de explotación no dispone de exportador nativo. (los exportadores existentes están en la url https://github.com/open-telemetry/opentelemetry-collector-contrib/exporter). La complejidad de despliegue y configuración de un collector es baja Con Kafka
Con OpenTelemetry:
|
La instrumentación mediante OpenTelemery se basa en tres partes bien diferenciadas:
Teniendo estos tres bloques claros Debemos tener claro que el primer bloque aplica a la solución entregada y los puntos 2 y 3 pertenecen CTI. Todo lo indicado hasta ahora en este apartado implica que para desplegar la solución entregada:
El diseño final podría considerarse de la siguiente forma, donde la salida de los colectores es la que se decida aplicar ya que en este punto no está amenazada la estabilidad del sistema y es posible escalar para asumir el rendimiento necesario. Importante, en el punto anterior se indica el ámbito de responsabilidad de cada actor, esta imagen permite tener una perspectiva del objetivo: |