Rela AIRela AI Docs
Monitoreo de Condición

Monitoreo de Condición

Mantenimiento predictivo ISO 13374 end-to-end: del sensor al pronóstico, con un solo inbox de alertas consolidadas y un índice de salud que combina 5 señales.

Monitoreo de Condición

El Monitoreo de Condición es el sistema de mantenimiento predictivo de Rela AI. Va más allá de las alarmas de umbral simple: aprende cómo se comporta normalmente cada equipo, monitorea su salud en el tiempo, detecta anomalías con modelos de ML, estima cuándo podría fallar, y consolida todas esas señales en un único inbox de alertas para que el operador vea una fila por activo, no tres por el mismo evento físico.

Resumen ejecutivo

El cambio de juego: dejar de reaccionar, empezar a anticipar. Antes, tres sistemas independientes gritaban lo mismo y nadie sabía qué acción tomar. Hoy, un único inbox unificado consolida detecciones mecánicas, energéticas y de vida útil en una sola alerta por activo, con severidad canónica A/B/C/D/F y recomendaciones accionables.

Antes vs Después

DimensiónAntes (reactivo)Después (Rela AI predictivo)
Detección de fallasEl equipo falla → operador llama → técnico acude18–72 h de anticipación con RUL estimado
Inbox del operador3 alertas del mismo pico (anomalía + energía + RUL)1 fila consolidada por activo, severidad = max
Decisión de mantenimientoCalendario fijo o reactivoCondición real + confianza + umbrales por tenant
Señal temprana MLIgnorada hasta que disparaba una alarma ISA-18.2anomaly_pressure ya afecta el AHI desde el primer evento
Drift silenciosoMotor pierde 0.5%/semana por meses sin ser detectadoPage-Hinkley lo captura a los 20 samples
Auditoría"¿Qué umbral había cuando esto se calificó A?" sin respuestaCada snapshot lleva config_version trazable

¿Para qué sirve?

El mantenimiento reactivo (esperar la falla) y el mantenimiento preventivo por calendario (cambiar el aceite cada 3 meses, sin importar el estado real del equipo) son los dos extremos del mantenimiento industrial. El mantenimiento predictivo es el punto óptimo: intervenir exactamente cuando el equipo lo necesita, basándose en su condición real.

El Monitoreo de Condición permite:

  • Detectar deterioro gradual semanas antes de que cause una falla.
  • Estimar la vida útil remanente de un componente (¿cuántos días más puede operar?).
  • Priorizar el mantenimiento en los equipos que más lo necesitan, no en los que tienen la fecha más cercana en el calendario.
  • Reducir paradas no programadas — la causa más costosa de pérdida de producción.
  • Consolidar el ruido de múltiples sistemas de detección en un inbox accionable.

Pipeline end-to-end

flowchart LR
  S[Sensores / PLC / SCADA] --> I[Ingesta MQTT / OPC UA / Modbus / S7 / EtherNet-IP / HTTP]
  I --> F[Field mapping + normalización]
  F --> T[Tendencias + baselines]
  T --> A1[Detección ML<br/>IsolationForest + LOF]
  T --> A2[Residuales de energía<br/>z-score + Page-Hinkley]
  T --> H[Asset Health Index<br/>5 sub-índices]
  H --> P[Pronósticos RUL<br/>+ CBM triggers]
  A1 --> AG[Alert Aggregator<br/>dedup por asset]
  A2 --> AG
  P --> AG
  AG --> INBOX[Inbox unificado<br/>1 fila por activo]
  INBOX --> TASK[Orden de trabajo]
  INBOX --> CMMS[CMMS sync]
  INBOX --> NOTIF[WhatsApp / Email]

Cada bloque es documentable, observable y configurable por tenant:

¿Cómo funciona? — Los 6 niveles ISO 13374

Rela AI implementa el estándar internacional ISO 13374 de monitoreo de condición, que organiza el proceso en 6 niveles que se alimentan entre sí:

Nivel 1: Adquisición de Datos

Los datos crudos de sensores, PLCs y sistemas SCADA llegan al sistema a través de los protocolos soportados nativamente: HTTP, MQTT, OPC UA (incluido Reverse Connect), Modbus TCP, S7comm y EtherNet/IP (CIP). Se almacenan con su timestamp original y se normalizan para que todos los datos hablen el mismo idioma, sin importar de qué equipo vengan. Ver Protocolos industriales.

Nivel 2: Análisis de Tendencias

Los datos crudos se procesan para extraer información útil: promedios móviles, máximos y mínimos, tasas de cambio, desviaciones estándar. Aquí es donde los datos sueltos se convierten en tendencias legibles — puedes ver si la temperatura del motor ha estado subiendo lentamente durante las últimas 2 semanas.

Ver Análisis de Tendencias.

Nivel 3: Detección de Estado

El sistema ejecuta dos flujos complementarios:

  • Condición vs línea base — compara datos actuales contra baselines aprendidos.
  • Detección de anomalías ML — un ensemble de IsolationForest + LocalOutlierFactor asigna un score 0–1 a cada lectura; lo que supera 0.7 entra al inbox. Ver Detección de Anomalías.

Cada detección se traduce a una severidad canónica (info, warning, high, critical) que es el idioma común de todo el sistema: anomalías mecánicas, picos de energía, RUL crítico — todos hablan la misma escala.

Nivel 4: Evaluación de Salud

Combina cinco sub-índices en un único Índice de Salud del Activo (AHI) — un número de 0 a 100 que resume el estado general del equipo.

Sub-índicePeso defaultQué mide
condition0.35Estado instantáneo vs baselines
alarm_health0.20Horas-alarma acumuladas (ISA-18.2), con cap por alarma
maintenance_compliance0.15Cumplimiento de planes preventivos vencidos
trend_stability0.10Dirección + r² de tendencias de 24h
anomaly_pressure0.20Densidad de detecciones ML recientes (7d), por severidad

Los pesos se pueden ajustar por tenant y por asset_type (una bomba crítica puede ponderar anomaly_pressure más alto que un compresor tolerante). Ver Configuración Predictiva.

El AHI se traduce a una calificación de grados:

GradoAHIEstado del equipo
A90-100Excelente — sin problemas detectados
B70-89Bueno — monitorear normalmente
C50-69Aceptable — investigar en próxima ronda
D30-49Insatisfactorio — programar intervención
F0-29Crítico — riesgo de falla inminente

Los umbrales A/B/C/D también son configurables por tenant (ahi_grades).

Nivel 5: Pronósticos

Basándose en la tendencia histórica del AHI, el sistema estima:

  • RUL (Remaining Useful Life) en horas, con intervalo de confianza bootstrap.
  • Tasa de degradación en puntos de AHI por día.
  • CBM trigger — métricas que cruzan cbm_trigger_multiplier × baseline.
  • Probabilidad de falla — función del AHI y los breakpoints critical_ahi, high_ahi, normal_ahi.

Ver Pronósticos.

Nivel 6: Recomendaciones + Inbox consolidado

La inteligencia artificial genera recomendaciones en lenguaje natural. Cada detección se publica al Alert Aggregator, que consolida las señales de los tres sistemas (anomalía ML, energía, pronóstico) en una fila por activo y propaga a WhatsApp, email, CMMS o tareas.

Niveles de Madurez Predictiva

Cada equipo progresa automáticamente por 4 niveles a medida que acumula datos:

NivelNombreRequisitosCapacidades
0MonitoreoSin datos suficientesAlertas básicas
1Seguimiento de Salud10+ snapshotsAHI activo, tendencias visibles
2Predicción30+ snapshots + 1 falla registradaRUL confiable, recomendaciones
3Optimizado30+ snapshots + 3 fallas + confianza > 70%Automatización completa, auto-CBM

La progresión es automática — el sistema evalúa los requisitos después de cada snapshot y promueve al activo sin intervención manual. Los umbrales (snapshots mínimos, fallas requeridas, confianza mínima) son configurables por tenant.

Trazabilidad: config_version

Cada snapshot de salud y cada prognóstico lleva un campo config_version con el número de la configuración predictiva que estuvo activa en el momento del cálculo. Si un tenant ajusta ahi_grades o rul_thresholds, las alertas anteriores no se reescriben: conservan su versión original. Una auditoría puede reconstruir exactamente qué umbrales produjeron cada calificación.

Casos de uso con impacto medible

Caso 1 — Bomba pre-falla detectada 18h antes. Compresor C-03 con AHI histórico 87 (B). En 3 semanas baja a 65 (C). Pronóstico estima 9 días para alcanzar F si sigue la tendencia. El sistema crea tarea urgente; el técnico encuentra filtro de aceite obstruido. Reemplazo + AHI sube a 83 en 2 días. Falla evitada, 4 horas de parada no ocurrida.

Caso 2 — Motor con drift silencioso. Motor de extrusora con consumo dentro de ±2σ durante 4 meses, pero derivando +0.3% por semana. El z-score nunca dispara. Page-Hinkley sobre los residuales de consumo detecta el cambio de régimen a los 20 samples. Mantenimiento alinea el acople y el consumo vuelve a la baseline. Ahorro estimado por el propio sistema: valor monetario proyectado sobre el delta mensual de consumo.

Caso 3 — Inbox unificado sin ruido. Un pico real de vibración en la bomba B-07 dispara simultáneamente anomaly_detection, energy_service y prognostics. Antes: 3 alertas críticas abiertas, el operador dudaba cuál atender. Después: 1 fila en _alerts con source_systems = [anomaly, energy, prognostics], severidad critical, count = 3. Una sola acción cierra las tres.

¿Cómo activar el monitoreo de condición?

El sistema se activa progresivamente — no necesitas configurar todos los niveles de una vez:

Fase 1 — Recopilación y tendencias (Niveles 1-2):

  1. Conecta las fuentes de datos de tus equipos críticos (Fuentes de Eventos).
  2. Deja que el sistema acumule al menos 7-14 días de datos.
  3. Revisa los gráficos de tendencia para familiarizarte con el comportamiento de los equipos.

Fase 2 — Líneas base, anomalías y salud (Niveles 3-4):

  1. Con 30+ días de datos, calcula las líneas base de cada equipo.
  2. Entrena los modelos de anomalía ML por tenant.
  3. Activa la evaluación de salud — el AHI empieza a calcularse automáticamente.
  4. Configura umbrales de alerta por grado de salud.

Fase 3 — Predicción, recomendaciones y consolidación (Niveles 5-6):

  1. Con suficiente historial, activa los pronósticos de vida útil.
  2. Ajusta la ventana de dedup del aggregator (alert_dedup_window_minutes, default 60).
  3. Integra las recomendaciones con tu flujo de mantenimiento.

Beneficios clave

  • Del reactivo al predictivo: intervenir antes de la falla, con días de anticipación.
  • Índice de salud con 5 señales — incluye la señal ML temprana (anomaly_pressure) que no depende de alarmas ISA.
  • Un solo inbox — consolidación cross-sistema con severidad max y trail de sources por alerta.
  • Umbrales por tenant y por tipo de activo — sin tocar código.
  • Trazabilidad completa vía config_version para auditoría.
  • Detección de drift gradual (Page-Hinkley) que los z-scores tradicionales no ven.
  • Estándar ISO 13374 internacionalmente reconocido.

En esta página