Rela AIRela AI Docs
Funcionalidades

Consumo de IA

El consumo de IA muestra cuánto cuesta cada operación de inteligencia artificial de tus agentes: respuestas, búsquedas, extracciones de documentos. Incluye consejos prácticos para reducir costos sin perder calidad.

Consumo de IA

Cada vez que un agente responde un mensaje, procesa un correo, o analiza un documento, el sistema usa un modelo de IA que tiene un costo por uso. La sección de Consumo de IA muestra ese costo desglosado por tipo de operación, permite identificar qué está generando más gasto, y ofrece herramientas para optimizarlo sin que los técnicos noten la diferencia.

¿Para qué sirve?

En una planta con múltiples agentes respondiendo cientos de mensajes diarios, los costos de IA pueden acumularse rápidamente si los agentes no están bien configurados. Un agente que envía 30 mensajes de historial al modelo en cada consulta cuesta 3 veces más que uno que envía 10, para el mismo resultado.

El módulo de consumo permite:

  • Ver el costo acumulado del mes por tipo de operación
  • Identificar cuál agente o función está generando más gasto
  • Tomar decisiones informadas sobre configuración para reducir costos
  • Anticipar el costo mensual antes de que termine el período

¿Cómo funciona?

El sistema registra cada llamada a los modelos de IA con la cantidad de texto enviado y recibido. Los modelos de lenguaje cobran por tokens — un token equivale aproximadamente a 3-4 caracteres de texto en español. Cuanto más largo es el mensaje enviado al modelo (incluyendo el historial de conversación), más tokens se consumen.

Los servicios con costo de IA incluyen:

  • Respuestas de agentes de WhatsApp y email (modelo de lenguaje)
  • Procesamiento de eventos por agentes de máquina (modelo de lenguaje)
  • Búsqueda semántica en colecciones (embeddings)
  • Extracción de datos de documentos (modelo de visión)
  • Búsqueda web (por búsqueda ejecutada)
  • Envío de correos electrónicos (por correo enviado)

¿Cómo usarlo?

Ver el consumo mensual

Ve a Administración > Consumo de IA para ver el resumen del mes actual:

  • Total del mes: costo total acumulado de todos los servicios
  • Desglose por servicio: cuánto corresponde a WhatsApp, email, extracciones, búsqueda web, y otros
  • Comparación con mes anterior: si el consumo está subiendo o bajando

Identificar agentes con alto consumo

Si el costo está subiendo más de lo esperado, revisa qué agente está consumiendo más:

  1. En el desglose, identifica el servicio con mayor costo (ej: WhatsApp).
  2. Revisa la configuración del agente de mayor uso — especialmente el campo de mensajes de contexto.
  3. Verifica si el prompt del agente es innecesariamente largo.

Optimizar el costo sin perder calidad

Reducir el historial de conversación enviado al modelo: La configuración más importante para controlar costos es cuántos mensajes anteriores de la conversación se incluyen en cada llamada al modelo. Un valor de 10 a 15 mensajes es suficiente para la mayoría de los agentes. Valores de 25 a 30 triplican el costo de entrada sin mejorar significativamente las respuestas.

Para ajustarlo: ve al agente de WhatsApp o email → edita la configuración → busca el campo "Mensajes de contexto" → reduce a 10.

Elegir el modelo correcto según la tarea: Rela AI soporta modelos de distintas capacidades y costos. Para respuestas simples y consultas de inventario, un modelo de menor costo funciona perfectamente. Para análisis complejos de documentos técnicos o reportes detallados, el modelo más capaz justifica su costo mayor.

Consulta con el equipo de Rela AI qué modelo está asignado a cada tipo de agente y si hay una opción más económica adecuada para tu caso de uso.

Escribir prompts concisos: El prompt del agente se envía al modelo en cada llamada. Un prompt de 2,000 palabras con instrucciones redundantes cuesta mucho más que uno de 600 palabras bien escrito. Revisa los prompts de tus agentes y elimina repeticiones, ejemplos innecesarios, y reglas que se contradicen.

Usar búsqueda exacta en lugar de semántica cuando sea posible: La búsqueda semántica en colecciones (que entiende sinónimos y paráfrasis) genera un costo de embedding. La búsqueda exacta por código o número de serie no tiene ese costo. En herramientas de consulta donde el técnico siempre proporciona un código exacto (número de parte, código de activo), configura el campo como "coincidencia exacta".

Acotar la búsqueda web: Si tus agentes tienen la función de búsqueda web activada, limitar qué sitios pueden consultar reduce búsquedas innecesarias. Por ejemplo, un agente de mantenimiento industrial solo necesita buscar en sitios de fabricantes y normas técnicas — no en sitios generales.

Beneficios clave

  • Visibilidad completa del costo de IA por servicio y período
  • Identificación rápida de cuál agente o función está generando más gasto
  • Consejos de optimización que reducen costos sin cambiar la experiencia del usuario
  • Historial de consumo mensual para comparar tendencias y presupuestar
  • Desglose granular por tipo de operación (WhatsApp, email, extracciones, etc.)

Casos de uso comunes

Escenario 1: Reducir costo de agente de alto volumen El agente de WhatsApp del área de mantenimiento responde un promedio de 400 mensajes por día. El consumo mensual de ese agente era $180. Al revisar la configuración, el coordinador encuentra que el agente tenía 28 mensajes de contexto configurados y un prompt de 1,800 palabras. Reduce el contexto a 12 mensajes y refactoriza el prompt a 550 palabras. El consumo cae a $65 mensuales — una reducción del 64% sin que los técnicos noten diferencia en las respuestas.

Escenario 2: Identificar pico de consumo inesperado El administrador recibe alerta de que el consumo del mes ya llegó al 90% en la segunda semana. Abre el desglose y ve que el 70% del consumo corresponde a "Extracciones". Investiga y encuentra que alguien configuró una extracción automática de documentos que procesa el mismo PDF 50 veces por día por un error de configuración. Corrige el error y el consumo vuelve a niveles normales.

Escenario 3: Presupuestar la expansión de agentes El jefe de TI necesita estimar el costo mensual de agregar 3 agentes adicionales de WhatsApp para el área de calidad. Con el historial del mes anterior, calcula que el costo promedio por agente activo es de $22 mensuales en el nivel de uso actual. Los 3 agentes adicionales agregarían aproximadamente $66 al costo mensual — dentro del presupuesto aprobado.

En esta página