Rela AIRela AI Docs
Tutoriales

Extrae datos de PDFs y crea una coleccion consultable

Aprende a crear templates de extraccion, procesar documentos PDF y habilitar consultas con IA sobre los datos extraidos.

Que vas a lograr

Al final de este tutorial tendras un flujo completo: subir un PDF, extraer datos estructurados con IA y permitir que un agente responda preguntas basandose en esa informacion. Tiempo estimado: 20 minutos.

Requisitos previos

  • Una cuenta activa en Rela AI con acceso al dashboard
  • Un archivo PDF de prueba (ej: ficha tecnica de un equipo, orden de compra o certificado)
  • Un agente configurado (opcional, para el paso de consulta)

Paso 1: Crea un template de extraccion

  1. En el menu lateral, ve a Datos > Templates.
  2. Haz clic en Nuevo Template.
  3. Define los campos que quieres extraer:
CampoTipoDescripcion
numero_serietextNumero de serie del equipo
fabricantetextNombre del fabricante
fecha_fabricaciondateFecha de fabricacion
potencia_kwnumberPotencia nominal en kW
voltajenumberVoltaje de operacion
  1. Asigna un nombre al template: Ficha Tecnica Equipo.
  2. Haz clic en Guardar.

Deberias ver el template listado en la tabla con los 5 campos configurados.

Puedes agregar campos opcionales marcandolos como "no requerido". La IA intentara extraerlos pero no generara error si no los encuentra.
Usa tipos de campo correctos. Si defines un campo como number pero el PDF contiene texto como "N/A", la extraccion fallara para ese campo. Usa text si el valor puede no ser numerico.

Paso 2: Sube un documento PDF

  1. Ve a Datos > Extracciones.
  2. Haz clic en Nueva Extraccion.
  3. Selecciona el template Ficha Tecnica Equipo.
  4. Arrastra tu archivo PDF al area de carga o haz clic para seleccionarlo.
  5. Haz clic en Iniciar Extraccion.

Deberias ver un indicador de progreso mientras la IA analiza el documento.

La IA funciona mejor con PDFs generados digitalmente. Los documentos escaneados con texto manuscrito pueden producir errores de OCR. Si tienes problemas, intenta con un PDF de mejor calidad.

Paso 3: La IA extrae los campos

  1. Espera a que el estado cambie a Completado (normalmente 10-30 segundos).
  2. Revisa los resultados en la vista previa:
{
  "numero_serie": "SN-2024-00847",
  "fabricante": "Siemens",
  "fecha_fabricacion": "2024-03-15",
  "potencia_kw": 75,
  "voltaje": 480
}

Deberias ver cada campo extraido con su valor y un indicador de confianza.

Si un campo tiene baja confianza, la IA lo marca en amarillo. Puedes corregirlo manualmente antes de guardar.

Paso 4: Verifica y guarda los datos

  1. Revisa cada campo extraido y corrige cualquier error.
  2. Si todo es correcto, haz clic en Aprobar y Guardar.
  3. Los datos se almacenan como un registro dentro de una coleccion.

Deberias ver el registro guardado en Datos > Colecciones dentro de la coleccion asociada al template.

Paso 5: Crea una herramienta de consulta

  1. Ve a Herramientas > Nueva Herramienta.
  2. Selecciona el tipo Consulta de Coleccion.
  3. Configura:
    • Nombre: Consultar Fichas Tecnicas
    • Coleccion: selecciona la coleccion del template Ficha Tecnica Equipo
    • Descripcion para la IA: Usa esta herramienta para buscar informacion tecnica de equipos como numero de serie, fabricante, potencia y voltaje.
  4. Haz clic en Crear.

Deberias ver la herramienta listada y disponible para asignar a agentes.

Paso 6: El agente responde con los datos extraidos

  1. Ve a Agentes y selecciona tu agente.
  2. En la seccion Herramientas, agrega Consultar Fichas Tecnicas.
  3. Guarda los cambios.
  4. Envia un mensaje al agente: ¿Cual es la potencia del equipo SN-2024-00847?

Deberias ver una respuesta como: "El equipo SN-2024-00847 fabricado por Siemens tiene una potencia nominal de 75 kW."

La IA usa busqueda semantica para encontrar el registro correcto, asi que el usuario no necesita escribir el numero de serie exacto. Frases como "el equipo Siemens" tambien funcionan.

Resumen

PasoAccionResultado
1Crear templateEstructura de 5 campos definida
2Subir PDFDocumento cargado para extraccion
3Extraccion IACampos extraidos automaticamente
4Verificar y guardarRegistro almacenado en coleccion
5Crear herramientaConsulta de coleccion disponible
6Consultar via agenteRespuesta basada en datos reales

Siguientes pasos

En esta página