Extrae datos de PDFs y crea una coleccion consultable
Aprende a crear templates de extraccion, procesar documentos PDF y habilitar consultas con IA sobre los datos extraidos.
Que vas a lograr
Al final de este tutorial tendras un flujo completo: subir un PDF, extraer datos estructurados con IA y permitir que un agente responda preguntas basandose en esa informacion. Tiempo estimado: 20 minutos.
Requisitos previos
- Una cuenta activa en Rela AI con acceso al dashboard
- Un archivo PDF de prueba (ej: ficha tecnica de un equipo, orden de compra o certificado)
- Un agente configurado (opcional, para el paso de consulta)
Paso 1: Crea un template de extraccion
- En el menu lateral, ve a Datos > Templates.
- Haz clic en Nuevo Template.
- Define los campos que quieres extraer:
| Campo | Tipo | Descripcion |
|---|---|---|
| numero_serie | text | Numero de serie del equipo |
| fabricante | text | Nombre del fabricante |
| fecha_fabricacion | date | Fecha de fabricacion |
| potencia_kw | number | Potencia nominal en kW |
| voltaje | number | Voltaje de operacion |
- Asigna un nombre al template:
Ficha Tecnica Equipo. - Haz clic en Guardar.
Deberias ver el template listado en la tabla con los 5 campos configurados.
number pero el PDF contiene texto como "N/A", la extraccion fallara para ese campo. Usa text si el valor puede no ser numerico.Paso 2: Sube un documento PDF
- Ve a Datos > Extracciones.
- Haz clic en Nueva Extraccion.
- Selecciona el template
Ficha Tecnica Equipo. - Arrastra tu archivo PDF al area de carga o haz clic para seleccionarlo.
- Haz clic en Iniciar Extraccion.
Deberias ver un indicador de progreso mientras la IA analiza el documento.
Paso 3: La IA extrae los campos
- Espera a que el estado cambie a Completado (normalmente 10-30 segundos).
- Revisa los resultados en la vista previa:
{
"numero_serie": "SN-2024-00847",
"fabricante": "Siemens",
"fecha_fabricacion": "2024-03-15",
"potencia_kw": 75,
"voltaje": 480
}Deberias ver cada campo extraido con su valor y un indicador de confianza.
Paso 4: Verifica y guarda los datos
- Revisa cada campo extraido y corrige cualquier error.
- Si todo es correcto, haz clic en Aprobar y Guardar.
- Los datos se almacenan como un registro dentro de una coleccion.
Deberias ver el registro guardado en Datos > Colecciones dentro de la coleccion asociada al template.
Paso 5: Crea una herramienta de consulta
- Ve a Herramientas > Nueva Herramienta.
- Selecciona el tipo Consulta de Coleccion.
- Configura:
- Nombre:
Consultar Fichas Tecnicas - Coleccion: selecciona la coleccion del template
Ficha Tecnica Equipo - Descripcion para la IA:
Usa esta herramienta para buscar informacion tecnica de equipos como numero de serie, fabricante, potencia y voltaje.
- Nombre:
- Haz clic en Crear.
Deberias ver la herramienta listada y disponible para asignar a agentes.
Paso 6: El agente responde con los datos extraidos
- Ve a Agentes y selecciona tu agente.
- En la seccion Herramientas, agrega
Consultar Fichas Tecnicas. - Guarda los cambios.
- Envia un mensaje al agente:
¿Cual es la potencia del equipo SN-2024-00847?
Deberias ver una respuesta como: "El equipo SN-2024-00847 fabricado por Siemens tiene una potencia nominal de 75 kW."
Resumen
| Paso | Accion | Resultado |
|---|---|---|
| 1 | Crear template | Estructura de 5 campos definida |
| 2 | Subir PDF | Documento cargado para extraccion |
| 3 | Extraccion IA | Campos extraidos automaticamente |
| 4 | Verificar y guardar | Registro almacenado en coleccion |
| 5 | Crear herramienta | Consulta de coleccion disponible |
| 6 | Consultar via agente | Respuesta basada en datos reales |
Siguientes pasos
- Procesa multiples PDFs en lote para cargar grandes volumenes de documentos
- Configura extracciones automaticas con reglas de procesamiento
- Genera reportes a partir de los datos extraidos