Extracciones
Como extraer datos de documentos con IA.
Que es una extraccion
Una extraccion es el proceso donde la IA analiza un documento (PDF, imagen o texto) y extrae datos estructurados segun los campos definidos en una coleccion. Los datos extraidos se pueden revisar, editar y guardar como registros.
Proceso de extraccion
1. Seleccionar coleccion
Elige la coleccion que define los campos a extraer. La IA usara los nombres, tipos y descripciones de los campos como guia.
2. Subir documento
Puedes proporcionar el documento de tres formas:
| Formato | Descripcion |
|---|---|
| Archivo | PDF, PNG, JPG, GIF, WebP, BMP, TIFF (max 25 MB) |
| URL | Enlace directo a un archivo accesible |
| Texto | Texto plano para extraccion sin vision |
3. Revision
La IA devuelve los datos extraidos para cada campo:
- Valor extraido — El dato encontrado por la IA.
- Tipo — Tipo del campo segun la coleccion.
- Pagina — En que pagina del documento se encontro (para PDFs).
Puedes editar cualquier valor antes de guardar.
4. Guardar
Al confirmar, los datos se guardan como un nuevo registro en la coleccion. Se genera automaticamente un embedding para busqueda inteligente.
Extraccion por lotes
Para documentos que contienen multiples items (tablas, listas, catalogos), usa la extraccion por lotes:
- Sube el documento con la coleccion seleccionada.
- La IA extrae multiples registros del mismo documento.
- Revisa la lista de items extraidos.
- Guarda todos los registros de una vez.
Ideal para: facturas con multiples lineas, inventarios, catalogos de productos, listas de personal.
Metodo de extraccion
La IA selecciona automaticamente el mejor metodo:
| Metodo | Cuando se usa |
|---|---|
| Vision | Documentos con imagenes, PDFs escaneados |
| Texto | Texto plano o PDFs con texto seleccionable |
| Combinado | Vision + OCR para mayor precision |
Si la extraccion inicial no encuentra todos los campos, la IA realiza un segundo intento automaticamente.
Auditoria
Al activar la opcion de auditoria, la extraccion incluye:
- Imagenes anotadas — El documento original con recuadros marcando donde se encontro cada dato.
- Metodo utilizado — Que estrategia de extraccion se aplico.
- Coordenadas — Ubicacion exacta de cada valor en el documento.
Util para verificar la precision de la extraccion y documentar el proceso.