Estrazioni
Come estrarre dati dai documenti con l'IA.
Cos'e un'estrazione
Un'estrazione e il processo in cui l'IA analizza un documento (PDF, immagine o testo) ed estrae dati strutturati secondo i campi definiti in un modello. I dati estratti possono essere revisionati, modificati e salvati come record.
Lista dei modelli
Vai su Dati > Estrazioni per visualizzare tutti i tuoi modelli di estrazione. Ogni modello mostra:
| Campo | Descrizione |
|---|---|
| Nome | Nome del modello |
| Descrizione | Descrizione del modello |
| Origine | Badge che indica se e Manuale o Estrazione |
| Campi | Numero di campi definiti |
Puoi creare nuovi modelli definendo i campi che vuoi estrarre dai documenti.
Processo di estrazione
1. Selezionare la collezione
Scegli la collezione che definisce i campi da estrarre. L'IA utilizzera i nomi, i tipi e le descrizioni dei campi come guida.
2. Caricare il documento
Puoi fornire il documento in tre modi:
| Formato | Descrizione |
|---|---|
| File | PDF, PNG, JPG, GIF, WebP, BMP, TIFF (max 25 MB) |
| URL | Link diretto a un file accessibile |
| Testo | Testo in chiaro per estrazione senza visione |
3. Revisione
L'IA restituisce i dati estratti per ogni campo:
- Valore estratto — Il dato trovato dall'IA.
- Tipo — Tipo del campo secondo la collezione.
- Pagina — In quale pagina del documento e stato trovato (per i PDF).
Puoi modificare qualsiasi valore prima di salvare.
4. Salvataggio
Alla conferma, i dati vengono salvati come nuovo record nella collezione. Viene generato automaticamente un embedding per la ricerca intelligente.
Estrazione in blocco
Per documenti che contengono piu elementi (tabelle, elenchi, cataloghi), usa l'estrazione in blocco:
- Carica il documento con la collezione selezionata.
- L'IA estrae piu record dallo stesso documento.
- Revisiona l'elenco degli elementi estratti.
- Salva tutti i record in una sola volta.
Ideale per: fatture con piu voci, inventari, cataloghi prodotti, elenchi del personale.
Metodo di estrazione
L'IA seleziona automaticamente il metodo migliore:
| Metodo | Quando viene utilizzato |
|---|---|
| Visione | Documenti con immagini, PDF scansionati |
| Testo | Testo in chiaro o PDF con testo selezionabile |
| Combinato | Visione + OCR (riconoscimento ottico dei caratteri) per maggiore precisione |
Se l'estrazione iniziale non trova tutti i campi, l'IA effettua automaticamente un secondo tentativo.
Audit
Attivando l'opzione di audit, l'estrazione include:
- Immagini annotate — Il documento originale con riquadri che evidenziano dove e stato trovato ogni dato.
- Metodo utilizzato — Quale strategia di estrazione e stata applicata.
- Coordinate — Posizione esatta di ogni valore nel documento.
Utile per verificare la precisione dell'estrazione e documentare il processo.