Estrai dati da PDF e crea una collezione consultabile
Impara a creare template di estrazione, elaborare documenti PDF e abilitare query con IA sui dati estratti.
Cosa otterrai
Al termine di questo tutorial avrai un flusso completo: caricare un PDF, estrarre dati strutturati con l'IA e permettere a un agente di rispondere a domande basandosi su quelle informazioni. Tempo stimato: 20 minuti.
Prerequisiti
- Un account attivo su Rela AI con accesso alla dashboard
- Un file PDF di test (es: scheda tecnica di un'apparecchiatura, ordine di acquisto o certificato)
- Un agente configurato (opzionale, per il passaggio di consultazione)
Passo 1: Crea un template di estrazione
- Nel menu laterale, vai su Dati > Template.
- Fai clic su Nuovo Template.
- Definisci i campi che vuoi estrarre:
| Campo | Tipo | Descrizione |
|---|---|---|
| numero_serie | text | Numero di serie dell'apparecchiatura |
| produttore | text | Nome del produttore |
| data_produzione | date | Data di produzione |
| potenza_kw | number | Potenza nominale in kW |
| tensione | number | Tensione di funzionamento |
- Assegna un nome al template:
Scheda Tecnica Apparecchiatura. - Fai clic su Salva.
Dovresti vedere il template elencato nella tabella con i 5 campi configurati.
number ma il PDF contiene testo come "N/A", l'estrazione fallira per quel campo. Usa text se il valore potrebbe non essere numerico.Passo 2: Carica un documento PDF
- Vai su Dati > Estrazioni.
- Fai clic su Nuova Estrazione.
- Seleziona il template
Scheda Tecnica Apparecchiatura. - Trascina il tuo file PDF nell'area di caricamento o fai clic per selezionarlo.
- Fai clic su Avvia Estrazione.
Dovresti vedere un indicatore di progresso mentre l'IA analizza il documento.
Passo 3: L'IA estrae i campi
- Attendi che lo stato cambi in Completato (di solito 10-30 secondi).
- Rivedi i risultati nell'anteprima:
{
"numero_serie": "SN-2024-00847",
"produttore": "Siemens",
"data_produzione": "2024-03-15",
"potenza_kw": 75,
"tensione": 480
}Dovresti vedere ogni campo estratto con il suo valore e un indicatore di confidenza.
Passo 4: Verifica e salva i dati
- Rivedi ogni campo estratto e correggi eventuali errori.
- Se tutto e corretto, fai clic su Approva e Salva.
- I dati vengono archiviati come record all'interno di una collezione.
Dovresti vedere il record salvato in Dati > Collezioni nella collezione associata al template.
Passo 5: Crea uno strumento di consultazione
- Vai su Strumenti > Nuovo Strumento.
- Seleziona il tipo Query Collezione.
- Configura:
- Nome:
Consulta Schede Tecniche - Collezione: seleziona la collezione del template
Scheda Tecnica Apparecchiatura - Descrizione per l'IA:
Usa questo strumento per cercare informazioni tecniche sulle apparecchiature come numero di serie, produttore, potenza e tensione.
- Nome:
- Fai clic su Crea.
Dovresti vedere lo strumento elencato e disponibile per l'assegnazione agli agenti.
Passo 6: L'agente risponde con i dati estratti
- Vai su Agenti e seleziona il tuo agente.
- Nella sezione Strumenti, aggiungi
Consulta Schede Tecniche. - Salva le modifiche.
- Invia un messaggio all'agente:
Qual e la potenza dell'apparecchiatura SN-2024-00847?
Dovresti vedere una risposta come: "L'apparecchiatura SN-2024-00847 prodotta da Siemens ha una potenza nominale di 75 kW."
Riepilogo
| Passo | Azione | Risultato |
|---|---|---|
| 1 | Creare template | Struttura a 5 campi definita |
| 2 | Caricare PDF | Documento caricato per l'estrazione |
| 3 | Estrazione IA | Campi estratti automaticamente |
| 4 | Verificare e salvare | Record archiviato nella collezione |
| 5 | Creare strumento | Query collezione disponibile |
| 6 | Consultare tramite agente | Risposta basata su dati reali |
Prossimi passi
- Elabora piu PDF in batch per caricare grandi volumi di documenti
- Configura estrazioni automatiche con regole di elaborazione
- Genera report dai dati estratti