Software OCR

Riconoscimento OCR (Optical Character Recognition):
I software OCR sono sistemi di riconoscimento in grado di leggere i caratteri alfanumerici stampati.
Si usa quindi la tecnologia OCR per documenti stampati che debbano essere letti dal sistema, come ad esempio i documenti di trasporto (DDT) o le fatture.

Come funzionano i programmi OCR?
È fino dagli anni cinquanta che il problema di realizzare un software OCR in grado di riconoscere un testo con la stessa accuratezza di un essere umano è allo studio, e ancora i progressi in questo campo non sono finiti. I programmi OCR, per arrivare all'attuale livello di corretto funzionamento e alla bassissima soglia d'errore che li caratterizza,  hanno richiesto una lunga fase di "addestramento", durante la quale numerosi confronti fra testi digitali e le immagini degli stessi testi stampati hanno permesso agli algoritmi dei software OCR di effettuare le necessarie calibrazioni. È così che l'accuratezza del riconoscimento ha raggiunto le attuali soglie, superiori al 99% per i testi di alta qualità.  L'OCR per documenti in bassa qualità ha invece richiesto  altre tecnologie, che impiegano algoritmi legati alle reti neurali e studiano la forma di ogni carattere. Questo ha portato a programmi OCR capaci di ricostruire testo e perfino formattazione all'interno della pagina stampata.

OCR per documenti scritti a mano libera
Dato il gran numero di tipologie di documenti che vengono compilati a mano, i software OCR capaci di identificare la scrittura a mano libera sono stati un grande successo commerciale. Tuttavia va segnalato che questi programmi OCR funzionano in maniera eccellente solo se i documenti sono costruiti appositamente per il loro impiego, ossia con appositi spazi a caselle in cui l'utente debba inserire le lettere, oppure con campi di compilazione predisposti con le giuste avvertenze per evitare le ambiguità. Con tali accorgimenti, l'OCR per documenti scritti a mano libera ha raggiunto livelli considerevoli di accuratezza, intorno all'85% per i caratteri alfabetici e al 95% per quelli numerici .

OCR per documenti scritti in corsivo
Per i programmi OCR, il riconoscimento del testo scritto in corsivo è decisamente ancora un campo di ricerca aperto, e al momento non esistono software OCR in grado di garantire risultati di accuratezza significativa. Va però detto che  effettuare il riconoscimento OCR per documenti interi scritti in corsivo restituisce risultati migliori dell'analisi dei singoli caratteri, in quanto permette di affiancare al riconoscimento caratteri un'analisi dell'intera parola, e saranno i software OCR capaci di implementare anche un'analisi contestuale o grammaticale a portare i migliori risultati. Per fare un esempio, un programma OCR che sappia che il testo che sta riconoscendo è di argomento storico saprà anche che una riga verticale seguita da un 9 sarà più probabilmente un 1 che una l , dato che il documento probabilmente conterrà molte date. Ciò nonostante, come dicevamo, l'OCR per documenti scritti in corsivo è ancora molto lontano dall'essere pronto.

Alcuni dei nostri software OCR e le soluzioni che permettono
I nostri programmi OCR sono costruiti per rispondere a una serie di esigenze diverse e complesse.

TabOCR è il software OCR per documenti come fatture, ordini e documenti di trasporto. È in grado di leggere e riconoscere i dati di testata così come tutte le righe relative al materiale consegnato o fatturato con ogni dettaglio, e successivamente di riversare i dati nel formato più utile per le successive elaborazioni. Oltre a questo, TabOCR è in grado di indicizzare direttamente, classificare, e archiviare automaticamente tutta la documentazione scansita.

UniLECTOR è il software OCR che, integrando anche librerie ICR per i caratteri manoscritti e Bar Code per i codici a barre, permette l'analisi completa e la scansione OCR per documenti che vanno dalle ricette farmaceutiche, ai contratti di fornitura come quelli energetici e telefonici, fino ai bollettin di conto corrente e Mav. Specifiche regole euristiche garantiscono un'acquisizione accurata e corretta, e i dati possono essere convertiti nei formati necessari al lavoro successivo.

MicroLECTOR è il software OCR per documenti che debbano essere analizzati per riconoscerne tutti i campi utili come indici di ricerca. Grazie a questa analisi, l'archiviazione e la gestione documentale diventano semplicissime e immediate: ad esempio è possibile interpretare Data e Numero di Fattura e creare automaticamente un file PDR indicizzato e archiviato.

Abbiamo soluzioni software e programmi OCR per documenti di ogni genere, e da trent'anni ne sviluppiamo per ogni cliente che abbia esigenze specifiche – sia in vendita, per le necessità continuative, che come servizio per casi unici e occasionali. Abbiamo la soluzione che fa per voi, o possiamo svilupparla se vi occorrono prestazioni uniche!


Contattateci per avere maggiori ragguagli o per fissare un incontro: basta cliccare qui oppure interagire direttamente con noi in Chat cliccando sul "Supporto Live" in basso a destra quando siamo on line.
News

02/08/2016
BUONE VACANZE DA TUTTO LO STAFF DATASIS
< ...

20/07/2016
UNIVERSITA' DI TORINO
Anche l'Università di Torino ha acquisito il diffuso ed apprezzato
sistema di lettura ottica
...

12/07/2016
SOLARI S.P.A. Udine
Aprile 2016:
SOLARI S.P.A. è leader di mercato nell’informazione al pubblico, dal campo
...

04/05/2016
FONDAZIONE CARIPLO Milano
Fondazione Cariplo è un soggetto filantropico che concede contributi a fondo
perduto alle
...

18/02/2016
CSO Pharmitalia S.P.A. Milano, Roma
CSO Pharmitalia SPA è un’azienda farmaceutica, associata a Farmindustria
e che vanta collaborazioni con alcune d
...


1 2 3 4 5  ... 


DATASIS GROUP SRL Tel. +39031806979 www.datasis.it E-mail info@datasis.it Via delle Piazzole, 20 - 22070 Albiolo (CO) Sede di Roma Eur
tel. 335 356292
Home Contatti Dove siamo CHI SIAMO COSA FACCIAMO LE TECNOLOGIE CON CHI LAVORIAMO I NOSTRI SERVIZI SOLUZIONI SU MISURA FOTOGALLERY STORIE DI SUCCESSO NEWS MICROLECTOR UNILECTOR TAB OCR PSREADER ALTRI PRODOTTI ALTRE SOLUZIONI DOWNLOAD