Notizia:
  • Rilasciata Precise Pangolin 12.04. Per ottenerla, visitate questa pagina, oppure provate il tour dal vivo con un browser web moderno.
  • Nuovo forum di Ubuntu-it, l'annuncio. È consigliato aggiornare il proprio profilo e controllare la sezione Gruppo Forum per problemi noti.
  • Rilasciata la versione italiana di Precise Pangolin 12.04. Per maggiori informazioni, consultare questa discussione.
  • Il vincitore del Concorso desktop del mese di aprile è Jerico. L'elenco dei precedenti vincitori è qui.
  • È uscito il numero 17 della Newsletter italiana di Ubuntu. Lo trovate a questo indirizzo.
  • È uscito il numero 59 di Full Circle Magazine in italiano. Lo trovate a questo indirizzo.

OCR: Tesseract-ocr

Installazione, configurazione e uso di programmi e strumenti.

OCR: Tesseract-ocr

Messaggioda domi84 » giovedì 24 gennaio 2008, 16:24

Ho scaricato il nuovo tesseract-orc 2.01 da getdeb
http://www.getdeb.net/app/Tesseract-ocr
ma quando lo lancio da linea di comando mi da:
Codice: Seleziona tutto
mimmo@mimmo-desktop:~$ tesseract Schermata.tif risultato
Unable to load unicharset file /usr/share/tesseract-ocr/tessdata/eng.unicharset
mimmo@mimmo-desktop:~$

Che vuole? :'(
Avatar utente
domi84
Entusiasta Emergente
Entusiasta Emergente
 
Messaggi: 1111
Iscrizione: novembre 2006
Località: Pompei (Na)

Re: OCR: Tesseract-ocr

Messaggioda Caf-Pow » giovedì 24 gennaio 2008, 16:28

prova a cambiare i permessi...

sudo chmod -R 777 /usr/share/tesseract-ocr/tessdata/eng.unicharset
Avatar utente
Caf-Pow
Scoppiettante Seguace
Scoppiettante Seguace
 
Messaggi: 324
Iscrizione: agosto 2006

Re: OCR: Tesseract-ocr

Messaggioda domi84 » giovedì 24 gennaio 2008, 17:10

Fatto...
niente...
Codice: Seleziona tutto
mimmo@mimmo-desktop:~$ sudo chmod -R 777 /usr/share/tesseract-ocr/tessdata/eng.unicharset
[sudo] password for mimmo:
mimmo@mimmo-desktop:~$ tesseract Schermata.tif risultato
Unable to load unicharset file /usr/share/tesseract-ocr/tessdata/eng.unicharset
mimmo@mimmo-desktop:~$
Avatar utente
domi84
Entusiasta Emergente
Entusiasta Emergente
 
Messaggi: 1111
Iscrizione: novembre 2006
Località: Pompei (Na)

Re: OCR: Tesseract-ocr

Messaggioda sensoK37 » martedì 14 ottobre 2008, 19:14

Salve scrivo per capire se qualcuno ha potuto usare l'OCR in oggetto, visto che anche a me da lo stesso errore.
Poi ho trovato un link in cui sembrerebbe che funzioni tramite l'interfaccia grafica di XSANE...e anche questa non mi funziona dato che lo script non va in un AMD64. Ecco il link http://ciaolinux.myblog.it/archive/2008 ... xsane.html
Insomma chiedo lumi...mi sembra un OCR promettente e mi andrebbe di provarlo.  >:(
KUBUNTU 11.10 64BIT+SEVEN 64BIT || CPU AMD PhenomII x6 1090t Black Edition | MOTHERBOARD Asus Crossair IV Formula | RAM CORSAIR 8 GB DDR3-1600 | GPU Asus Radeon hd 6850 1gb | ALIMENTATORE Advance 650W | CASE AEROCOOL PGS Serie VX-9 Pro | MONITOR Hannspree HF237
sensoK37
Entusiasta Emergente
Entusiasta Emergente
 
Messaggi: 1569
Iscrizione: marzo 2007
Località: Roma

Re: OCR: Tesseract-ocr

Messaggioda alfapin » martedì 11 novembre 2008, 16:01

Se ti da quell'errore  é perche non hai installato i pacchetti in lingua di tesseract...e lui di default usa l'inglese.
Controlla in /usr/share/tesseract-ocr/tessdata/  se trovi i pacchetti in lingua.
Se non li hai : 
apt-get install tesseract-ocr-ita
apt-get install tesseract-ocr-eng

Lo puoi usare da riga di comando : tesseract -l ita
Mi sembra si possano convertire solo file tif non compressi.

Se lo vuoi integrare in xsane usando xsane2tess allora va bene la guida che hai postato sopra ma non usare il pacchetto autoinstallante ( neanche da me funziona ) ... fai l'installazione a mano con questa guida http://doc.ubuntu-fr.org/xsane2tess
poi cambia nelle opzioni di xsane il valore  "OCR command" settandolo a xsane2tess -l ita

Da me cosi funziona...anche se la qualità di riconoscimento é un po scarsina se l'immagine non é perfetta.
alfapin
Prode Principiante
 
Messaggi: 1
Iscrizione: novembre 2008

Re: OCR: Tesseract-ocr

Messaggioda GuybrushThreepwood » lunedì 9 febbraio 2009, 11:50

Lo so che il topic è vecchio, ma magari aiuto qualcuno lo stesso.

Oggi ho provato anche io tesseract e ho avuto lo stesso errore. Ho risolto semplicemente aggiungendo il codice della lingua italiana in fondo al comando così:
Codice: Seleziona tutto
tesseract immagine.tif risultato.txt -l ita


ho installato solo i pacchetti tesseract-ocr e tesseract-ocr-ita
-- Ultreya! --
GuybrushThreepwood
Prode Principiante
 
Messaggi: 18
Iscrizione: luglio 2008

Re: OCR: Tesseract-ocr

Messaggioda domi84 » lunedì 9 febbraio 2009, 16:15

Buono a sapersi!!!
Chissà se c'è anche un modo per integrarlo con Xsane...
Avatar utente
domi84
Entusiasta Emergente
Entusiasta Emergente
 
Messaggi: 1111
Iscrizione: novembre 2006
Località: Pompei (Na)

Re: OCR: Tesseract-ocr

Messaggioda shosholoza » lunedì 9 marzo 2009, 17:37

alfapin ha scritto:
apt-get install tesseract-ocr-ita

Lo puoi usare da riga di comando : tesseract -l ita
Mi sembra si possano convertire solo file tif non compressi.

Da me cosi funziona...anche se la qualità di riconoscimento é un po scarsina se l'immagine non é perfetta.


Grazie  ;), la cosa mi è tornata molto utile, nel momento del bisogno (cioè adesso  ;D).
Ho scansionato in B/N a 300dpi, (a 75 tesseract restituisce un .txt completamente vuoto  ;D ;D), solo che con xsane ho dovuto acquisire e salvare in .jpeg, e poi convertire in .tif con Gimp, in quanto se usavo i file salvati in .tif da xsane, tesseract-ocr mi dava questo errore
Codice: Seleziona tutto
tesseract documento.tif documento -l ita
Tesseract Open Source OCR Engine
TIFFOpen: documento.tif: Cannot open.
tesseract:Error:Read of file failed:documento.tif
Signal_exit 31 ABORT. LocCode: 3  AbortCode: 3
Avatar utente
shosholoza
Scoppiettante Seguace
Scoppiettante Seguace
 
Messaggi: 381
Iscrizione: aprile 2007

Re: OCR: Tesseract-ocr

Messaggioda ciuiffo2001 » lunedì 30 marzo 2009, 23:30

>:( io ho un'altro problema...

devo creare questi file ita.unichart ... ma mi dà l'errore postato all'inizio.

do' il seguente comando:

#:/ tesseract 0103_2.tif newlanguage -l newlanguage batch.nochop makebox

e lui risponde:

#:/Unable to load unicharset file /usr/share/tesseract-ocr/tessdata/newlanguage.unicharset

leggendo forum e guide ho scoperto che bisogna creare questi file usando l' ISO 639-3 standard. ...

Qualcuno sà aiutarmi??  :-[

vi posto il link della guida ufficiale ... se puo' servire:
http://code.google.com/p/tesseract-ocr/ ... gTesseract

Grazie a chi risponderà!
ciuiffo2001
Prode Principiante
 
Messaggi: 1
Iscrizione: marzo 2009

Re: OCR: Tesseract-ocr

Messaggioda shosholoza » domenica 12 luglio 2009, 2:40

Avatar utente
shosholoza
Scoppiettante Seguace
Scoppiettante Seguace
 
Messaggi: 381
Iscrizione: aprile 2007

Re: OCR: Tesseract-ocr

Messaggioda ORayan » domenica 12 luglio 2009, 18:52

@domi84 e @shosholoza

Date un occhiata a questa guida per l'integrazione di tesseract in xsane ed eventualmente utilizzarlo proficuamente da Gimp:

http://www.mepisitalia.org/modules/newb ... umpost2728

E' una guida che va bene per le derivate Debian e per Ubuntu.
ORayan
Prode Principiante
 
Messaggi: 10
Iscrizione: luglio 2009

Re: OCR: Tesseract-ocr

Messaggioda niubbomass » venerdì 21 maggio 2010, 15:46

A me da questo errore:



read_header:Error:Can't read this image type:/home/massimo/Scrivania/occierre/viaggi.tiff
tesseract:Error:Read of file failed:/home/massimo/Scrivania/occierre/viaggi.tiff
Segmentation fault
niubbomass
Prode Principiante
 
Messaggi: 150
Iscrizione: novembre 2008

Re: OCR: Tesseract-ocr

Messaggioda sensoK37 » sabato 22 maggio 2010, 11:43

tif...non tiff
Prova, al 99% è per questo, hai una effe in più... :)
KUBUNTU 11.10 64BIT+SEVEN 64BIT || CPU AMD PhenomII x6 1090t Black Edition | MOTHERBOARD Asus Crossair IV Formula | RAM CORSAIR 8 GB DDR3-1600 | GPU Asus Radeon hd 6850 1gb | ALIMENTATORE Advance 650W | CASE AEROCOOL PGS Serie VX-9 Pro | MONITOR Hannspree HF237
sensoK37
Entusiasta Emergente
Entusiasta Emergente
 
Messaggi: 1569
Iscrizione: marzo 2007
Località: Roma


Torna a Applicazioni

Chi c’è in linea

Visualizzano questa pagina: Nessuno e 2 ospiti