Salve scrivo per capire se qualcuno ha potuto usare l'OCR in oggetto, visto che anche a me da lo stesso errore. Poi ho trovato un link in cui sembrerebbe che funzioni tramite l'interfaccia grafica di XSANE...e anche questa non mi funziona dato che lo script non va in un AMD64. Ecco il link http://ciaolinux.myblog.it/archive/2008 ... xsane.html Insomma chiedo lumi...mi sembra un OCR promettente e mi andrebbe di provarlo.
KUBUNTU 11.10 64BIT+SEVEN 64BIT || CPU AMD PhenomII x6 1090t Black Edition | MOTHERBOARD Asus Crossair IV Formula | RAM CORSAIR 8 GB DDR3-1600 | GPU Asus Radeon hd 6850 1gb | ALIMENTATORE Advance 650W | CASE AEROCOOL PGS Serie VX-9 Pro | MONITOR Hannspree HF237
Se ti da quell'errore é perche non hai installato i pacchetti in lingua di tesseract...e lui di default usa l'inglese. Controlla in /usr/share/tesseract-ocr/tessdata/ se trovi i pacchetti in lingua. Se non li hai : apt-get install tesseract-ocr-ita apt-get install tesseract-ocr-eng
Lo puoi usare da riga di comando : tesseract -l ita Mi sembra si possano convertire solo file tif non compressi.
Se lo vuoi integrare in xsane usando xsane2tess allora va bene la guida che hai postato sopra ma non usare il pacchetto autoinstallante ( neanche da me funziona ) ... fai l'installazione a mano con questa guida http://doc.ubuntu-fr.org/xsane2tess poi cambia nelle opzioni di xsane il valore "OCR command" settandolo a xsane2tess -l ita
Da me cosi funziona...anche se la qualità di riconoscimento é un po scarsina se l'immagine non é perfetta.
Lo so che il topic è vecchio, ma magari aiuto qualcuno lo stesso.
Oggi ho provato anche io tesseract e ho avuto lo stesso errore. Ho risolto semplicemente aggiungendo il codice della lingua italiana in fondo al comando così:
alfapin ha scritto: apt-get install tesseract-ocr-ita
Lo puoi usare da riga di comando : tesseract -l ita Mi sembra si possano convertire solo file tif non compressi.
Da me cosi funziona...anche se la qualità di riconoscimento é un po scarsina se l'immagine non é perfetta.
Grazie , la cosa mi è tornata molto utile, nel momento del bisogno (cioè adesso ). Ho scansionato in B/N a 300dpi, (a 75 tesseract restituisce un .txt completamente vuoto ), solo che con xsane ho dovuto acquisire e salvare in .jpeg, e poi convertire in .tif con Gimp, in quanto se usavo i file salvati in .tif da xsane, tesseract-ocr mi dava questo errore
tif...non tiff Prova, al 99% è per questo, hai una effe in più...
KUBUNTU 11.10 64BIT+SEVEN 64BIT || CPU AMD PhenomII x6 1090t Black Edition | MOTHERBOARD Asus Crossair IV Formula | RAM CORSAIR 8 GB DDR3-1600 | GPU Asus Radeon hd 6850 1gb | ALIMENTATORE Advance 650W | CASE AEROCOOL PGS Serie VX-9 Pro | MONITOR Hannspree HF237