
Janvitus ha scritto:....OCRFeeder se usi GNOME/GTK: http://live.gnome.org/OCRFeeder Non è altro che un'interfaccia grafica per GNOME/GTK di.... tesseract.
http://packages.debian.org/sid/ocrfeeder
ocropus page nomePagina.pngneolinux ha scritto:
LordMax ha scritto:Abby Fine Reader via windows virtualizzato.
Gli ocr usabili su linux sono penosi, Tesseract è un buon ocr ma non mantiene le immagini ne la formattazione ne l'impaginazione quindi nella maggior parte dei casi inutile perché fa perdere ancora più tempo che non trascrivere a mano il tutto.
viatorino37 ha scritto:Se hai già installato gocr.......
1.. trasforma il file immagine in .pnm, che è lo standard ottimale
per gocr. Per farlo puoi usare
- Codice: Seleziona tutto
convert nome.jpg nome.pnm
`convert` è un comando di imagemagick, un pacchetto che trovi nei repository di Ubuntu
2.. dài quindi il seguente comando
- Codice: Seleziona tutto
gocr -i nome.pnm nome.txt
Risultato: il testo contenuto nell'immagine lo trovi nel file nome.txt




frasco ha scritto:...un paio di domande:
com'è la qualità del riconoscimento di questi OCR?? è paragonabile a quella, per esempio, di AbbyFineReader?
avete provato con altre lingue?

vip@vip:~$ sudo cp /home/vip/Scrivania/Digitare/tesseract-gui-2.1/tesseract-gui.py /usr/local/bin
vip@vip:~$ sudo chmod 755 /usr/local/bin/tesseract-gui.py
vip@vip:~$ tesseract-gui.py
Traceback (most recent call last):
File "/usr/local/bin/tesseract-gui.py", line 1092, in <module>
base = Whc()
File "/usr/local/bin/tesseract-gui.py", line 414, in __init__
self.btnAutoPrev = gtk.ToggleButton("Auto Resize", False)
RuntimeError: more argument specifiers than keyword list entries (remaining format:'):GtkToggleButton.__init__')
vip@vip:~$ tesseract-guy
bash: tesseract-guy: comando non trovato
vip@vip:~$ tesseract-guy.py
bash: tesseract-guy.py: comando non trovato
vip@vip:~$ sudo tesseract-guy
sudo: tesseract-guy: command not found
vip@vip:~$ sudo tesseract-guy.py
sudo: tesseract-guy.py: command not found
http://paoloruffino.com/?p=299



c.realkiller ha scritto:ma perchè ti stai scervellando così, tesseract con xane non ti soddisfa?




c.realkiller ha scritto:io utilizzo poco questo software, l'ho installato e lo uso poche volte al mese, quindi per l'uso che ne faccio mi va bene.
lo uso prevalentemente per acquisire testi da riviste.
se lo usi tutti i giorni forse hai ragione, può essere macchinoso edistruttivo (per lo scanner).
ciao!
ps se leggo qualcosa in giro te lo faccio sapere.
Grazie... inoltre non ho molta fretta per ora per un semplice motivo, quest'anno avevo preventivato di prendere un incarico lavorativo che mi desse molto tempo libero, però è anche faticoso, per imparare quanto prima possibile a rendermi indipendente da win, il computer mi serve per una serie molteplice di documenti e talvolta di filmati ed audio, ormai dopo la foga di apprendere tutto quello che mi occorre il più presto possibile (pensavo di fare prima), sono praticamente a posto, penso di essere quasi svezzato da win.


zeek ha scritto:uhm.. io sto provando da un po' a compilare ocropus.. ma, come dici tu, c'è sempre qualche problema...........Al make: errori a non finire........



zeek ha scritto:intanto se guardi QUI credo sia il deb di ocropus per jj!
edit: ora lo provo, in ogni caso, di sicuro non ha interfaccia grafica..



zeek ha scritto:Dunque.. io ho potuto fare pochissime prove, perché non ci sono stato oggi.. diciamo che non è molto facile capire come funziona.. però ti dico, su googlecode c'è un archivio di immagini di prova, e ci sono esempi di pagine con più colonne, e non sbaglia una parola.
però le prove che ho fatto io con pagine scannerizzate non sono andate molto bene.. solo che ho bisogno di un po' più tempo per vedere se effettivamente le immagini prova son fatte ad hoc, oppure funziona veramente in quel modo anche con immagini reali.
vip@vip:~$ OCRopus
bash: OCRopus: comando non trovato

Visualizzano questa pagina: Nessuno e 0 ospiti