Notizia:
  • Rilasciata Precise Pangolin 12.04. Per ottenerla, visitate questa pagina, oppure provate il tour dal vivo con un browser web moderno.
  • Nuovo forum di Ubuntu-it, l'annuncio. È consigliato aggiornare il proprio profilo e controllare la sezione Gruppo Forum per problemi noti.
  • Rilasciata la versione italiana di Precise Pangolin 12.04. Per maggiori informazioni, consultare questa discussione.
  • Il vincitore del Concorso desktop del mese di aprile è Jerico. L'elenco dei precedenti vincitori è qui.
  • È uscito il numero 17 della Newsletter italiana di Ubuntu. Lo trovate a questo indirizzo.
  • È uscito il numero 59 di Full Circle Magazine in italiano. Lo trovate a questo indirizzo.

[Risolto] Ocr gui quali dove [guida] [HowTo]

Sondaggi su cui interrogarsi, conoscersi, esprime le proprie idee, limitatamente ad argomenti a tema informatico.

Quale OCR usate per ITAliano per file d'immagine di stampati senza scanner?

Clara
0
Nessun voto
Clara
0
Nessun voto
Gocr
6
11%
Gocr
6
11%
Ocrad
1
2%
Ocrad
1
2%
OCRopus
3
5%
OCRopus
3
5%
Tesseract-linea di comando
9
16%
Tesseract-linea di comando
9
16%
Tesseract-gui
5
9%
Tesseract-gui
5
9%
Venus Documents
0
Nessun voto
Venus Documents
0
Nessun voto
Altro (specificare)
4
7%
Altro (specificare)
4
7%
 
Voti totali : 56

[Risolto] Ocr gui quali dove [guida] [HowTo]

Messaggioda neolinux » venerdì 10 luglio 2009, 19:35

Cos'è ed a che cosa serve un ocr?
http://it.wikipedia.org/wiki/Optical_Character_Recognition

Dove trovare i programmi?
-http://sourceforge.net/search/?type_of_search=soft&words=ocr+engine&search=Search
-Synaptic ubuntu 9.04

Segue post con soluzioni possibili
Ultima modifica di neolinux il giovedì 8 luglio 2010, 23:37, modificato 1 volta in totale.
Avatar utente
neolinux
Imperturbabile Insigne
Imperturbabile Insigne
 
Messaggi: 4654
Iscrizione: dicembre 2008

Re: SONdaggio OCR

Messaggioda neolinux » sabato 11 luglio 2009, 21:10

QUALI OCR FUNZIONANO?
Tesseract
http://forum.ubuntu-it.org/viewtopic.ph ... 1#p2272991

tesseract-gui (interfaccia grafica) Su ubuntu 9.04 è un po' lento oltre A4 a 300dpi  http://forum.ubuntu-it.org/viewtopic.php?p=2272991#p2272991

Janvitus ha scritto:....OCRFeeder se usi GNOME/GTK: http://live.gnome.org/OCRFeeder Non è altro che un'interfaccia grafica per GNOME/GTK di.... tesseract.
http://packages.debian.org/sid/ocrfeeder


Ocropus versione avanzata di Tesseract, formato deb funzionante solo da linea di comando http://linux.softpedia.com/progDownload ... 40603.html
(non più scaricabile dal link indicato, non ne conosco altri, però posso postarlo, ma non so dove).
Di Ocropus per ora è noto solo questo comando...
Codice: Seleziona tutto
ocropus page nomePagina.png

neolinux ha scritto:


Ottima guida per scansioni ocr e
Implementare xsane con Tesseract xsane2tess, funziona solo con lo scanner http://forum.ubuntu-it.org/viewtopic.php?p=2257003#p2257003

Inoltre in applicazioni/ubuntusoftwarecenter digitando nella casella di ricerca scanner, ci sono dei pacchetti che hanno meno funzionalità di xsane ad esempio gscan2pdf usa tesseract, funziona a patto che manteniate l'orientamento originario del foglio (A4) o se lo girate solo con gscan2pdf.

LordMax ha scritto:Abby Fine Reader via windows virtualizzato.
Gli ocr usabili su linux sono penosi, Tesseract è un buon ocr ma non mantiene le immagini ne la formattazione ne l'impaginazione quindi nella maggior parte dei casi inutile perché fa perdere ancora più tempo che non trascrivere a mano il tutto.




Rimozione programma da home e usr/local/bin se avete pasticciato tanto
http://forum.ubuntu-it.org/viewtopic.ph ... 1#p2263031



ALTRE possibilità sugli ocr nella rete, alcune sembrano impraticabili o non buone

http://code.google.com/p/ocropus/downloads/list

Gui per Tesseract
http://code.google.com/p/jtesseract/
http://code.google.com/p/lector/

Gocr scaricabile da Synaptic ritenuto da tanti inferiore a tesseract
viatorino37 ha scritto:Se hai già installato gocr.......

  1.. trasforma il file immagine in .pnm, che è lo standard ottimale
       per gocr. Per farlo puoi usare
Codice: Seleziona tutto
convert nome.jpg nome.pnm

       `convert` è un comando di imagemagick, un pacchetto che trovi nei repository di Ubuntu

  2.. dài quindi il seguente comando
Codice: Seleziona tutto
gocr -i nome.pnm nome.txt



Risultato: il testo contenuto nell'immagine lo trovi nel file nome.txt


Risoluzione ideale per un'immagine da trattare con ocr facendo le prove da 150 a 600 dpi, con maschere di contrasto per ocr oppure far diventare con gimp il bianco più bianco ed il nero più nero a patto che gli spazi ed elementi fini (accenti apostrofi...) rimangano ben distinti.

Altri ocr in circolazione
http://doc.ubuntu-fr.org/ocr
http://linguistico.sourceforge.net/pages/software_libero/documenti_formati.html#acquisizione_documentazione_cartacea_ocr

Altre guide ubuntu per niubbi facili ed altro clicca la mia firma qui sotto
Ultima modifica di neolinux il sabato 11 giugno 2011, 11:03, modificato 1 volta in totale.
Avatar utente
neolinux
Imperturbabile Insigne
Imperturbabile Insigne
 
Messaggi: 4654
Iscrizione: dicembre 2008

Re: SONdaggio OCR

Messaggioda ugaciaka » domenica 12 luglio 2009, 9:30

io uso tesseract con xsane...
non ho mai comprato su ebay, i macbook non mi piacciono, non ho bisogno di facebook né myspace né secondlife
non sono un nerd né lamer né troll né geek né cracker né hacker
Avatar utente
ugaciaka
Entusiasta Emergente
Entusiasta Emergente
 
Messaggi: 1957
Iscrizione: ottobre 2006
Località: Belluno

Re: SONdaggio OCR

Messaggioda neolinux » lunedì 13 luglio 2009, 17:52

Ho visto che c'è qualcuno che usa tesseract-gui, mi farebbe molto comodo usarla, come si fa? è da un po' di tempo che ci provo, non ho capito cosa dovrei fare dopo l'estrazione del pacchetto, sono fragilissimo con il terminale. :-[
Avatar utente
neolinux
Imperturbabile Insigne
Imperturbabile Insigne
 
Messaggi: 4654
Iscrizione: dicembre 2008

Re: SONdaggio OCR

Messaggioda frasco » lunedì 13 luglio 2009, 22:55

...un paio di domande:

com'è la qualità del riconoscimento di questi OCR?? è paragonabile a quella, per esempio, di AbbyFineReader?

avete provato con altre lingue?
Avatar utente
frasco
Prode Principiante
 
Messaggi: 108
Iscrizione: febbraio 2007

Re: SONdaggio OCR

Messaggioda neolinux » martedì 14 luglio 2009, 1:50

frasco ha scritto:...un paio di domande:
com'è la qualità del riconoscimento di questi OCR?? è paragonabile a quella, per esempio, di AbbyFineReader?
avete provato con altre lingue?

Non mantengono l'impagnazione, i font e le immagini vano persi, non distinguono bene le macchie dalle lettere, infatti si deve fare una scansione ben dettagliata negli stacchi degli spazi dai punti accenti e molto contrastata, limitare quanto più possibile l'area di scansione.
Ecco perchè è importante scansionare una colonna per volta, con un'area più limitata possibile, per questo le gui (che non so come ma vorrei tanti installare) sono molto importanti, l'inglese è il più supportato di tutti ovviamente, tesseract dell'hp era fra i migliori 10 anni fa circa quando fu ceduto come software libero, ma dal quel momento i passi avanti credo siano stati limitati, penso a causa dei costi molto alti dei vocabolari nazionali, tesseract è il più ricco di vocabolari di diverse lingue fra i liberi, non penso sia un caso che il correttore grammaticale ce l'ha office e non openoffice.

Per il gui jtesseract sembra da scartare è ancora in formato alpha e deriva da win, lector e tesseract-gui sembrano più adatti, tesseract c'è chi lo usa nel forum e mi piacerebbe sapere come fa, Ocropus sembra un'evoluzione di Tesseract con il patrocinio di google, sulla carta sembrerebbe il migliore, ma non ho capito se ha una gui o no e se è facile da installare.
Ultima modifica di neolinux il lunedì 20 luglio 2009, 11:16, modificato 1 volta in totale.
Avatar utente
neolinux
Imperturbabile Insigne
Imperturbabile Insigne
 
Messaggi: 4654
Iscrizione: dicembre 2008

Re: SONdaggio OCR

Messaggioda neolinux » martedì 14 luglio 2009, 20:47

Io sono uno zuccone, non mi do per vinto, adesso come faccio ad usare tesseract-gui? ho usato questo ed ho seguito il readme, prima di cominciare ho dato l'autorizzazione di trattare la cartella d'origine come programma.
Codice: Seleziona tutto
vip@vip:~$ sudo cp /home/vip/Scrivania/Digitare/tesseract-gui-2.1/tesseract-gui.py /usr/local/bin
vip@vip:~$ sudo chmod 755 /usr/local/bin/tesseract-gui.py
vip@vip:~$ tesseract-gui.py
Traceback (most recent call last):
  File "/usr/local/bin/tesseract-gui.py", line 1092, in <module>
    base = Whc()
  File "/usr/local/bin/tesseract-gui.py", line 414, in __init__
    self.btnAutoPrev = gtk.ToggleButton("Auto Resize", False)
RuntimeError: more argument specifiers than keyword list entries (remaining format:'):GtkToggleButton.__init__')
vip@vip:~$ tesseract-guy
bash: tesseract-guy: comando non trovato
vip@vip:~$ tesseract-guy.py
bash: tesseract-guy.py: comando non trovato
vip@vip:~$ sudo tesseract-guy
sudo: tesseract-guy: command not found
vip@vip:~$ sudo tesseract-guy.py
sudo: tesseract-guy.py: command not found

Qui c'è qualcuno che ha il mio stesso problema ma sono pochi http://www.google.it/search?hl=it&client=firefox-a&rls=com.ubuntu%3Ait%3Aunofficial&hs=arS&q=%22RuntimeError%3A+more+argument+specifiers+than+keyword+list+entries+(remaining+format%3A%27)%3AGtkToggleButton.__init__%27)%22&btnG=Cerca&meta=
Ultima modifica di neolinux il martedì 14 luglio 2009, 20:57, modificato 1 volta in totale.
Avatar utente
neolinux
Imperturbabile Insigne
Imperturbabile Insigne
 
Messaggi: 4654
Iscrizione: dicembre 2008

Re: SONdaggio OCR

Messaggioda neolinux » mercoledì 15 luglio 2009, 9:43

Ah dimenticavo ho seguito questa guida, una delle più semplici che ho trovato, senza maree di link, però sbaglio lo stesso :'( :'( :'( :'( http://paoloruffino.com/?p=299
Avatar utente
neolinux
Imperturbabile Insigne
Imperturbabile Insigne
 
Messaggi: 4654
Iscrizione: dicembre 2008

Re: SONdaggio OCR

Messaggioda neolinux » mercoledì 15 luglio 2009, 14:40

Ho provato Ocropus (qui qualcuno pare lo usi), lector, ma niente da fare, sembra che vada tutto bene poi chi sa perchè sul finale c'è sempre qualche error, specie verso il make (senza sudo), e poi sudo make install è catastrofe, una vera landa di error, eppure in synaptic-gestore pacchetti i pacchetti richiesti li metto e li installo, l'ho fatto non so quante volte, le azioni le faccio con tutte le cartelle spacchettate direttamente nella home, in ubuntu quando si spacchettano le varie compressioni le cartelle perdono le estensioni bz bz2 tar, con il terminale mi ci reco con (cd), il prompt prima di dare i comandi mi dice che sono dentro la cartella dell'agognato pacchetto (c'è il nome della home e del pacchetto che non lo posso cancellare, prima dei comandi cancellabili che scrivo).
SOLUZIONE per cancellare i file e cartelle riottosi http://forum.ubuntu-it.org/viewtopic.ph ... 1#p2263031

Esiste una gui per ocr buona, senza usare lo scanner magari in deb?

Chi mi sorveglia e bacchetta selvaggiamente quando sbaglio, magari dandomi una soluzione?
Ultima modifica di neolinux il mercoledì 23 settembre 2009, 14:30, modificato 1 volta in totale.
Avatar utente
neolinux
Imperturbabile Insigne
Imperturbabile Insigne
 
Messaggi: 4654
Iscrizione: dicembre 2008

Re: AIUTONE ocr per favore

Messaggioda neolinux » giovedì 16 luglio 2009, 22:02

Tesseract da terminale vuole solo immagini di proporzioni A4
Se avete scritti in più colonne e le ritagliate, tesseract da comando in linea non le prende.
Con gimp si seleziona la colonna che interessa, su seleziona si inverte la selezione e poi su modifica si cancella intorno alla colonna (NON usare il comando ritaglia).
Ultima modifica di neolinux il giovedì 16 luglio 2009, 22:12, modificato 1 volta in totale.
Avatar utente
neolinux
Imperturbabile Insigne
Imperturbabile Insigne
 
Messaggi: 4654
Iscrizione: dicembre 2008

Re: AIUTONE ocr per favore

Messaggioda c.realkiller » venerdì 17 luglio 2009, 18:22

ma perchè ti stai scervellando così, tesseract con xane non ti soddisfa?
strade...? dove andiamo noi non ci servono... strade!
Skype: dino.tartaro
facebook: http://www.facebook.com/dino.tartaro
Avatar utente
c.realkiller
Rampante Reduce
Rampante Reduce
 
Messaggi: 5084
Iscrizione: gennaio 2009
Località: Fossano

Re: AIUTONE ocr per favore

Messaggioda neolinux » venerdì 17 luglio 2009, 18:43

c.realkiller ha scritto:ma perchè ti stai scervellando così, tesseract con xane non ti soddisfa?

No, (nono)
perchè devo far passare più volte lo scanner quando ho i testi a più colonne e questo lo logora, io usavo l'interfaccia su win di tesseract (freeocr) che è tanto comoda, è più veloce ed accurata della scansione (perchè ne fai una e fatta bene).
Non mi va neppure la scansione da terminale, perchè così devo preparare i file con le colonne separate (una seccatura).

Ma prima o poi ci riuscirò quando m'impunto su una cosa, che ritengo alla mia portata, divento volitivo, perchè alcuni si ed io no?

Io so che potrei farlo... lo voglio fare... non so se sono io che erro oppure se ciò che scelgo non va, ecco perchè ho fatto il sondaggio per vedere se quel che avevo visto funziona...

Ti ringrazio comunque per l'interessamento, veramente :)
Avatar utente
neolinux
Imperturbabile Insigne
Imperturbabile Insigne
 
Messaggi: 4654
Iscrizione: dicembre 2008

Re: AIUTONE ocr per favore

Messaggioda c.realkiller » venerdì 17 luglio 2009, 19:06

io utilizzo poco questo software, l'ho installato e lo uso poche volte al mese, quindi per l'uso che ne faccio mi va bene.
lo uso prevalentemente per acquisire testi da riviste.
se lo usi tutti i giorni forse hai ragione, può essere macchinoso edistruttivo (per lo scanner).
ciao!
ps se leggo qualcosa in giro te lo faccio sapere.
strade...? dove andiamo noi non ci servono... strade!
Skype: dino.tartaro
facebook: http://www.facebook.com/dino.tartaro
Avatar utente
c.realkiller
Rampante Reduce
Rampante Reduce
 
Messaggi: 5084
Iscrizione: gennaio 2009
Località: Fossano

Re: AIUTONE ocr per favore

Messaggioda neolinux » sabato 18 luglio 2009, 2:39

c.realkiller ha scritto:io utilizzo poco questo software, l'ho installato e lo uso poche volte al mese, quindi per l'uso che ne faccio mi va bene.
lo uso prevalentemente per acquisire testi da riviste.
se lo usi tutti i giorni forse hai ragione, può essere macchinoso edistruttivo (per lo scanner).
ciao!
ps se leggo qualcosa in giro te lo faccio sapere.

;D Grazie... inoltre non ho molta fretta per ora per un semplice motivo, quest'anno avevo preventivato di prendere un incarico lavorativo che mi desse molto tempo libero, però è anche faticoso, per imparare quanto prima possibile a rendermi indipendente da win, il computer mi serve per una serie molteplice di documenti e talvolta di filmati ed audio, ormai dopo la foga di apprendere tutto quello che mi occorre il più presto possibile (pensavo di fare prima), sono praticamente a posto, penso di essere quasi svezzato da win.
Questa dell'ocr gui è forse l'ultima cosa che mi manca, mi è rimasta libera questa estate, ma vorrei anche andare in vacanza, poi però forse a settembre non avrò più molto tempo per seguire i forum e se si interviene poco si sparisce letteralmente, si è destinati quindi a ricevere meno risposte, quindi a ricevere meno aiuto.
Ritengo molto carenti le guide online di software libero in italiano per una fascia di difficoltà intermedia, è improponibile per ora con le guide per i primi passi (es ubuntu semplice) pensare poi di lanciare i nuovi utenti nelle guide seguenti, semplicemente perchè non hanno basi sufficientemente solide (io di sicuro), ecco perchè mi annoto tutte le guide che scrivo ed i post per me chiari in un indice nel forum, perchè altrimenti dimentico le procedure di come fare (come facevo anche con win), per dare maggior solidità di visibilità e quindi aiuto a me ed anche alla comunità nello spirito di ubuntu (tutto quello che so su ubuntu è strutturato nelle mie guide non ho segreti, in win forse), almeno se interverrò meno la mia rete di link terranno in vita la mia presenza perchè hanno sostanza, sono  facilmente raggiungibili senza ricerca, sono selezionati, così sono diventato più meticoloso nel scrivere i procedimenti.
Occorre molto più tempo per sapere e fare rispetto a win, soprattutto per certi tipi d'informatizzazione (es. le installazioni dei software sono da delirio appena esci dal deb, ma con aggiungi e rimuovi è mille volte meglio), fino a che non sarò esperto avrò bisogno di molto tempo per sapere, questo un po' mi preccupa, ne avrò abbastanza?   Penso di si.
Ultima modifica di neolinux il sabato 18 luglio 2009, 2:41, modificato 1 volta in totale.
Avatar utente
neolinux
Imperturbabile Insigne
Imperturbabile Insigne
 
Messaggi: 4654
Iscrizione: dicembre 2008

Re: AIUTONE ocr per favore

Messaggioda zeek » sabato 18 luglio 2009, 13:29

uhm.. io sto provando da un po' a compilare ocropus.. ma, come dici tu, c'è sempre qualche problema.
Ad esempio non riesco a fargli sentire le librerie openFST, e leptlib viene "accettata dal compilatore ma non dal processore", chissà cosa significhi.
Al make: errori a non finire.
Ora provo con tesseract e vedo se riesco a mettere la gui.. ma non sono fiducioso :D

UNIAMO LE FORZE! anch'io voglio farli funzionare.
- Mai liberare un individuo che ha raggiunto una certa età. È pericoloso. Il cervello stenta a rifiutare il passato -
zeek
Entusiasta Emergente
Entusiasta Emergente
 
Messaggi: 1010
Iscrizione: ottobre 2008
Località: Italia

Re: AIUTONE ocr per favore

Messaggioda neolinux » sabato 18 luglio 2009, 13:45

zeek ha scritto:uhm.. io sto provando da un po' a compilare ocropus.. ma, come dici tu, c'è sempre qualche problema...........Al make: errori a non finire........

Mal comune mezzo gaudio, almeno so che non sono soltanto io, ma è qualcosa di veramente difficile :-[
Se ci fidiamo di chi ha risposto in questo sondaggio c'è chi c'è riuscito anche con Ocropus (sempre che non ritiri il voto)

Se ci sono nuove guide, posta pure ed io provo a vedere se riesco e posto il terminale in uscita qui.
Avatar utente
neolinux
Imperturbabile Insigne
Imperturbabile Insigne
 
Messaggi: 4654
Iscrizione: dicembre 2008

Re: AIUTONE ocr per favore

Messaggioda zeek » sabato 18 luglio 2009, 15:35

intanto se guardi QUI credo sia il deb di ocropus per jj!

edit: ora lo provo, in ogni caso, di sicuro non ha interfaccia grafica..
Ultima modifica di zeek il sabato 18 luglio 2009, 18:42, modificato 1 volta in totale.
- Mai liberare un individuo che ha raggiunto una certa età. È pericoloso. Il cervello stenta a rifiutare il passato -
zeek
Entusiasta Emergente
Entusiasta Emergente
 
Messaggi: 1010
Iscrizione: ottobre 2008
Località: Italia

Re: AIUTONE ocr per favore

Messaggioda neolinux » domenica 19 luglio 2009, 2:09

zeek ha scritto:intanto se guardi QUI credo sia il deb di ocropus per jj!

edit: ora lo provo, in ogni caso, di sicuro non ha interfaccia grafica..

Per ora mi tengo tesseract comando in linea, se noti differenze magari provo anch'io :-\
Avatar utente
neolinux
Imperturbabile Insigne
Imperturbabile Insigne
 
Messaggi: 4654
Iscrizione: dicembre 2008

Re: AIUTONE ocr per favore

Messaggioda zeek » domenica 19 luglio 2009, 2:25

Dunque.. io ho potuto fare pochissime prove, perché non ci sono stato oggi.. diciamo che non è molto facile capire come funziona.. però ti dico, su googlecode c'è un archivio di immagini di prova, e ci sono esempi di pagine con più colonne, e non sbaglia una parola.

però le prove che ho fatto io con pagine scannerizzate non sono andate molto bene.. solo che ho bisogno di un po' più tempo per vedere se effettivamente le immagini prova son fatte ad hoc, oppure funziona veramente in quel modo anche con immagini reali.
- Mai liberare un individuo che ha raggiunto una certa età. È pericoloso. Il cervello stenta a rifiutare il passato -
zeek
Entusiasta Emergente
Entusiasta Emergente
 
Messaggi: 1010
Iscrizione: ottobre 2008
Località: Italia

Re: AIUTONE ocr per favore

Messaggioda neolinux » domenica 19 luglio 2009, 21:31

zeek ha scritto:Dunque.. io ho potuto fare pochissime prove, perché non ci sono stato oggi.. diciamo che non è molto facile capire come funziona.. però ti dico, su googlecode c'è un archivio di immagini di prova, e ci sono esempi di pagine con più colonne, e non sbaglia una parola.

però le prove che ho fatto io con pagine scannerizzate non sono andate molto bene.. solo che ho bisogno di un po' più tempo per vedere se effettivamente le immagini prova son fatte ad hoc, oppure funziona veramente in quel modo anche con immagini reali.

Secondo google ocropus la versione 0.4.1 è sperimentale, sembrerebbe anche quella del pacchetto deb, in google ho visto questo molto interessante http://code.google.com/p/ocropus/wiki/DevInstall
dopo aver fatto partire il pacchetto deb
vip@vip:~$ OCRopus
bash: OCRopus: comando non trovato
Ultima modifica di neolinux il lunedì 20 luglio 2009, 12:08, modificato 1 volta in totale.
Avatar utente
neolinux
Imperturbabile Insigne
Imperturbabile Insigne
 
Messaggi: 4654
Iscrizione: dicembre 2008

Successiva

Torna a Sondaggi

Chi c’è in linea

Visualizzano questa pagina: Nessuno e 0 ospiti