[Risolto] How-to: gscan2pdf scanner su 10.04 uso OCR

Utilizzo di applicazioni in ambito professionale.
Avatar utente
neolinux
Rampante Reduce
Rampante Reduce
Messaggi: 5708
Iscrizione: giovedì 11 dicembre 2008, 21:52
Contatti:

[Risolto] How-to: gscan2pdf scanner su 10.04 uso OCR

Messaggio da neolinux »

gscan2pdf 0.9.29 non scansiona con ubuntu 10.04

Ovvero lo scanner lo riconosce però non scansiona...

e dice
Messaggio sconosciuto: Segmentation fault
:cry: :cry: :cry:
Ultima modifica di neolinux il venerdì 10 agosto 2012, 23:30, modificato 2 volte in totale.
Avatar utente
neolinux
Rampante Reduce
Rampante Reduce
Messaggi: 5708
Iscrizione: giovedì 11 dicembre 2008, 21:52
Contatti:

Re: gscan2pdf non riconosce lo scanner con ubuntu 10.04

Messaggio da neolinux »

Cercando disperatamente ho trovato finalmente: :D

Codice: Seleziona tutto

 sudo rm -rf ~/.gscan2pdf
:boogie: :)
da: http://ubuntuforums.org/showthread.php?t=1041922
Fixxed it!!!


yee-haw!!!!

after *MUCH* reading and searching, i found if i start up shell and type this


sudo rm -rf ~/.gscan2pdf


it works again


YIPPIE!!!
Avatar utente
neolinux
Rampante Reduce
Rampante Reduce
Messaggi: 5708
Iscrizione: giovedì 11 dicembre 2008, 21:52
Contatti:

[Risolto] Ocr gui quali dove [guida] [HowTo] 2012

Messaggio da neolinux »

Dopo il faticoso e proficuo [Risolto] Ocr gui quali dove [guida] [HowTo] http://forum.ubuntu-it.org/viewtopic.ph ... r+neolinux

Voglio dare qualche nuova dritta.

Invece di ammattirvi tanto con gli ocr comando in linea e se vi piacciono i programmi con gui (interfaccia grafica utente) ;)
indispensabili se avete testi distribuiti su più colonne e se non volete usare swindows e sMAC
Consiglio di installare gscan2pdf http://gscan2pdf.sf.net
e di implementare tesseract in italiano, ho provato anche con ocropus che forse è un pelino meglio ma non ci sono riuscito.

A) Installare Tesseract in italiano o se volete altre lingue (inglese, francese, tedesco, spagnolo, vietnamita ecc ecc)
A1) Sistema/amministrazione/gestore pacchetti/digitate la vostra password di amministratore di superutente (siate ben consci di quello che fate!!!)
A2) Digitare nella casella di ricerca Tesseract e scovatelo quello nella vostra lingua preferita ed installatelo. Scrivendo OCR ne vengono anche degli altri però a parte GOCR (terrrribilllle) non vengono usati dalla gui di gscan2pdf.
A3) chiudere subito subito il gestore pacchetti che non si sa mai, è pericoloso se siete nuovi!!!

B) Installare gscan2pdf
B1) Applicazioni ubuntu software center e da lì con la casellina di ricerca installate gscan2pdf

C) gscan2pdf è piuttosto criptico con il termine seleziona e copia, talvolta non scansiona, in quel caso potete caricare i jpg a parte,risoluzione ideale per un'immagine da trattare con ocr provare da 150 a 600 dpi, con maschere di contrasto per ocr oppure far diventare bianco più bianco ed il nero più nero a patto che gli spazi ed elementi fini (accenti apostrofi virgole rn ff puntini delle i...) rimangano ben distinti, i contorni belli regolari e lineari.
C1) Se volete copiare un'area sola di una scansione a più colonne dribblando le immagini, fare la solita selezione a rettangolo, ma poi
strumenti/ritaglia selezione
è l'unica funzione che realmente isola e copia ciò che avete parzialmente selezionato.
Se l'immagine occorre ancora la richiamate per altre selezioni.
C2) Selezionate tutte le selezioni che avete fatto assieme Modifica/seleziona/all
C3) dopo aver dato strumenti/OCR selezionando a tutto... abbiate pazienza che sta lavorando per voi.
C4) una bella controllata-correggere i testi
C4) file/salva e scegliete il formato (txt se volete il testo)

Spero via sia utile, se no chiedete lumi, se ne sapete di più i lumi dateli a me... :o
Avatar utente
neolinux
Rampante Reduce
Rampante Reduce
Messaggi: 5708
Iscrizione: giovedì 11 dicembre 2008, 21:52
Contatti:

Re: [Risolto] Ocr gui quali dove [guida] [HowTo] 2012

Messaggio da neolinux »

neolinux » [url=http://forum.ubuntu-it.org/viewtopic.php?p=4155564#p4155564]11/08/2012, 0:11[/url] ha scritto:Dopo il faticoso e proficuo [Risolto] Ocr gui quali dove [guida] [HowTo] http://forum.ubuntu-it.org/viewtopic.ph ... r+neolinux

Voglio dare qualche nuova dritta.

Invece di ammattirvi tanto con gli ocr comando in linea e se vi piacciono i programmi con gui (interfaccia grafica utente) ;)
indispensabili se avete testi distribuiti su più colonne e se non volete usare swindows e sMAC
Consiglio di installare gscan2pdf http://gscan2pdf.sf.net
e di implementare tesseract in italiano, ho provato anche con ocropus che forse è un pelino meglio ma non ci sono riuscito.

A) Installare Tesseract in italiano o se volete altre lingue (inglese, francese, tedesco, spagnolo, vietnamita ecc ecc)
A1) Sistema/amministrazione/gestore pacchetti/digitate la vostra password di amministratore di superutente (siate ben consci di quello che fate!!!)
A2) Digitare nella casella di ricerca Tesseract e scovatelo quello nella vostra lingua preferita ed installatelo. Scrivendo OCR ne vengono anche degli altri però a parte GOCR (terrrribilllle) non vengono usati dalla gui di gscan2pdf.
A3) chiudere subito subito il gestore pacchetti che non si sa mai, è pericoloso se siete nuovi!!!

B) Installare gscan2pdf
B1) Applicazioni ubuntu software center e da lì con la casellina di ricerca installate gscan2pdf

C) gscan2pdf è piuttosto criptico con il termine seleziona e copia, talvolta non scansiona, in quel caso potete caricare i jpg a parte,risoluzione ideale per un'immagine da trattare con ocr provare da 150 a 600 dpi, con maschere di contrasto per ocr oppure far diventare bianco più bianco ed il nero più nero a patto che gli spazi ed elementi fini (accenti apostrofi virgole rn ff puntini delle i...) rimangano ben distinti, i contorni belli regolari e lineari.
C1) Se volete copiare un'area sola di una scansione a più colonne dribblando le immagini, fare la solita selezione a rettangolo, ma poi
strumenti/ritaglia selezione
è l'unica funzione che realmente isola e copia ciò che avete parzialmente selezionato.
Se l'immagine occorre ancora la richiamate per altre selezioni.
C2) Selezionate tutte le selezioni che avete fatto assieme Modifica/seleziona/all
C3) dopo aver dato strumenti/OCR selezionando a tutto... abbiate pazienza che sta lavorando per voi.
C4) una bella controllata-correggere i testi, se ne avete tanti salvate prima e controllate poi, per prevenire perdite di dati.
C5) file/salva e scegliete il formato (txt se volete il testo)

Spero via sia utile, se no chiedete lumi, se ne sapete di più i lumi dateli a me... :o
NB gscan2pdf talvolta non è proprio stabilissimo, per cui è meglio che saltiate il punto C4, specie se avete molto materiale da controllare dopo la scansione, potreste perdere i dati.
Avatar utente
Wilson
Imperturbabile Insigne
Imperturbabile Insigne
Messaggi: 3539
Iscrizione: domenica 20 novembre 2005, 14:47
Desktop: Unity
Distribuzione: Edubuntu 15.04 x86_64
Località: Torino

Re: RISOLTO gscan2pdf scanner con ubuntu 10.04 uso OCR GUIDA

Messaggio da Wilson »

In alternativa, si può usare OCRFeeder.

L'ho usato poco, ma non mi ha mai dato problemi (e permette anche lui di usare tutti i motori OCR installati sul pc: Tesseract, Ocrad, GOCR, Cuneiform...)
-- Provate Ubuntu! Innocuo se usato secondo le istruzioni --
Avatar utente
neolinux
Rampante Reduce
Rampante Reduce
Messaggi: 5708
Iscrizione: giovedì 11 dicembre 2008, 21:52
Contatti:

Re: RISOLTO gscan2pdf scanner con ubuntu 10.04 uso OCR GUIDA

Messaggio da neolinux »

Wilson » [url=http://forum.ubuntu-it.org/viewtopic.php?p=4164500#p4164500]oggi, 9:36[/url] ha scritto:In alternativa, si può usare OCRFeeder.

L'ho usato poco, ma non mi ha mai dato problemi (e permette anche lui di usare tutti i motori OCR installati sul pc: Tesseract, Ocrad, GOCR, Cuneiform...)
Si ma se il testo è a più colonne come fai?

Comunque per l'italiano tesseract pare non avere rivali, neppure nella versione inglese (se la scansione è fatta bene bene).
Avatar utente
Wilson
Imperturbabile Insigne
Imperturbabile Insigne
Messaggi: 3539
Iscrizione: domenica 20 novembre 2005, 14:47
Desktop: Unity
Distribuzione: Edubuntu 15.04 x86_64
Località: Torino

Re: [Risolto] How-to: gscan2pdf scanner su 10.04 uso OCR

Messaggio da Wilson »

Vado a memoria (son due mesi che manco lo accendo...), ma mi pare permetta di selezionare ogni parte del testo; fa una selezione automatica, ma se non si accorge delle colonne puoi correggerlo.

Non so però come se la cava con grandi moli di lavoro , io al massimo chi ho passato una decina di pagine.

ps: se, se non sbaglio gli unici risultati decenti li ho avuti con tesseract, anche se gli altri motori hanno dei punti di forza (ad esempio mi pare che uno di questi riconoscesse meglio la formattazione).
-- Provate Ubuntu! Innocuo se usato secondo le istruzioni --
Scrivi risposta

Ritorna a “Applicazioni professionali”

Chi c’è in linea

Visualizzano questa sezione: 0 utenti iscritti e 3 ospiti