Nuovo dizionario per tesseract

Installazione, configurazione e uso di programmi e strumenti.
Scrivi risposta
brazoayeye
Prode Principiante
Messaggi: 218
Iscrizione: giovedì 11 settembre 2008, 23:49

Nuovo dizionario per tesseract

Messaggio da brazoayeye »

Salve, io devo fare un dizionario per una lingua che non esiste per tesseract (o vi sono altri ocr da shell validi?)

Ho visto questa guida: http://code.google.com/p/tesseract-ocr/ ... Tesseract2

L'ho letta ma non ci ho capito molto: la prima parte riguarda il far leggere a tesseract le lettere mentre l'ultima è orientata ad aggiungere un dizionario?

Ho fatto l'elenco delle parole che si possono incontrare, e ho fatto 2 file TXT (diviso in frequenti e non frequenti). Una volta che ho eseguito i comandi

Codice: Seleziona tutto

wordlist2dawg frequent_words_list freq-dawg
wordlist2dawg words_list word-dawg
mi crea i due file, ma poi come faccio ad usare quelli al posto del dizionario inglese di default?

Se utilizzo fogli scritti con una macchina da scrivere mi conviene fare completamente il training? In tal caso avrei bisogno di alcune istruzioni in italiano XD
Scrivi risposta

Ritorna a “Applicazioni”

Chi c’è in linea

Visualizzano questa sezione: 0 utenti iscritti e 5 ospiti