Ricerca contemporanea in più file .pdf

Installazione, configurazione e uso di programmi e strumenti.
Avatar utente
neolinux
Rampante Reduce
Rampante Reduce
Messaggi: 5722
Iscrizione: giovedì 11 dicembre 2008, 21:52
Contatti:

[Risolto] Re: Ricerca testo contemporanea in più file .pdf

Messaggio da neolinux »

Antonio Lo Nardo ha scritto: Anch'io avevo la tua stessa esigenza e ho risolto con Recoll, che indicizza tantissimi tipi di file (anche pdf) e ti consente un'ampia personalizzazione dei criteri di ricerca.
È nel repository di ubuntu ed è l'unico pare a fare quel tipo di ricerche, non ho trovato parole chiave utili per individuarlo efficacemente.

Applicazioni/ubuntu software center e nella casella di ricerca si digita il pacchetto o le caratteristiche desiderate in inglese, poi si installa.
Ultima modifica di neolinux il sabato 28 agosto 2010, 11:18, modificato 1 volta in totale.
Avatar utente
palimmo
Entusiasta Emergente
Entusiasta Emergente
Messaggi: 1832
Iscrizione: venerdì 30 marzo 2007, 17:17
Contatti:

Re: Ricerca contemporanea in più file .pdf

Messaggio da palimmo »

neolinux ha scritto:
Antonio Lo Nardo ha scritto: Anch'io avevo la tua stessa esigenza e ho risolto con Recoll, che indicizza tantissimi tipi di file (anche pdf) e ti consente un'ampia personalizzazione dei criteri di ricerca.
È nel repository di ubuntu ed è l'unico pare a fare quel tipo di ricerche, non ho trovato parole chiave utili per individuarlo efficacemente.

Applicazioni/ubuntu software center e nella casella di ricerca si digita il pacchetto o le caratteristiche desiderate in inglese, poi si installa.
e in cosa cambia da Tracker?
...vengono, vanno, ritornano...
e magari si fermano tanti giorni
http://aquilone.wordpress.com/
Avatar utente
neolinux
Rampante Reduce
Rampante Reduce
Messaggi: 5722
Iscrizione: giovedì 11 dicembre 2008, 21:52
Contatti:

Re: Ricerca contemporanea in più file .pdf

Messaggio da neolinux »

palimmo ha scritto:
neolinux ha scritto:
Antonio Lo Nardo ha scritto: Anch'io avevo la tua stessa esigenza e ho risolto con Recoll, che indicizza tantissimi tipi di file (anche pdf) e ti consente un'ampia personalizzazione dei criteri di ricerca.
È nel repository di ubuntu ed è l'unico pare a fare quel tipo di ricerche, non ho trovato parole chiave utili per individuarlo efficacemente.

Applicazioni/ubuntu software center e nella casella di ricerca si digita il pacchetto o le caratteristiche desiderate in inglese, poi si installa.
e in cosa cambia da Tracker?
Non lo so a me non funziona, inoltre sembra non sia in grado di cercare testo interno, al massimo si occupa delle tag da quanto capisco dalla descrizione di aggiungi rimuovi (un programma molto simile ma fatto meglio di ubuntu software center).
Recoll funziona anche a me :)
Antonio Lo Nardo
Entusiasta Emergente
Entusiasta Emergente
Messaggi: 1644
Iscrizione: domenica 17 dicembre 2006, 10:57
Località: Palermo
Contatti:

Re: Ricerca contemporanea in più file .pdf

Messaggio da Antonio Lo Nardo »

Confermo le parole di neolinux. Inoltre Beagle mi si impadroniva di tutta la mia Ram, rallentando mostruosamente tutto. Vai con Recoll.
Avatar utente
neolinux
Rampante Reduce
Rampante Reduce
Messaggi: 5722
Iscrizione: giovedì 11 dicembre 2008, 21:52
Contatti:

Re: Ricerca contemporanea in più file .pdf

Messaggio da neolinux »

Antonio Lo Nardo ha scritto: Inoltre Beagle ....
Questo è nuovo, secondo aggiungi rimuovi c'è più d'un programma che lo usa, quanto a lentezza recoll crea un database prima di cominciare e gli ci vuole un po', ma poi quando lanci la ricerca la risposta è veramente celere.
Avatar utente
palimmo
Entusiasta Emergente
Entusiasta Emergente
Messaggi: 1832
Iscrizione: venerdì 30 marzo 2007, 17:17
Contatti:

Re: Ricerca contemporanea in più file .pdf

Messaggio da palimmo »

Elrond ha scritto: Ti sposti con cd nella cartella in cui effettuare la ricerca e dai il comando

Codice: Seleziona tutto

for file in *.pdf ; do if less "$file" | grep -iq Lactococcus; then echo $file; fi ; done
Devi solo sostituire a Lactococcus la parola da cercare. Se è una stringa mettila fra virgolette, in questo modo (per esempio):

Codice: Seleziona tutto

for file in *.pdf ; do if less "$file" | grep -iq "stringa da cercare"; then echo $file; fi ; done
Perdonami ancora Elrond...
ma, spostatomi nella cartella, dovrei dare da terminale il comando
for file in *.pdf ; do if less "$file" | grep -iq Lactococcus; then echo $file; fi ; done
cosi proprio come é scritto? o devo omettere qualcosa? 
...vengono, vanno, ritornano...
e magari si fermano tanti giorni
http://aquilone.wordpress.com/
Avatar utente
Elrond
Rampante Reduce
Rampante Reduce
Messaggi: 5018
Iscrizione: sabato 22 novembre 2008, 12:32
Contatti:

Re: Ricerca contemporanea in più file .pdf

Messaggio da Elrond »

palimmo ha scritto:
Elrond ha scritto: Ti sposti con cd nella cartella in cui effettuare la ricerca e dai il comando

Codice: Seleziona tutto

for file in *.pdf ; do if less "$file" | grep -iq Lactococcus; then echo $file; fi ; done
Devi solo sostituire a Lactococcus la parola da cercare. Se è una stringa mettila fra virgolette, in questo modo (per esempio):

Codice: Seleziona tutto

for file in *.pdf ; do if less "$file" | grep -iq "stringa da cercare"; then echo $file; fi ; done
Perdonami ancora Elrond...
ma, spostatomi nella cartella, dovrei dare da terminale il comando
for file in *.pdf ; do if less "$file" | grep -iq Lactococcus; then echo $file; fi ; done
cosi proprio come é scritto? o devo omettere qualcosa?  
Ho già detto quello che c'è da sostituire, tutto il resto deve rimanere così come è. Ho provato (nuovamente, l'avevo già fatto quando ho suggerito questo comando) con dei documenti miei e funziona
Il mio blog su Ubuntu | Script per vedere canali RAI in diretta senza browser (discussione)
Quando devi inserire nei messaggi del codice usa il tag code, è il pulsante # sopra le emoticon: [code]inserisci il testo qui[/code]
Avatar utente
palimmo
Entusiasta Emergente
Entusiasta Emergente
Messaggi: 1832
Iscrizione: venerdì 30 marzo 2007, 17:17
Contatti:

Re: Ricerca contemporanea in più file .pdf

Messaggio da palimmo »

Elrond ha scritto:
palimmo ha scritto:
Elrond ha scritto: Ti sposti con cd nella cartella in cui effettuare la ricerca e dai il comando

Codice: Seleziona tutto

for file in *.pdf ; do if less "$file" | grep -iq Lactococcus; then echo $file; fi ; done
Devi solo sostituire a Lactococcus la parola da cercare. Se è una stringa mettila fra virgolette, in questo modo (per esempio):

Codice: Seleziona tutto

for file in *.pdf ; do if less "$file" | grep -iq "stringa da cercare"; then echo $file; fi ; done
Perdonami ancora Elrond...
ma, spostatomi nella cartella, dovrei dare da terminale il comando
for file in *.pdf ; do if less "$file" | grep -iq Lactococcus; then echo $file; fi ; done
cosi proprio come é scritto? o devo omettere qualcosa?  
Ho già detto quello che c'è da sostituire, tutto il resto deve rimanere così come è. Ho provato (nuovamente, l'avevo già fatto quando ho suggerito questo comando) con dei documenti miei e funziona

Codice: Seleziona tutto

alessio@alessio-laptop:/media/Dati/Documenti$ for file in *.pdf ; do if less "$file" | grep -iq Lactococcus; then echo $file; fi ; done
*.pdf: Nessun file o directory
...vengono, vanno, ritornano...
e magari si fermano tanti giorni
http://aquilone.wordpress.com/
Avatar utente
Elrond
Rampante Reduce
Rampante Reduce
Messaggi: 5018
Iscrizione: sabato 22 novembre 2008, 12:32
Contatti:

Re: Ricerca contemporanea in più file .pdf

Messaggio da Elrond »

Ma i file stanno in quella cartella? Si direbbe di no (o almeno non hanno estensione .pdf)
Il mio blog su Ubuntu | Script per vedere canali RAI in diretta senza browser (discussione)
Quando devi inserire nei messaggi del codice usa il tag code, è il pulsante # sopra le emoticon: [code]inserisci il testo qui[/code]
Avatar utente
palimmo
Entusiasta Emergente
Entusiasta Emergente
Messaggi: 1832
Iscrizione: venerdì 30 marzo 2007, 17:17
Contatti:

Re: Ricerca contemporanea in più file .pdf

Messaggio da palimmo »

Elrond ha scritto: Ma i file stanno in quella cartella? Si direbbe di no (o almeno non hanno estensione .pdf)
Si... sono presenti in tante sottocartelle.
Effettivamente, se mi sposto direttamente con cd nella sottocartella interessata dove sono presenti quei file .pdf, allora li é in grado di trovarli...
Non si puo' implementare il comando affinchè cerchi anche nelle sottocartelle?
...vengono, vanno, ritornano...
e magari si fermano tanti giorni
http://aquilone.wordpress.com/
Avatar utente
Elrond
Rampante Reduce
Rampante Reduce
Messaggi: 5018
Iscrizione: sabato 22 novembre 2008, 12:32
Contatti:

Re: Ricerca contemporanea in più file .pdf

Messaggio da Elrond »

Prova con

Codice: Seleziona tutto

find -type f -iname "*.pdf" -exec bash -c 'if less "{}" | grep -iq "stringa da cercare"; then echo "{}" ; fi' \;
Il mio blog su Ubuntu | Script per vedere canali RAI in diretta senza browser (discussione)
Quando devi inserire nei messaggi del codice usa il tag code, è il pulsante # sopra le emoticon: [code]inserisci il testo qui[/code]
Avatar utente
palimmo
Entusiasta Emergente
Entusiasta Emergente
Messaggi: 1832
Iscrizione: venerdì 30 marzo 2007, 17:17
Contatti:

Re: Ricerca contemporanea in più file .pdf

Messaggio da palimmo »

Elrond ha scritto: Prova con

Codice: Seleziona tutto

find -type f -iname "*.pdf" -exec bash -c 'if less "{}" | grep -iq "stringa da cercare"; then echo "{}" ; fi' \;
Lento ma pare funzionare bene!
Ottimo questo comando in attesa di capire per quale motivo Tracker non mi indicizza tutti i documenti e mi produce risultati poco attendibili.

Credo sia opportuno inserirlo nel thread sui comandi importanti da terminale..non credi?
...vengono, vanno, ritornano...
e magari si fermano tanti giorni
http://aquilone.wordpress.com/
Avatar utente
Elrond
Rampante Reduce
Rampante Reduce
Messaggi: 5018
Iscrizione: sabato 22 novembre 2008, 12:32
Contatti:

Re: Ricerca contemporanea in più file .pdf

Messaggio da Elrond »

palimmo ha scritto:
Elrond ha scritto: Prova con

Codice: Seleziona tutto

find -type f -iname "*.pdf" -exec bash -c 'if less "{}" | grep -iq "stringa da cercare"; then echo "{}" ; fi' \;
Lento ma pare funzionare bene!
Ottimo questo comando in attesa di capire per quale motivo Tracker non mi indicizza tutti i documenti e mi produce risultati poco attendibili.

Credo sia opportuno inserirlo nel thread sui comandi importanti da terminale..non credi?
Lo so che è lento, ma le operazioni che vengono eseguite sono:
· ricerca dei file;
· lettura di tutti i documenti trovati (e se sono lunghi questa operazione è abbastanza lenta);
· sull'output ottenuto dal passo precedente effettua la ricerca.

L'ideale sarebbe effettuare la ricerca man mano, ma grep sembra mal digerire i pdf, quindi bisogna purtroppo fare tutti questi giri
Il mio blog su Ubuntu | Script per vedere canali RAI in diretta senza browser (discussione)
Quando devi inserire nei messaggi del codice usa il tag code, è il pulsante # sopra le emoticon: [code]inserisci il testo qui[/code]
Avatar utente
CARUNCHIO80
Scoppiettante Seguace
Scoppiettante Seguace
Messaggi: 292
Iscrizione: domenica 31 maggio 2009, 17:10

Re: Ricerca contemporanea in più file .pdf

Messaggio da CARUNCHIO80 »

Mi permetto di segnalare la ricerca di Kubuntu (Nepomuk + Strigi) una volta che ha indicizzato, ricerca il testo anche nei file   (vedi allegato) ;)

direttamente da Dolphin in pratica inserito il termine "Lactococcus" ti evidenzia tutti i file che lo hanno al suo interno, se poi tu li etichetti  il "desktop semantico" di Kde 4 è ancora più funzionale
Allegati
ricerca.jpg
Avatar utente
palimmo
Entusiasta Emergente
Entusiasta Emergente
Messaggi: 1832
Iscrizione: venerdì 30 marzo 2007, 17:17
Contatti:

Re: Ricerca contemporanea in più file .pdf

Messaggio da palimmo »

CARUNCHIO80 ha scritto: Mi permetto di segnalare la ricerca di Kubuntu (Nepomuk + Strigi) una volta che ha indicizzato, ricerca il testo anche nei file   (vedi allegato) ;)

direttamente da Dolphin in pratica inserito il termine "Lactococcus" ti evidenzia tutti i file che lo hanno al suo interno, se poi tu li etichetti  il "desktop semantico" di Kde 4 è ancora più funzionale
mi auguro riesca ad ottenere qualcosa di simile sotto ubuntu (gnome) con.. tracker?
...vengono, vanno, ritornano...
e magari si fermano tanti giorni
http://aquilone.wordpress.com/
Avatar utente
CARUNCHIO80
Scoppiettante Seguace
Scoppiettante Seguace
Messaggi: 292
Iscrizione: domenica 31 maggio 2009, 17:10

Re: Ricerca contemporanea in più file .pdf

Messaggio da CARUNCHIO80 »

palimmo ha scritto:
mi auguro riesca ad ottenere qualcosa di simile sotto ubuntu (gnome) con.. tracker?
Assolutamente , mi sono "permesso" di segnalare  una funzionalità integrata in KDE 4 che risponde  egregiamente alla richiesta in Oggetto, ma se con Tracker o Recoll su gnome si ottengono buoni risultati tanto meglio  ;)
gdivito
Entusiasta Emergente
Entusiasta Emergente
Messaggi: 1007
Iscrizione: venerdì 4 giugno 2010, 11:53

Re: Ricerca contemporanea in più file .pdf

Messaggio da gdivito »

Elrond ha scritto: Prova con

Codice: Seleziona tutto

find -type f -iname "*.pdf" -exec bash -c 'if less "{}" | grep -iq "stringa da cercare"; then echo "{}" ; fi' \;
scusa, ma usare la ricerca di gnome non è più pratico? fa esattamente la stessa cosa, usando proprio find, ma da grafica.
It's a UNIX system! I know this! (Jurassic Park)
Avatar utente
palimmo
Entusiasta Emergente
Entusiasta Emergente
Messaggi: 1832
Iscrizione: venerdì 30 marzo 2007, 17:17
Contatti:

Re: Ricerca contemporanea in più file .pdf

Messaggio da palimmo »

gdivito ha scritto:
Elrond ha scritto: Prova con

Codice: Seleziona tutto

find -type f -iname "*.pdf" -exec bash -c 'if less "{}" | grep -iq "stringa da cercare"; then echo "{}" ; fi' \;
scusa, ma usare la ricerca di gnome non è più pratico? fa esattamente la stessa cosa, usando proprio find, ma da grafica.
ehm.. non mi risulta vada a cercare i termini all'interno di documenti..
...vengono, vanno, ritornano...
e magari si fermano tanti giorni
http://aquilone.wordpress.com/
gdivito
Entusiasta Emergente
Entusiasta Emergente
Messaggi: 1007
Iscrizione: venerdì 4 giugno 2010, 11:53

Re: Ricerca contemporanea in più file .pdf

Messaggio da gdivito »

Sì, cerca, ma adesso provando in effetti vedo che non cerca in file che non siano di testo.
It's a UNIX system! I know this! (Jurassic Park)
Avatar utente
Elrond
Rampante Reduce
Rampante Reduce
Messaggi: 5018
Iscrizione: sabato 22 novembre 2008, 12:32
Contatti:

Re: Ricerca contemporanea in più file .pdf

Messaggio da Elrond »

gdivito ha scritto:
Elrond ha scritto: Prova con

Codice: Seleziona tutto

find -type f -iname "*.pdf" -exec bash -c 'if less "{}" | grep -iq "stringa da cercare"; then echo "{}" ; fi' \;
scusa, ma usare la ricerca di gnome non è più pratico? fa esattamente la stessa cosa, usando proprio find, ma da grafica.
Personalmente non ho GNOME :)
Il mio blog su Ubuntu | Script per vedere canali RAI in diretta senza browser (discussione)
Quando devi inserire nei messaggi del codice usa il tag code, è il pulsante # sopra le emoticon: [code]inserisci il testo qui[/code]
Scrivi risposta

Ritorna a “Applicazioni”

Chi c’è in linea

Visualizzano questa sezione: Bing [Bot], corradoventu e 16 ospiti