Pagina 1 di 1

wget suggerimenti?!?!?!?

Inviato: mercoledì 24 novembre 2010, 22:29
da qwerty192
ciao ragazzi volevo scaricare delle immagini con WGET di una pagina con indicizzazione delle apache ( es link http://www.cartoline.it/pics/ )
mi dite come scaricare???
io uso
wget -A.jpg per scaricare solo i file jpg solo ke mi scarica il file in html quindi nn mi scarica le immagini intere!!!

Re: wget suggerimenti?!?!?!?

Inviato: giovedì 25 novembre 2010, 17:46
da qwerty192
up

Re: wget suggerimenti?!?!?!?

Inviato: giovedì 25 novembre 2010, 17:55
da Devnull
qwerty192 ha scritto: ciao ragazzi volevo scaricare delle immagini con WGET di una pagina con indicizzazione delle apache ( es link http://www.cartoline.it/pics/ )
mi dite come scaricare???
io uso
wget -A.jpg per scaricare solo i file jpg solo ke mi scarica il file in html quindi nn mi scarica le immagini intere!!!

Prima di postare puoi almeno leggere la descrizione delle sezioni?  Comincia da quella di Accessibilità e tecnologie assistive.

Sposto in Software.

Re: wget suggerimenti?!?!?!?

Inviato: giovedì 25 novembre 2010, 20:13
da as-far-as-i-know
Niente da fare, il comando segnalato dalla guida è:

Codice: Seleziona tutto

-A,  --accept=LIST               comma-separated list of accepted extensions.
// cioè
wget -A,jpg [URL] oppure
wgwt --accept=jpg [URL]
Viene scaricato solo il file index.html dell'URL assegnato, solo quello. Ciao

Re: wget suggerimenti?!?!?!?

Inviato: giovedì 25 novembre 2010, 20:27
da Elrond

Codice: Seleziona tutto

wget -e robots=off -nd --level=0 -nc -r -A *.jpg http://www.cartoline.it/pics/

Re: wget suggerimenti?!?!?!?

Inviato: giovedì 25 novembre 2010, 22:46
da qwerty192
Elrond ha scritto:

Codice: Seleziona tutto

wget -e robots=off -nd --level=0 -nc -r -A *.jpg http://www.cartoline.it/pics/
non va...... qualcuno qualche idea????

Re: wget suggerimenti?!?!?!?

Inviato: giovedì 25 novembre 2010, 22:48
da qwerty192
io vorrei fare in modo che mi scarichi tutte le immagini senza aprire ogni singolo Link per salvarle una per una.....

Re: wget suggerimenti?!?!?!?

Inviato: giovedì 25 novembre 2010, 23:18
da as-far-as-i-know
Perfetto, Elrond! Funziona.
Ho provato il tuo comando sul mio sito e vengono scaricati tutti i file .jpg

Codice: Seleziona tutto

wget -e robots=off -nd --level=0 -nc -r -A *.jpg [URL mio sito]
// potrei riprovare anche senza "-e robots=off" visto che il mio sito non è protetto
@ qwerty192
Il sito che hai indicato tu nel primo post è stato ri-linkato ad altro indirizzo, ecco perché la tua manovra di download di file .jpg non riesce.
Grazie e ... buona notte!

Re: wget suggerimenti?!?!?!?

Inviato: giovedì 25 novembre 2010, 23:43
da Elrond
as-far-as-i-know ha scritto: Perfetto, Elrond! Funziona.
Ho provato il tuo comando sul mio sito e vengono scaricati tutti i file .jpg

Codice: Seleziona tutto

wget -e robots=off -nd --level=0 -nc -r -A *.jpg [URL mio sito]
// potrei riprovare anche senza "-e robots=off" visto che il mio sito non è protetto
Il robots.txt di quel sito impediva l'accesso alla cartella pics/, normalmente non dovrebbe esserci bisogno di questo espediente.

Ne approfitto per spiegare un po' la sintassi a chi è interessato:

Codice: Seleziona tutto

wget -e robots=off -nd --level=0 -nc -r -A *.jpg [URL mio sito]

Codice: Seleziona tutto

-e robots=off
Serve per dire a wget di non onorare il robots.txt. Questa funzione è documentata nell'info, non nel man di wget

Codice: Seleziona tutto

-nd
Serve per non ricreare la struttura delle cartelle

Codice: Seleziona tutto

-r
Scarica ricorsivamente tutti gli elementi linkati in quella pagina

Codice: Seleziona tutto

--level=0
Specifica il livello della ricorsione, 0 significa che si ferma alla cartella del sito indicata come argomento

Codice: Seleziona tutto

-nc
Sta per no clobber, non scarica file già precedentemente scaricati. Non è strettamente necessaria, però potrebbe essere utile per evitare di scaricare doppioni e visto il numero di elevato di immagini sarebbe un bel risparmio.

Codice: Seleziona tutto

-A *.jpg
Specifica che gli unici file accettati devono avere estensione "*.jpg". L'opzione -A, così come il suo contrario -R, sono case sensitive (sensibili alle maiuscole), per renderli case insensitive (ignorare la differenza fra maiuscole e minuscole) bisogna usare l'opzione --ignore-case

Re: wget suggerimenti?!?!?!?

Inviato: venerdì 26 novembre 2010, 8:44
da as-far-as-i-know
Ottima spiegazione, Elrond! Ne ho fatto copia e incolla sui miei 'appunti Unix'.
Devo comunque far notare che il tuo comando sul sito delle cartoline dà errore, precisando che mi trovo in questo momento su Windows ed ho attivato il relativo wget.exe

Codice: Seleziona tutto

C:\zzz>wget -e robots=off -nd --level=0 -nc -r -A *.jpg http://www.cartoline.it/pics/
--2010-11-26 08:27:46--  http://www.cartoline.it/pics/
Resolving www.cartoline.it... 213.92.76.149
Connecting to www.cartoline.it|213.92.76.149|:80... connected.
HTTP request sent, awaiting response... 403 Forbidden
2010-11-26 08:27:49 ERROR 403: Forbidden.

C:\zzz>wget -V
GNU Wget 1.11.4
Ciao, e buona giornata

Re: wget suggerimenti?!?!?!?

Inviato: venerdì 26 novembre 2010, 12:53
da Elrond
as-far-as-i-know ha scritto: Ottima spiegazione, Elrond! Ne ho fatto copia e incolla sui miei 'appunti Unix'.
Devo comunque far notare che il tuo comando sul sito delle cartoline dà errore, precisando che mi trovo in questo momento su Windows ed ho attivato il relativo wget.exe

Codice: Seleziona tutto

C:\zzz>wget -e robots=off -nd --level=0 -nc -r -A *.jpg http://www.cartoline.it/pics/
--2010-11-26 08:27:46--  http://www.cartoline.it/pics/
Resolving www.cartoline.it... 213.92.76.149
Connecting to www.cartoline.it|213.92.76.149|:80... connected.
HTTP request sent, awaiting response... 403 Forbidden
2010-11-26 08:27:49 ERROR 403: Forbidden.

C:\zzz>wget -V
GNU Wget 1.11.4
Ciao, e buona giornata
Sembra che non riconosca l'opzione -e robots=off, infatti su Ubuntu ottengo:

Codice: Seleziona tutto

$ wget -nd --level=0 -nc -r -A *.jpg http://www.cartoline.it/pics/
--2010-11-26 12:52:23--  http://www.cartoline.it/pics/
Risoluzione di www.cartoline.it... 213.92.76.149
Connessione a www.cartoline.it|213.92.76.149|:80... connesso.
HTTP richiesta inviata, in attesa di risposta... 403 Forbidden
2010-11-26 12:52:23 ERRORE 403: Forbidden.

Re: wget suggerimenti?!?!?!?

Inviato: venerdì 26 novembre 2010, 18:07
da qwerty192
Si davvero ottima risposta ORLAND :) :)

Re: wget suggerimenti?!?!?!?

Inviato: venerdì 26 novembre 2010, 18:09
da qwerty192
ultima cosa se durante il down volessi bloccare tutto come si fa???  :)

Re: wget suggerimenti?!?!?!?

Inviato: venerdì 26 novembre 2010, 18:17
da Elrond
qwerty192 ha scritto: ultima cosa se durante il down volessi bloccare tutto come si fa???  :)
CTRL + C per uccidere il processo. Se vuoi riprendere puoi usare lo stesso comando, grazie alla presenza dell'opzione -nc i file già presenti non saranno scaricati nuovamente

Re: wget suggerimenti?!?!?!?

Inviato: venerdì 26 novembre 2010, 23:35
da qwerty192
Elrond ha scritto:
qwerty192 ha scritto: ultima cosa se durante il down volessi bloccare tutto come si fa???  :)
CTRL + C per uccidere il processo. Se vuoi riprendere puoi usare lo stesso comando, grazie alla presenza dell'opzione -nc i file già presenti non saranno scaricati nuovamente

grazie mille!!! :D :D