wget suggerimenti?!?!?!?

Installazione, configurazione e uso di programmi e strumenti.
Scrivi risposta
qwerty192
Prode Principiante
Messaggi: 80
Iscrizione: martedì 7 settembre 2010, 13:36

wget suggerimenti?!?!?!?

Messaggio da qwerty192 »

ciao ragazzi volevo scaricare delle immagini con WGET di una pagina con indicizzazione delle apache ( es link http://www.cartoline.it/pics/ )
mi dite come scaricare???
io uso
wget -A.jpg per scaricare solo i file jpg solo ke mi scarica il file in html quindi nn mi scarica le immagini intere!!!
qwerty192
Prode Principiante
Messaggi: 80
Iscrizione: martedì 7 settembre 2010, 13:36

Re: wget suggerimenti?!?!?!?

Messaggio da qwerty192 »

up
Avatar utente
Devnull
Rampante Reduce
Rampante Reduce
Messaggi: 8158
Iscrizione: lunedì 21 novembre 2005, 15:56
Località: Ancona

Re: wget suggerimenti?!?!?!?

Messaggio da Devnull »

qwerty192 ha scritto: ciao ragazzi volevo scaricare delle immagini con WGET di una pagina con indicizzazione delle apache ( es link http://www.cartoline.it/pics/ )
mi dite come scaricare???
io uso
wget -A.jpg per scaricare solo i file jpg solo ke mi scarica il file in html quindi nn mi scarica le immagini intere!!!

Prima di postare puoi almeno leggere la descrizione delle sezioni?  Comincia da quella di Accessibilità e tecnologie assistive.

Sposto in Software.
Da regolamento (Sez. I punto 15) è vietato inviare messaggi privati per richieste di supporto tecnico, si prega di aprire una discussione nella giusta sezione.
Hai domande sul forum? Leggi le FAQ e il Regolamento.
→ → → → Partecipa alla documentazione ← ← ← ←
as-far-as-i-know
Entusiasta Emergente
Entusiasta Emergente
Messaggi: 1096
Iscrizione: martedì 26 maggio 2009, 13:23

Re: wget suggerimenti?!?!?!?

Messaggio da as-far-as-i-know »

Niente da fare, il comando segnalato dalla guida è:

Codice: Seleziona tutto

-A,  --accept=LIST               comma-separated list of accepted extensions.
// cioè
wget -A,jpg [URL] oppure
wgwt --accept=jpg [URL]
Viene scaricato solo il file index.html dell'URL assegnato, solo quello. Ciao
Message to Canonical: I dislike Unity and am ready to migrate somewhere. From Ubuntu 6.10 to 11.04 with love, thank you!
Avatar utente
Elrond
Rampante Reduce
Rampante Reduce
Messaggi: 5018
Iscrizione: sabato 22 novembre 2008, 12:32
Contatti:

Re: wget suggerimenti?!?!?!?

Messaggio da Elrond »

Codice: Seleziona tutto

wget -e robots=off -nd --level=0 -nc -r -A *.jpg http://www.cartoline.it/pics/
Il mio blog su Ubuntu | Script per vedere canali RAI in diretta senza browser (discussione)
Quando devi inserire nei messaggi del codice usa il tag code, è il pulsante # sopra le emoticon: [code]inserisci il testo qui[/code]
qwerty192
Prode Principiante
Messaggi: 80
Iscrizione: martedì 7 settembre 2010, 13:36

Re: wget suggerimenti?!?!?!?

Messaggio da qwerty192 »

Elrond ha scritto:

Codice: Seleziona tutto

wget -e robots=off -nd --level=0 -nc -r -A *.jpg http://www.cartoline.it/pics/
non va...... qualcuno qualche idea????
qwerty192
Prode Principiante
Messaggi: 80
Iscrizione: martedì 7 settembre 2010, 13:36

Re: wget suggerimenti?!?!?!?

Messaggio da qwerty192 »

io vorrei fare in modo che mi scarichi tutte le immagini senza aprire ogni singolo Link per salvarle una per una.....
as-far-as-i-know
Entusiasta Emergente
Entusiasta Emergente
Messaggi: 1096
Iscrizione: martedì 26 maggio 2009, 13:23

Re: wget suggerimenti?!?!?!?

Messaggio da as-far-as-i-know »

Perfetto, Elrond! Funziona.
Ho provato il tuo comando sul mio sito e vengono scaricati tutti i file .jpg

Codice: Seleziona tutto

wget -e robots=off -nd --level=0 -nc -r -A *.jpg [URL mio sito]
// potrei riprovare anche senza "-e robots=off" visto che il mio sito non è protetto
@ qwerty192
Il sito che hai indicato tu nel primo post è stato ri-linkato ad altro indirizzo, ecco perché la tua manovra di download di file .jpg non riesce.
Grazie e ... buona notte!
Message to Canonical: I dislike Unity and am ready to migrate somewhere. From Ubuntu 6.10 to 11.04 with love, thank you!
Avatar utente
Elrond
Rampante Reduce
Rampante Reduce
Messaggi: 5018
Iscrizione: sabato 22 novembre 2008, 12:32
Contatti:

Re: wget suggerimenti?!?!?!?

Messaggio da Elrond »

as-far-as-i-know ha scritto: Perfetto, Elrond! Funziona.
Ho provato il tuo comando sul mio sito e vengono scaricati tutti i file .jpg

Codice: Seleziona tutto

wget -e robots=off -nd --level=0 -nc -r -A *.jpg [URL mio sito]
// potrei riprovare anche senza "-e robots=off" visto che il mio sito non è protetto
Il robots.txt di quel sito impediva l'accesso alla cartella pics/, normalmente non dovrebbe esserci bisogno di questo espediente.

Ne approfitto per spiegare un po' la sintassi a chi è interessato:

Codice: Seleziona tutto

wget -e robots=off -nd --level=0 -nc -r -A *.jpg [URL mio sito]

Codice: Seleziona tutto

-e robots=off
Serve per dire a wget di non onorare il robots.txt. Questa funzione è documentata nell'info, non nel man di wget

Codice: Seleziona tutto

-nd
Serve per non ricreare la struttura delle cartelle

Codice: Seleziona tutto

-r
Scarica ricorsivamente tutti gli elementi linkati in quella pagina

Codice: Seleziona tutto

--level=0
Specifica il livello della ricorsione, 0 significa che si ferma alla cartella del sito indicata come argomento

Codice: Seleziona tutto

-nc
Sta per no clobber, non scarica file già precedentemente scaricati. Non è strettamente necessaria, però potrebbe essere utile per evitare di scaricare doppioni e visto il numero di elevato di immagini sarebbe un bel risparmio.

Codice: Seleziona tutto

-A *.jpg
Specifica che gli unici file accettati devono avere estensione "*.jpg". L'opzione -A, così come il suo contrario -R, sono case sensitive (sensibili alle maiuscole), per renderli case insensitive (ignorare la differenza fra maiuscole e minuscole) bisogna usare l'opzione --ignore-case
Il mio blog su Ubuntu | Script per vedere canali RAI in diretta senza browser (discussione)
Quando devi inserire nei messaggi del codice usa il tag code, è il pulsante # sopra le emoticon: [code]inserisci il testo qui[/code]
as-far-as-i-know
Entusiasta Emergente
Entusiasta Emergente
Messaggi: 1096
Iscrizione: martedì 26 maggio 2009, 13:23

Re: wget suggerimenti?!?!?!?

Messaggio da as-far-as-i-know »

Ottima spiegazione, Elrond! Ne ho fatto copia e incolla sui miei 'appunti Unix'.
Devo comunque far notare che il tuo comando sul sito delle cartoline dà errore, precisando che mi trovo in questo momento su Windows ed ho attivato il relativo wget.exe

Codice: Seleziona tutto

C:\zzz>wget -e robots=off -nd --level=0 -nc -r -A *.jpg http://www.cartoline.it/pics/
--2010-11-26 08:27:46--  http://www.cartoline.it/pics/
Resolving www.cartoline.it... 213.92.76.149
Connecting to www.cartoline.it|213.92.76.149|:80... connected.
HTTP request sent, awaiting response... 403 Forbidden
2010-11-26 08:27:49 ERROR 403: Forbidden.

C:\zzz>wget -V
GNU Wget 1.11.4
Ciao, e buona giornata
Message to Canonical: I dislike Unity and am ready to migrate somewhere. From Ubuntu 6.10 to 11.04 with love, thank you!
Avatar utente
Elrond
Rampante Reduce
Rampante Reduce
Messaggi: 5018
Iscrizione: sabato 22 novembre 2008, 12:32
Contatti:

Re: wget suggerimenti?!?!?!?

Messaggio da Elrond »

as-far-as-i-know ha scritto: Ottima spiegazione, Elrond! Ne ho fatto copia e incolla sui miei 'appunti Unix'.
Devo comunque far notare che il tuo comando sul sito delle cartoline dà errore, precisando che mi trovo in questo momento su Windows ed ho attivato il relativo wget.exe

Codice: Seleziona tutto

C:\zzz>wget -e robots=off -nd --level=0 -nc -r -A *.jpg http://www.cartoline.it/pics/
--2010-11-26 08:27:46--  http://www.cartoline.it/pics/
Resolving www.cartoline.it... 213.92.76.149
Connecting to www.cartoline.it|213.92.76.149|:80... connected.
HTTP request sent, awaiting response... 403 Forbidden
2010-11-26 08:27:49 ERROR 403: Forbidden.

C:\zzz>wget -V
GNU Wget 1.11.4
Ciao, e buona giornata
Sembra che non riconosca l'opzione -e robots=off, infatti su Ubuntu ottengo:

Codice: Seleziona tutto

$ wget -nd --level=0 -nc -r -A *.jpg http://www.cartoline.it/pics/
--2010-11-26 12:52:23--  http://www.cartoline.it/pics/
Risoluzione di www.cartoline.it... 213.92.76.149
Connessione a www.cartoline.it|213.92.76.149|:80... connesso.
HTTP richiesta inviata, in attesa di risposta... 403 Forbidden
2010-11-26 12:52:23 ERRORE 403: Forbidden.
Il mio blog su Ubuntu | Script per vedere canali RAI in diretta senza browser (discussione)
Quando devi inserire nei messaggi del codice usa il tag code, è il pulsante # sopra le emoticon: [code]inserisci il testo qui[/code]
qwerty192
Prode Principiante
Messaggi: 80
Iscrizione: martedì 7 settembre 2010, 13:36

Re: wget suggerimenti?!?!?!?

Messaggio da qwerty192 »

Si davvero ottima risposta ORLAND :) :)
qwerty192
Prode Principiante
Messaggi: 80
Iscrizione: martedì 7 settembre 2010, 13:36

Re: wget suggerimenti?!?!?!?

Messaggio da qwerty192 »

ultima cosa se durante il down volessi bloccare tutto come si fa???  :)
Avatar utente
Elrond
Rampante Reduce
Rampante Reduce
Messaggi: 5018
Iscrizione: sabato 22 novembre 2008, 12:32
Contatti:

Re: wget suggerimenti?!?!?!?

Messaggio da Elrond »

qwerty192 ha scritto: ultima cosa se durante il down volessi bloccare tutto come si fa???  :)
CTRL + C per uccidere il processo. Se vuoi riprendere puoi usare lo stesso comando, grazie alla presenza dell'opzione -nc i file già presenti non saranno scaricati nuovamente
Il mio blog su Ubuntu | Script per vedere canali RAI in diretta senza browser (discussione)
Quando devi inserire nei messaggi del codice usa il tag code, è il pulsante # sopra le emoticon: [code]inserisci il testo qui[/code]
qwerty192
Prode Principiante
Messaggi: 80
Iscrizione: martedì 7 settembre 2010, 13:36

Re: wget suggerimenti?!?!?!?

Messaggio da qwerty192 »

Elrond ha scritto:
qwerty192 ha scritto: ultima cosa se durante il down volessi bloccare tutto come si fa???  :)
CTRL + C per uccidere il processo. Se vuoi riprendere puoi usare lo stesso comando, grazie alla presenza dell'opzione -nc i file già presenti non saranno scaricati nuovamente

grazie mille!!! :D :D
Scrivi risposta

Ritorna a “Applicazioni”

Chi c’è in linea

Visualizzano questa sezione: 0 utenti iscritti e 6 ospiti