WGET: scaricare intero sito, no solo index
WGET: scaricare intero sito, no solo index
Ciao.
Sto cercando di scaricare per intero questo sito
http://web.archive.org/web/200710020822 ... ~brenfrow/
ma wget mi preleva solo l'index prinicpale e non vuole saperne di andare oltre la prima pagina.
Premetto che è la prima volta che lo uso, ma ho provato varie opzioni tra cui -r -k -F -l ... però nada, non cambia nulla.
Dove sbaglio?
Sto cercando di scaricare per intero questo sito
http://web.archive.org/web/200710020822 ... ~brenfrow/
ma wget mi preleva solo l'index prinicpale e non vuole saperne di andare oltre la prima pagina.
Premetto che è la prima volta che lo uso, ma ho provato varie opzioni tra cui -r -k -F -l ... però nada, non cambia nulla.
Dove sbaglio?
Re: WGET: scaricare intero sito, no solo index
Come scaricare interi siti è una domanda posta decine di volte su questo forum. Esiste un programma apposito (presente nei repo di Ubuntu), si chiama httrack (ma personalmente non l'ho mai usato), però non so se vada bene anche su web archive
Il mio blog su Ubuntu | Script per vedere canali RAI in diretta senza browser (discussione)
Quando devi inserire nei messaggi del codice usa il tag code, è il pulsante # sopra le emoticon: [code]inserisci il testo qui[/code]
Quando devi inserire nei messaggi del codice usa il tag code, è il pulsante # sopra le emoticon: [code]inserisci il testo qui[/code]
Re: WGET: scaricare intero sito, no solo index
prova così wget --mirror --no-parent http://url
Re: WGET: scaricare intero sito, no solo index
A suo tempo con httrack su windows non mi ero trovato bene, e pensavo si facesse anche con wget.
Niente, anche con -mirror --no-parent mi scarica solo l'index principale
Edit:
Provato anche con Httrack... e continua a non piacermi. Macina a lungo, mi crea tutti i file .htm ma quando vado ad aprirli sono pagine con errore 404
Niente, anche con -mirror --no-parent mi scarica solo l'index principale
Edit:
Provato anche con Httrack... e continua a non piacermi. Macina a lungo, mi crea tutti i file .htm ma quando vado ad aprirli sono pagine con errore 404
Ultima modifica di Zion il giovedì 26 agosto 2010, 16:25, modificato 1 volta in totale.
Re: WGET: scaricare intero sito, no solo index
Prova a vedere qui:
http://www.bitportal.it/tipslinux/download_siti.html
http://www.bitportal.it/tipslinux/download_siti.html
Ultima modifica di ErSandro il giovedì 26 agosto 2010, 17:00, modificato 1 volta in totale.
Il mio blog: http://www.truffadimatrix.blogspot.com
Re: WGET: scaricare intero sito, no solo index
Avevo già provato con -r, e mi scarica solo l'index principale.
Però ho provato con un altro sito e wget fa il suo dovere... deve essere questo sito (http://web.archive.org/web/200710020822 ... ~brenfrow/) che da problemi, infatti gli htm salvati con Httrack mi rimandano a http://home.flash.net/~brenfrow/ che è un sito non più attivo.
Eppure da web.archive è navigabile
Però ho provato con un altro sito e wget fa il suo dovere... deve essere questo sito (http://web.archive.org/web/200710020822 ... ~brenfrow/) che da problemi, infatti gli htm salvati con Httrack mi rimandano a http://home.flash.net/~brenfrow/ che è un sito non più attivo.
Eppure da web.archive è navigabile
Ultima modifica di Zion il giovedì 26 agosto 2010, 17:09, modificato 1 volta in totale.
-
Galess
Re: WGET: scaricare intero sito, no solo index
usa :
con quei parametri scarica l'intero sito e converti i link per renderlo navigabile in locale
Codice: Seleziona tutto
wget -mk http://www.sitodascaricare.orgRe: WGET: scaricare intero sito, no solo index
[eliminato]
Ultima modifica di niente0 il venerdì 1 ottobre 2010, 23:01, modificato 1 volta in totale.
Chi c’è in linea
Visualizzano questa sezione: eugenix, Google [Bot] e 9 ospiti


