WGET: scaricare intero sito, no solo index

Installazione, configurazione e uso di programmi e strumenti.
Zion
Prode Principiante
Messaggi: 54
Iscrizione: domenica 8 ottobre 2006, 18:08

WGET: scaricare intero sito, no solo index

Messaggio da Zion »

Ciao.
Sto cercando di scaricare per intero questo sito
http://web.archive.org/web/200710020822 ... ~brenfrow/
ma wget mi preleva solo l'index prinicpale e non vuole saperne di andare oltre la prima pagina.
Premetto che è la prima volta che lo uso, ma ho provato varie opzioni tra cui  -r -k -F -l ... però nada, non cambia nulla.
Dove sbaglio?
Avatar utente
Elrond
Rampante Reduce
Rampante Reduce
Messaggi: 5018
Iscrizione: sabato 22 novembre 2008, 12:32
Contatti:

Re: WGET: scaricare intero sito, no solo index

Messaggio da Elrond »

Come scaricare interi siti è una domanda posta decine di volte su questo forum. Esiste un programma apposito (presente nei repo di Ubuntu), si chiama httrack (ma personalmente non l'ho mai usato), però non so se vada bene anche su web archive
Il mio blog su Ubuntu | Script per vedere canali RAI in diretta senza browser (discussione)
Quando devi inserire nei messaggi del codice usa il tag code, è il pulsante # sopra le emoticon: [code]inserisci il testo qui[/code]
Avatar utente
nicotano
Gruppo Promozione
Gruppo Promozione
Messaggi: 3320
Iscrizione: mercoledì 14 dicembre 2005, 19:50

Re: WGET: scaricare intero sito, no solo index

Messaggio da nicotano »

prova così  wget --mirror --no-parent http://url
Zion
Prode Principiante
Messaggi: 54
Iscrizione: domenica 8 ottobre 2006, 18:08

Re: WGET: scaricare intero sito, no solo index

Messaggio da Zion »

A suo tempo con httrack su windows non mi ero trovato bene, e pensavo si facesse anche con wget.

Niente, anche con -mirror --no-parent mi scarica solo l'index principale


Edit:
Provato anche con Httrack... e continua a non piacermi. Macina a lungo, mi crea tutti i file .htm ma quando vado ad aprirli sono pagine con errore 404
Ultima modifica di Zion il giovedì 26 agosto 2010, 16:25, modificato 1 volta in totale.
Avatar utente
ErSandro
Scoppiettante Seguace
Scoppiettante Seguace
Messaggi: 553
Iscrizione: venerdì 3 aprile 2009, 12:48
Contatti:

Re: WGET: scaricare intero sito, no solo index

Messaggio da ErSandro »

Ultima modifica di ErSandro il giovedì 26 agosto 2010, 17:00, modificato 1 volta in totale.
Zion
Prode Principiante
Messaggi: 54
Iscrizione: domenica 8 ottobre 2006, 18:08

Re: WGET: scaricare intero sito, no solo index

Messaggio da Zion »

Avevo già provato con -r, e mi scarica solo l'index principale.
Però ho provato con un altro sito e wget fa il suo dovere... deve essere questo sito (http://web.archive.org/web/200710020822 ... ~brenfrow/) che da problemi, infatti gli htm salvati con Httrack mi rimandano a http://home.flash.net/~brenfrow/ che è un sito non più attivo.
Eppure da web.archive è navigabile
Ultima modifica di Zion il giovedì 26 agosto 2010, 17:09, modificato 1 volta in totale.
Galess

Re: WGET: scaricare intero sito, no solo index

Messaggio da Galess »

usa :

Codice: Seleziona tutto

wget -mk http://www.sitodascaricare.org
con quei parametri scarica l'intero sito e converti i link per renderlo navigabile in locale
niente0
Prode Principiante
Messaggi: 2
Iscrizione: lunedì 18 gennaio 2010, 13:01

Re: WGET: scaricare intero sito, no solo index

Messaggio da niente0 »

[eliminato]
Ultima modifica di niente0 il venerdì 1 ottobre 2010, 23:01, modificato 1 volta in totale.
Scrivi risposta

Ritorna a “Applicazioni”

Chi c’è in linea

Visualizzano questa sezione: eugenix, Google [Bot] e 9 ospiti