Pagina 1 di 1

Estrarre il codice sorgente di un file e usare wget ?

Inviato: lunedì 6 febbraio 2017, 18:21
da Rosssiiii
Ciao :)

Voglio chiedervi se conoscete un programma o un addon su firefox per poter estrarre il codice sorgente di elementi come ad esempio video su youtube e scaricarli tramite il programma wget ?

Mi interessa molto la funzione di wget, mi pare di aver capito che se un video/file pesa 10gb e lo si vuole scaricare in più parte ciò è possibile ?

Re: Estrarre il codice sorgente di un file e usare wget ?

Inviato: mercoledì 8 febbraio 2017, 0:29
da fabrixx
Ciao

Solitamente si usa youtube-dl:
http://rg3.github.io/youtube-dl/

Ti puoi scaricare da terminale i tuoi video,già provato e funziona.

Re: Estrarre il codice sorgente di un file e usare wget ?

Inviato: mercoledì 8 febbraio 2017, 0:47
da thece
Rosssiiii [url=http://forum.ubuntu-it.org/viewtopic.php?p=4956707#p4956707][img]http://forum.ubuntu-it.org/images/icons/icona-cita.gif[/img][/url] ha scritto: Voglio chiedervi se conoscete un programma o un addon su firefox per poter estrarre il codice sorgente
Il codice di una pagina Web può essere facilmente ispezionato da qualunque browser Web: è un codice "umanamente comprensibile", non compilato. Su Firefox basta fare click con il tasto destro del mouse sulla pagina e selezionare la voce di menù View Page Source

Re: Estrarre il codice sorgente di un file e usare wget ?

Inviato: mercoledì 8 febbraio 2017, 21:57
da Rosssiiii
Domani lo provo :)
thece [url=http://forum.ubuntu-it.org/viewtopic.php?p=4956987#p4956987][img]http://forum.ubuntu-it.org/images/icons/icona-cita.gif[/img][/url] ha scritto:
Rosssiiii [url=http://forum.ubuntu-it.org/viewtopic.php?p=4956707#p4956707][img]http://forum.ubuntu-it.org/images/icons/icona-cita.gif[/img][/url] ha scritto: Voglio chiedervi se conoscete un programma o un addon su firefox per poter estrarre il codice sorgente
Il codice di una pagina Web può essere facilmente ispezionato da qualunque browser Web: è un codice "umanamente comprensibile", non compilato. Su Firefox basta fare click con il tasto destro del mouse sulla pagina e selezionare la voce di menù View Page Source
Si conosco il tasto per ispezionarlo,ad esempio io provavo a cercarlo con il tasto f12, solo che ad esempio su una pagina youtube ci sono molti video al lato oltre a quello visualizzato e poi comunque è molto piena di testo...
Comunque usando video download helper ho trovato il link:

Codice: Seleziona tutto

https://r6---sn-4g5e6nl7.googlevideo.com/videoplayback?requiressl=yes&mt=1486586729&ratebypass=yes&sparams=clen%2Cdur%2Cei%2Cgir%2Cid%2Cinitcwndbps%2Cip%2Cipbits%2Citag%2Clmt%2Cmime%2Cmm%2Cmn%2Cms%2Cmv%2Cpl%2Cratebypass%2Crequiressl%2Csource%2Cupn%2Cexpire&itag=18&lmt=1468791185114303&key=yt6&ip=79.22.152.53&mv=m&source=youtube&ms=au&mn=sn-4g5e6nl7&mm=31&dur=481.628&id=o-ABnXPDg7SX1cTVxAraW3t2Ma5BYJyz-i40L-aHNP0XDO&ipbits=0&clen=43925470&expire=1486608388&gir=yes&pl=17&ei=pIObWLq2B8ep1gLA0JDYCA&beids=%5B9452307%5D&upn=DnVYQhO0SKs&signature=02470B41B70F8EE2D91308190E0ABAC15D3C4C2B.9CA85016CE8AEDB99150A84F83B6ED1431DE30BD&mime=video%2Fmp4&initcwndbps=411250
inserendolo nel terminale e senza neanche premere il tasto invio è uscito:

Codice: Seleziona tutto

roberto@Roberto-Ubuntu-Mate:~$ wget roberto@Roberto-Ubuntu-Mate:~$ wget https://cs542405.vk.me/6/u66100378/videos/294502e57f.720.mp4?extra=WLxccxGkMfSQzWbNy7yKSqH0u8x5qqVKXyWX8A3pOZv0BT7mjzQN-3-bSlVu3g3Om8mpTP5g-zyGz17I66frmCkADiJK6SgWyPHTW2-n4AGh0hH4KX5VXKYXmIBxPPOkmkT4tmq6TecMfSQzWbNy7yKSqH0u8x5qqVKXyWX8A3pOZv0BT7mjzQN-3-bS--2017-02-08 21:45:10--  https://cs542405.vk.me/6/u66100378/videos/294502e57f.720.mp4?extra=WLxccxGkMfSQzWbNy7yKSqH0u8x5qqVKXyWX8A3pOZv0BT7mjzQN-3-bSlVu3g3Om8mpTP5g-zyGz17I66frmCkADiJK6SgWyPHTW2-n4AGh0hH4KX5VXKYXmIBxPPOkmkT4tmq6Tec
--2017-02-08 21:48:38--  ftp://roberto@roberto-ubuntu-mate/~$
           => "~$"
Risoluzione di roberto-ubuntu-mate (roberto-ubuntu-mate)... 127.0.1.1
Connessione a roberto-ubuntu-mate (roberto-ubuntu-mate)|127.0.1.1|:21... non riuscito: Connessione rifiutata.
--2017-02-08 21:48:38--  http://wget/
Risoluzione di wget (wget)... non riuscito: Nome o servizio sconosciuto.
wget: impossibile risolvere l'indirizzo dell'host "wget"
--2017-02-08 21:48:38--  https://cs542405.vk.me/6/u66100378/videos/294502e57f.720.mp4?extra=WLxccxGkMfSQzWbNy7yKSqH0u8x5qqVKXyWX8A3pOZv0BT7mjzQN-3-bSlVu3g3Om8mpTP5g-zyGz17I66frmCkADiJK6SgWyPHTW2-n4AGh0hH4KX5VXKYXmIBxPPOkmkT4tmq6TecMfSQzWbNy7yKSqH0u8x5qqVKXyWX8A3pOZv0BT7mjzQN-3-bS--2017-02-08
Risoluzione di cs542405.vk.me (cs542405.vk.me)... 95.213.4.36, 2a00:bdc0:4:2a:2:0:542:405
Connessione a cs542405.vk.me (cs542405.vk.me)|95.213.4.36|:443... connesso.
Richiesta HTTP inviata, in attesa di risposta... 200 OK
Lunghezza: 1915758573 (1,8G) [video/mp4]
Salvataggio in: "294502e57f.720.mp4?extra=WLxccxGkMfSQzWbNy7yKSqH0u8x5qqVKXyWX8A3pOZv0BT7mjzQN-3-bSlVu3g3Om8mpTP5g-zyGz17I66frmCkADiJK6SgWyPHTW2-n4AGh0hH4KX5VXKYXmIBxPPOkmkT4tmq6TecMfSQzWbNy7yKSqH0u8x5qqVKXyWX8A3pOZv0BT7mjzQN-3-bS--2017-02-08.2"

502e57f.720.mp4?ext   0%[                    ]   1,90M   671KB/s               Errore di segmentazione (core dump creato)
roberto@Roberto-Ubuntu-Mate:~$ Risoluzione di cs542405.vk.me (cs542405.vk.me)... 95.213.4.36, 2a00:bdc0:4:2a:2:0:542:405
bash: errore di sintassi vicino al token non atteso "("
roberto@Roberto-Ubuntu-Mate:~$ Connessione a cs542405.vk.me (cs542405.vk.me)|95.213.4.36|:443... connesso.
bash: errore di sintassi vicino al token non atteso "("
roberto@Roberto-Ubuntu-Mate:~$ Richiesta HTTP inviata, in attesa di risposta... 200 OK
Richiesta: comando non trovato
roberto@Roberto-Ubuntu-Mate:~$ Lunghezza: 1915758573 (1,8G) [video/mp4]
bash: errore di sintassi vicino al token non atteso "("
roberto@Roberto-Ubuntu-Mate:~$ Salvataggio in: "294502e57f.720.mp4?extra=WLxccxGkMfSQzWbNy7yKSqH0u8x5qqVKXyWX8A3pOZv0BT7mjzQN-3-bSlVu3g3Om8mpTP5g-zyGz17I66frmCkADiJK6SgWyPHTW2-n4AGh0hH4KX5VXKYXmIBxPPOkmkT4tmq6Tec"
Salvataggio: comando non trovato
roberto@Roberto-Ubuntu-Mate:~$ 
roberto@Roberto-Ubuntu-Mate:~$          294502e57f.720.mp4?extra=WLxccxGkMfSQzWbNy7   0%[                                                                                                                      ]   2,62M   697KB/s    prev 48m 4sErrore di segmentazione (core dump creato)
bash: errore di sintassi vicino al token non atteso "("
In poi da quest'altro sito ho estratto questo source code del video sempre con video helper:

Codice: Seleziona tutto

https://cs509307.vk.me/8/u30699317/videos/c6b282da69.1080.mp4?extra=3umENZQ_jdcKT3gn4i5u_An-Hfu5M7V2vRAYshTt7mlHbo62zGRvwO97Vun3SVoKI7Rn4QmiT1A_vjwkyFr34ptD_9j7EaLGAocqkNmjMErqGJRNshNImtEDsXGnS1LBoJdX8BFS__42dw
inizialmente inizia a scaricare ma poi si pianta.

Codice: Seleziona tutto

roberto@Roberto-Ubuntu-Mate:~$ wget https://cs509307.vk.me/8/u30699317/videos/c6b282da69.1080.mp4?extra=3umENZQ_jdcKT3gn4i5u_An-Hfu5M7V2vRAYshTt7mlHbo62zGRvwO97Vun3SVoKI7Rn4QmiT1A_vjwkyFr34ptD_9j7EaLGAocqkNmjMErqGJRNshNImtEDsXGnS1LBoJdX8BFS__42dw
--2017-02-08 21:56:01--  https://cs509307.vk.me/8/u30699317/videos/c6b282da69.1080.mp4?extra=3umENZQ_jdcKT3gn4i5u_An-Hfu5M7V2vRAYshTt7mlHbo62zGRvwO97Vun3SVoKI7Rn4QmiT1A_vjwkyFr34ptD_9j7EaLGAocqkNmjMErqGJRNshNImtEDsXGnS1LBoJdX8BFS__42dw
Risoluzione di cs509307.vk.me (cs509307.vk.me)... 87.240.163.111, 2a00:bdc0:4:8:2:0:509:307
Connessione a cs509307.vk.me (cs509307.vk.me)|87.240.163.111|:443... connesso.
Richiesta HTTP inviata, in attesa di risposta... 200 OK
Lunghezza: 2353332908 (2,2G) [video/mp4]
Salvataggio in: "c6b282da69.1080.mp4?extra=3umENZQ_jdcKT3gn4i5u_An-Hfu5M7V2vRAYshTt7mlHbo62zGRvwO97Vun3SVoKI7Rn4QmiT1A_vjwkyFr34ptD_9j7EaLGAocqkNmjMErqGJRNshNImtEDsXGnS1LBoJdX8BFS__42dw"

282da69.1080.mp4?ex   0%[                    ]   1,21M   437KB/s               Errore di segmentazione (core dump creato)
roberto@Roberto-Ubuntu-Mate:~$ 

Poi anche provando a scaricare questo file iso a caso è uscito lo stesso errore :

Codice: Seleziona tutto

roberto@Roberto-Ubuntu-Mate:~$ wget http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
--2017-02-03 11:04:51--  http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
Risoluzione di cdimage.ubuntu.com (cdimage.ubuntu.com)... 91.189.88.165, 2001:67c:1360:8001::23
Connessione a cdimage.ubuntu.com (cdimage.ubuntu.com)|91.189.88.165|:80... connesso.
Richiesta HTTP inviata, in attesa di risposta... 200 OK
Lunghezza: 941621248 (898M) [application/x-iso9660-image]
Salvataggio in: "lubuntu-16.10-desktop-amd64.iso.1"

ntu-16.10-desktop-a   0%[                    ]   2,17M   779KB/s               Errore di segmentazione (core dump creato)
roberto@Roberto-Ubuntu-Mate:~$ 

Re: Estrarre il codice sorgente di un file e usare wget ?

Inviato: mercoledì 8 febbraio 2017, 22:37
da steff
Vorrei ricordare che sulla grande maggioranza dei siti le condizioni di uso vietano espressivamente ogni download del materiale video, quindi queste tecniche non possono essere argomento di discussioni qui sul forum.
http://forum.ubuntu-it.org/rules.php#rule4012

Detto questo: wget con il file iso funziona come dovrebbe

Codice: Seleziona tutto

 cd /tmp && wget http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
--2017-02-08 22:35:21--  http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
Risoluzione di cdimage.ubuntu.com (cdimage.ubuntu.com)... 91.189.88.165, 2001:67c:1360:8001::24
Connessione a cdimage.ubuntu.com (cdimage.ubuntu.com)|91.189.88.165|:80... connesso.
Richiesta HTTP inviata, in attesa di risposta... 200 OK
Lunghezza: 941621248 (898M) [application/x-iso9660-image]
Salvataggio in: "lubuntu-16.10-desktop-amd64.iso"

lubuntu-16.10-desktop-amd64.is   5%[=>                                                ]  48,97M   427KB/s    eta 42m 15s^
non so perché ti fa il core dump.

Re: Estrarre il codice sorgente di un file e usare wget ?

Inviato: giovedì 9 febbraio 2017, 15:03
da Rosssiiii
steff [url=http://forum.ubuntu-it.org/viewtopic.php?p=4957295#p4957295][img]http://forum.ubuntu-it.org/images/icons/icona-cita.gif[/img][/url] ha scritto:Vorrei ricordare che sulla grande maggioranza dei siti le condizioni di uso vietano espressivamente ogni download del materiale video, quindi queste tecniche non possono essere argomento di discussioni qui sul forum.
http://forum.ubuntu-it.org/rules.php#rule4012

Detto questo: wget con il file iso funziona come dovrebbe

Codice: Seleziona tutto

 cd /tmp && wget http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
--2017-02-08 22:35:21--  http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
Risoluzione di cdimage.ubuntu.com (cdimage.ubuntu.com)... 91.189.88.165, 2001:67c:1360:8001::24
Connessione a cdimage.ubuntu.com (cdimage.ubuntu.com)|91.189.88.165|:80... connesso.
Richiesta HTTP inviata, in attesa di risposta... 200 OK
Lunghezza: 941621248 (898M) [application/x-iso9660-image]
Salvataggio in: "lubuntu-16.10-desktop-amd64.iso"

lubuntu-16.10-desktop-amd64.is   5%[=>                                                ]  48,97M   427KB/s    eta 42m 15s^
non so perché ti fa il core dump.
Perdonami per la questione dei video, credevo che essendo presente l'addon su firefox fosse ammesso !

Riguardo al problema di core dump, oggi ho riprovato:

Codice: Seleziona tutto

roberto@Roberto-Ubuntu-Mate:~$ wget -P /home/roberto/Scrivania/ http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
--2017-02-09 14:38:34--  http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
Risoluzione di cdimage.ubuntu.com (cdimage.ubuntu.com)... 91.189.88.39, 2001:67c:1360:8001::24
Connessione a cdimage.ubuntu.com (cdimage.ubuntu.com)|91.189.88.39|:80... connesso.
Richiesta HTTP inviata, in attesa di risposta... 200 OK
Lunghezza: 941621248 (898M) [application/x-iso9660-image]
Salvataggio in: "/home/roberto/Scrivania/lubuntu-16.10-desktop-amd64.iso"

ntu-16.10-desktop-a   0%[                    ]   2,12M   726KB/s               Errore di segmentazione (core dump creato)
roberto@Roberto-Ubuntu-Mate:~$ wget -c -P /home/roberto/Scrivania/ http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
--2017-02-09 14:38:48--  http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
Risoluzione di cdimage.ubuntu.com (cdimage.ubuntu.com)... 91.189.88.39, 2001:67c:1360:8001::24
Connessione a cdimage.ubuntu.com (cdimage.ubuntu.com)|91.189.88.39|:80... connesso.
Richiesta HTTP inviata, in attesa di risposta... 206 Partial Content
Lunghezza: 941621248 (898M), 939228234 (896M) rimanenti [application/x-iso9660-image]
Salvataggio in: "/home/roberto/Scrivania/lubuntu-16.10-desktop-amd64.iso"

ntu-16.10-desktop-a   0%[                    ]   4,54M   792KB/s               Errore di segmentazione (core dump creato)
roberto@Roberto-Ubuntu-Mate:~$ wget -c -P /home/roberto/Scrivania/ http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
--2017-02-09 14:38:55--  http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
Risoluzione di cdimage.ubuntu.com (cdimage.ubuntu.com)... 91.189.88.39, 2001:67c:1360:8001::24
Connessione a cdimage.ubuntu.com (cdimage.ubuntu.com)|91.189.88.39|:80... connesso.
Richiesta HTTP inviata, in attesa di risposta... 206 Partial Content
Lunghezza: 941621248 (898M), 936686771 (893M) rimanenti [application/x-iso9660-image]
Salvataggio in: "/home/roberto/Scrivania/lubuntu-16.10-desktop-amd64.iso"

16.10-desktop-amd64   0%[                    ]   7,17M   697KB/s    prev 24m 4sErrore di segmentazione (core dump creato)
roberto@Roberto-Ubuntu-Mate:~$ 
cioè se metto -c continua a scaricare,però boh !

Re: Estrarre il codice sorgente di un file e usare wget ?

Inviato: giovedì 9 febbraio 2017, 15:31
da steff
Da qualche parte avevo letto di un bug di wget su Ubuntu.
Se provi con

Codice: Seleziona tutto

 LC_ALL=C http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
?

Re: Estrarre il codice sorgente di un file e usare wget ?

Inviato: giovedì 9 febbraio 2017, 18:14
da Rosssiiii
steff [url=http://forum.ubuntu-it.org/viewtopic.php?p=4957445#p4957445][img]http://forum.ubuntu-it.org/images/icons/icona-cita.gif[/img][/url] ha scritto:Da qualche parte avevo letto di un bug di wget su Ubuntu.
Se provi con

Codice: Seleziona tutto

 LC_ALL=C http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
?

Codice: Seleziona tutto

ubuntu-mate@ubuntu-mate:~$ wget LC_ALL=C http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
--2017-02-09 17:11:01--  http://lc_all=c/
Risoluzione di lc_all=c (lc_all=c)... non riuscito: Nome o servizio sconosciuto.
wget: impossibile risolvere l'indirizzo dell'host "lc_all=c"
--2017-02-09 17:11:01--  http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
Risoluzione di cdimage.ubuntu.com (cdimage.ubuntu.com)... 91.189.88.165, 2001:67c:1360:8001::24
Connessione a cdimage.ubuntu.com (cdimage.ubuntu.com)|91.189.88.165|:80... connesso.
Richiesta HTTP inviata, in attesa di risposta... 200 OK
Lunghezza: 941621248 (898M) [application/x-iso9660-image]
Salvataggio in: "lubuntu-16.10-desktop-amd64.iso.1"

16.10-desktop-amd64   0%[                    ]   1,10M   318KB/s    prev 55m 5sErrore di segmentazione (core dump creato)
ubuntu-mate@ubuntu-mate:~$ 
no purtroppo non cambia nulla, ora sto provando una live 64bit di ubuntu mate e lo stesso problema si è presentato.

poi mi è uscito un messaggio di ubuntu con la scritta "wget si è fermata inaspettatamente" !

Dovrei provare su un'altro pc con debian poi non resta che trovare un programma alternativo...tu ne conosci qualcuno ?

Potrei provare a usare una nuova

Re: Estrarre il codice sorgente di un file e usare wget ?

Inviato: giovedì 9 febbraio 2017, 18:30
da steff
Ho dimenticato inserire wget nel comando scusa, deve essere così

Codice: Seleziona tutto

 LC_ALL=C wget  http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
Se ti funziona con -c usalo così.

Re: Estrarre il codice sorgente di un file e usare wget ?

Inviato: sabato 11 febbraio 2017, 18:41
da Rosssiiii
steff [url=http://forum.ubuntu-it.org/viewtopic.php?p=4957528#p4957528][img]http://forum.ubuntu-it.org/images/icons/icona-cita.gif[/img][/url] ha scritto:Ho dimenticato inserire wget nel comando scusa, deve essere così

Codice: Seleziona tutto

 LC_ALL=C wget  http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
Se ti funziona con -c usalo così.
Ciao :)

Praticamente si tu non avevi messo wget ma io l'avevo comunque messo, ad ogni modo non credevo ci fosse differenza tra scrivere
wget LC_ALL=C URL
oppure
LC_ALL=C wget URL

comunque nel secondo caso ho provato stasera e va bene,lo scarica,altrimenti esce la scritta core dump !

Ma cosa significa quel LC_ALL=C ? avevo provato a vedere varie opzioni premendo wget -h ma quella non c'è...quando ci si trova nel manuale di un programma usando il terminale c'è un modo per cercare un termine ?
---------------
Comunque ho provato anche usando una live di debian 8 jessy e li quando mettevo wget e il link partiva in automatico il download,forse su ubuntu c'è un bug come avevi detto riguardo al funzionamento di wget :o

Re: Estrarre il codice sorgente di un file e usare wget ?

Inviato: sabato 11 febbraio 2017, 22:00
da steff
Non è lo stesso,l'ordine conta e come...

LC_ALL=C e deve stare prima, altrimenti wget lo prende come argomento.

Se stai attento vedi che risponde in inglese non più in italiano.

Re: Estrarre il codice sorgente di un file e usare wget ?

Inviato: domenica 12 febbraio 2017, 10:40
da Rosssiiii
steff [url=http://forum.ubuntu-it.org/viewtopic.php?p=4958063#p4958063][img]http://forum.ubuntu-it.org/images/icons/icona-cita.gif[/img][/url] ha scritto:Non è lo stesso,l'ordine conta e come...

LC_ALL=C e deve stare prima, altrimenti wget lo prende come argomento.

Se stai attento vedi che risponde in inglese non più in italiano.
Quindi risponde in inglese perchè: quel comando LC_ALL=C non ha a che vedere con il programma wget e fa si che "It forces applications to use the default language for output, and forces sorting to be bytewise. "
Quindi in questo modo si va ad ovviare al bug di wget su ubuntu.

Grazie,per ora proverò a scaricare cosi :)