Pagina 1 di 1
Estrarre il codice sorgente di un file e usare wget ?
Inviato: lunedì 6 febbraio 2017, 18:21
da Rosssiiii
Ciao
Voglio chiedervi se conoscete un programma o un addon su firefox per poter estrarre il codice sorgente di elementi come ad esempio video su youtube e scaricarli tramite il programma wget ?
Mi interessa molto la funzione di wget, mi pare di aver capito che se un video/file pesa 10gb e lo si vuole scaricare in più parte ciò è possibile ?
Re: Estrarre il codice sorgente di un file e usare wget ?
Inviato: mercoledì 8 febbraio 2017, 0:29
da fabrixx
Ciao
Solitamente si usa youtube-dl:
http://rg3.github.io/youtube-dl/
Ti puoi scaricare da terminale i tuoi video,già provato e funziona.
Re: Estrarre il codice sorgente di un file e usare wget ?
Inviato: mercoledì 8 febbraio 2017, 0:47
da thece
Il codice di una pagina Web può essere facilmente ispezionato da qualunque browser Web: è un codice "umanamente comprensibile", non compilato. Su Firefox basta fare click con il tasto destro del mouse sulla pagina e selezionare la voce di menù View Page Source
Re: Estrarre il codice sorgente di un file e usare wget ?
Inviato: mercoledì 8 febbraio 2017, 21:57
da Rosssiiii
Domani lo provo
Si conosco il tasto per ispezionarlo,ad esempio io provavo a cercarlo con il tasto f12, solo che ad esempio su una pagina youtube ci sono molti video al lato oltre a quello visualizzato e poi comunque è molto piena di testo...
Comunque usando video download helper ho trovato il link:
Codice: Seleziona tutto
https://r6---sn-4g5e6nl7.googlevideo.com/videoplayback?requiressl=yes&mt=1486586729&ratebypass=yes&sparams=clen%2Cdur%2Cei%2Cgir%2Cid%2Cinitcwndbps%2Cip%2Cipbits%2Citag%2Clmt%2Cmime%2Cmm%2Cmn%2Cms%2Cmv%2Cpl%2Cratebypass%2Crequiressl%2Csource%2Cupn%2Cexpire&itag=18&lmt=1468791185114303&key=yt6&ip=79.22.152.53&mv=m&source=youtube&ms=au&mn=sn-4g5e6nl7&mm=31&dur=481.628&id=o-ABnXPDg7SX1cTVxAraW3t2Ma5BYJyz-i40L-aHNP0XDO&ipbits=0&clen=43925470&expire=1486608388&gir=yes&pl=17&ei=pIObWLq2B8ep1gLA0JDYCA&beids=%5B9452307%5D&upn=DnVYQhO0SKs&signature=02470B41B70F8EE2D91308190E0ABAC15D3C4C2B.9CA85016CE8AEDB99150A84F83B6ED1431DE30BD&mime=video%2Fmp4&initcwndbps=411250
inserendolo nel terminale e senza neanche premere il tasto invio è uscito:
Codice: Seleziona tutto
roberto@Roberto-Ubuntu-Mate:~$ wget roberto@Roberto-Ubuntu-Mate:~$ wget https://cs542405.vk.me/6/u66100378/videos/294502e57f.720.mp4?extra=WLxccxGkMfSQzWbNy7yKSqH0u8x5qqVKXyWX8A3pOZv0BT7mjzQN-3-bSlVu3g3Om8mpTP5g-zyGz17I66frmCkADiJK6SgWyPHTW2-n4AGh0hH4KX5VXKYXmIBxPPOkmkT4tmq6TecMfSQzWbNy7yKSqH0u8x5qqVKXyWX8A3pOZv0BT7mjzQN-3-bS--2017-02-08 21:45:10-- https://cs542405.vk.me/6/u66100378/videos/294502e57f.720.mp4?extra=WLxccxGkMfSQzWbNy7yKSqH0u8x5qqVKXyWX8A3pOZv0BT7mjzQN-3-bSlVu3g3Om8mpTP5g-zyGz17I66frmCkADiJK6SgWyPHTW2-n4AGh0hH4KX5VXKYXmIBxPPOkmkT4tmq6Tec
--2017-02-08 21:48:38-- ftp://roberto@roberto-ubuntu-mate/~$
=> "~$"
Risoluzione di roberto-ubuntu-mate (roberto-ubuntu-mate)... 127.0.1.1
Connessione a roberto-ubuntu-mate (roberto-ubuntu-mate)|127.0.1.1|:21... non riuscito: Connessione rifiutata.
--2017-02-08 21:48:38-- http://wget/
Risoluzione di wget (wget)... non riuscito: Nome o servizio sconosciuto.
wget: impossibile risolvere l'indirizzo dell'host "wget"
--2017-02-08 21:48:38-- https://cs542405.vk.me/6/u66100378/videos/294502e57f.720.mp4?extra=WLxccxGkMfSQzWbNy7yKSqH0u8x5qqVKXyWX8A3pOZv0BT7mjzQN-3-bSlVu3g3Om8mpTP5g-zyGz17I66frmCkADiJK6SgWyPHTW2-n4AGh0hH4KX5VXKYXmIBxPPOkmkT4tmq6TecMfSQzWbNy7yKSqH0u8x5qqVKXyWX8A3pOZv0BT7mjzQN-3-bS--2017-02-08
Risoluzione di cs542405.vk.me (cs542405.vk.me)... 95.213.4.36, 2a00:bdc0:4:2a:2:0:542:405
Connessione a cs542405.vk.me (cs542405.vk.me)|95.213.4.36|:443... connesso.
Richiesta HTTP inviata, in attesa di risposta... 200 OK
Lunghezza: 1915758573 (1,8G) [video/mp4]
Salvataggio in: "294502e57f.720.mp4?extra=WLxccxGkMfSQzWbNy7yKSqH0u8x5qqVKXyWX8A3pOZv0BT7mjzQN-3-bSlVu3g3Om8mpTP5g-zyGz17I66frmCkADiJK6SgWyPHTW2-n4AGh0hH4KX5VXKYXmIBxPPOkmkT4tmq6TecMfSQzWbNy7yKSqH0u8x5qqVKXyWX8A3pOZv0BT7mjzQN-3-bS--2017-02-08.2"
502e57f.720.mp4?ext 0%[ ] 1,90M 671KB/s Errore di segmentazione (core dump creato)
roberto@Roberto-Ubuntu-Mate:~$ Risoluzione di cs542405.vk.me (cs542405.vk.me)... 95.213.4.36, 2a00:bdc0:4:2a:2:0:542:405
bash: errore di sintassi vicino al token non atteso "("
roberto@Roberto-Ubuntu-Mate:~$ Connessione a cs542405.vk.me (cs542405.vk.me)|95.213.4.36|:443... connesso.
bash: errore di sintassi vicino al token non atteso "("
roberto@Roberto-Ubuntu-Mate:~$ Richiesta HTTP inviata, in attesa di risposta... 200 OK
Richiesta: comando non trovato
roberto@Roberto-Ubuntu-Mate:~$ Lunghezza: 1915758573 (1,8G) [video/mp4]
bash: errore di sintassi vicino al token non atteso "("
roberto@Roberto-Ubuntu-Mate:~$ Salvataggio in: "294502e57f.720.mp4?extra=WLxccxGkMfSQzWbNy7yKSqH0u8x5qqVKXyWX8A3pOZv0BT7mjzQN-3-bSlVu3g3Om8mpTP5g-zyGz17I66frmCkADiJK6SgWyPHTW2-n4AGh0hH4KX5VXKYXmIBxPPOkmkT4tmq6Tec"
Salvataggio: comando non trovato
roberto@Roberto-Ubuntu-Mate:~$
roberto@Roberto-Ubuntu-Mate:~$ 294502e57f.720.mp4?extra=WLxccxGkMfSQzWbNy7 0%[ ] 2,62M 697KB/s prev 48m 4sErrore di segmentazione (core dump creato)
bash: errore di sintassi vicino al token non atteso "("
In poi da quest'altro sito ho estratto questo source code del video sempre con video helper:
Codice: Seleziona tutto
https://cs509307.vk.me/8/u30699317/videos/c6b282da69.1080.mp4?extra=3umENZQ_jdcKT3gn4i5u_An-Hfu5M7V2vRAYshTt7mlHbo62zGRvwO97Vun3SVoKI7Rn4QmiT1A_vjwkyFr34ptD_9j7EaLGAocqkNmjMErqGJRNshNImtEDsXGnS1LBoJdX8BFS__42dw
inizialmente inizia a scaricare ma poi si pianta.
Codice: Seleziona tutto
roberto@Roberto-Ubuntu-Mate:~$ wget https://cs509307.vk.me/8/u30699317/videos/c6b282da69.1080.mp4?extra=3umENZQ_jdcKT3gn4i5u_An-Hfu5M7V2vRAYshTt7mlHbo62zGRvwO97Vun3SVoKI7Rn4QmiT1A_vjwkyFr34ptD_9j7EaLGAocqkNmjMErqGJRNshNImtEDsXGnS1LBoJdX8BFS__42dw
--2017-02-08 21:56:01-- https://cs509307.vk.me/8/u30699317/videos/c6b282da69.1080.mp4?extra=3umENZQ_jdcKT3gn4i5u_An-Hfu5M7V2vRAYshTt7mlHbo62zGRvwO97Vun3SVoKI7Rn4QmiT1A_vjwkyFr34ptD_9j7EaLGAocqkNmjMErqGJRNshNImtEDsXGnS1LBoJdX8BFS__42dw
Risoluzione di cs509307.vk.me (cs509307.vk.me)... 87.240.163.111, 2a00:bdc0:4:8:2:0:509:307
Connessione a cs509307.vk.me (cs509307.vk.me)|87.240.163.111|:443... connesso.
Richiesta HTTP inviata, in attesa di risposta... 200 OK
Lunghezza: 2353332908 (2,2G) [video/mp4]
Salvataggio in: "c6b282da69.1080.mp4?extra=3umENZQ_jdcKT3gn4i5u_An-Hfu5M7V2vRAYshTt7mlHbo62zGRvwO97Vun3SVoKI7Rn4QmiT1A_vjwkyFr34ptD_9j7EaLGAocqkNmjMErqGJRNshNImtEDsXGnS1LBoJdX8BFS__42dw"
282da69.1080.mp4?ex 0%[ ] 1,21M 437KB/s Errore di segmentazione (core dump creato)
roberto@Roberto-Ubuntu-Mate:~$
Poi anche provando a scaricare questo file iso a caso è uscito lo stesso errore :
Codice: Seleziona tutto
roberto@Roberto-Ubuntu-Mate:~$ wget http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
--2017-02-03 11:04:51-- http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
Risoluzione di cdimage.ubuntu.com (cdimage.ubuntu.com)... 91.189.88.165, 2001:67c:1360:8001::23
Connessione a cdimage.ubuntu.com (cdimage.ubuntu.com)|91.189.88.165|:80... connesso.
Richiesta HTTP inviata, in attesa di risposta... 200 OK
Lunghezza: 941621248 (898M) [application/x-iso9660-image]
Salvataggio in: "lubuntu-16.10-desktop-amd64.iso.1"
ntu-16.10-desktop-a 0%[ ] 2,17M 779KB/s Errore di segmentazione (core dump creato)
roberto@Roberto-Ubuntu-Mate:~$
Re: Estrarre il codice sorgente di un file e usare wget ?
Inviato: mercoledì 8 febbraio 2017, 22:37
da steff
Vorrei ricordare che sulla grande maggioranza dei siti le condizioni di uso vietano espressivamente ogni download del materiale video, quindi queste tecniche non possono essere argomento di discussioni qui sul forum.
http://forum.ubuntu-it.org/rules.php#rule4012
Detto questo: wget con il file iso funziona come dovrebbe
Codice: Seleziona tutto
cd /tmp && wget http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
--2017-02-08 22:35:21-- http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
Risoluzione di cdimage.ubuntu.com (cdimage.ubuntu.com)... 91.189.88.165, 2001:67c:1360:8001::24
Connessione a cdimage.ubuntu.com (cdimage.ubuntu.com)|91.189.88.165|:80... connesso.
Richiesta HTTP inviata, in attesa di risposta... 200 OK
Lunghezza: 941621248 (898M) [application/x-iso9660-image]
Salvataggio in: "lubuntu-16.10-desktop-amd64.iso"
lubuntu-16.10-desktop-amd64.is 5%[=> ] 48,97M 427KB/s eta 42m 15s^
non so perché ti fa il core dump.
Re: Estrarre il codice sorgente di un file e usare wget ?
Inviato: giovedì 9 febbraio 2017, 15:03
da Rosssiiii
steff [url=http://forum.ubuntu-it.org/viewtopic.php?p=4957295#p4957295][img]http://forum.ubuntu-it.org/images/icons/icona-cita.gif[/img][/url] ha scritto:Vorrei ricordare che sulla grande maggioranza dei siti le condizioni di uso vietano espressivamente ogni download del materiale video, quindi queste tecniche non possono essere argomento di discussioni qui sul forum.
http://forum.ubuntu-it.org/rules.php#rule4012
Detto questo: wget con il file iso funziona come dovrebbe
Codice: Seleziona tutto
cd /tmp && wget http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
--2017-02-08 22:35:21-- http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
Risoluzione di cdimage.ubuntu.com (cdimage.ubuntu.com)... 91.189.88.165, 2001:67c:1360:8001::24
Connessione a cdimage.ubuntu.com (cdimage.ubuntu.com)|91.189.88.165|:80... connesso.
Richiesta HTTP inviata, in attesa di risposta... 200 OK
Lunghezza: 941621248 (898M) [application/x-iso9660-image]
Salvataggio in: "lubuntu-16.10-desktop-amd64.iso"
lubuntu-16.10-desktop-amd64.is 5%[=> ] 48,97M 427KB/s eta 42m 15s^
non so perché ti fa il core dump.
Perdonami per la questione dei video, credevo che essendo presente l'addon su firefox fosse ammesso !
Riguardo al problema di core dump, oggi ho riprovato:
Codice: Seleziona tutto
roberto@Roberto-Ubuntu-Mate:~$ wget -P /home/roberto/Scrivania/ http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
--2017-02-09 14:38:34-- http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
Risoluzione di cdimage.ubuntu.com (cdimage.ubuntu.com)... 91.189.88.39, 2001:67c:1360:8001::24
Connessione a cdimage.ubuntu.com (cdimage.ubuntu.com)|91.189.88.39|:80... connesso.
Richiesta HTTP inviata, in attesa di risposta... 200 OK
Lunghezza: 941621248 (898M) [application/x-iso9660-image]
Salvataggio in: "/home/roberto/Scrivania/lubuntu-16.10-desktop-amd64.iso"
ntu-16.10-desktop-a 0%[ ] 2,12M 726KB/s Errore di segmentazione (core dump creato)
roberto@Roberto-Ubuntu-Mate:~$ wget -c -P /home/roberto/Scrivania/ http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
--2017-02-09 14:38:48-- http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
Risoluzione di cdimage.ubuntu.com (cdimage.ubuntu.com)... 91.189.88.39, 2001:67c:1360:8001::24
Connessione a cdimage.ubuntu.com (cdimage.ubuntu.com)|91.189.88.39|:80... connesso.
Richiesta HTTP inviata, in attesa di risposta... 206 Partial Content
Lunghezza: 941621248 (898M), 939228234 (896M) rimanenti [application/x-iso9660-image]
Salvataggio in: "/home/roberto/Scrivania/lubuntu-16.10-desktop-amd64.iso"
ntu-16.10-desktop-a 0%[ ] 4,54M 792KB/s Errore di segmentazione (core dump creato)
roberto@Roberto-Ubuntu-Mate:~$ wget -c -P /home/roberto/Scrivania/ http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
--2017-02-09 14:38:55-- http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
Risoluzione di cdimage.ubuntu.com (cdimage.ubuntu.com)... 91.189.88.39, 2001:67c:1360:8001::24
Connessione a cdimage.ubuntu.com (cdimage.ubuntu.com)|91.189.88.39|:80... connesso.
Richiesta HTTP inviata, in attesa di risposta... 206 Partial Content
Lunghezza: 941621248 (898M), 936686771 (893M) rimanenti [application/x-iso9660-image]
Salvataggio in: "/home/roberto/Scrivania/lubuntu-16.10-desktop-amd64.iso"
16.10-desktop-amd64 0%[ ] 7,17M 697KB/s prev 24m 4sErrore di segmentazione (core dump creato)
roberto@Roberto-Ubuntu-Mate:~$
cioè se metto -c continua a scaricare,però boh !
Re: Estrarre il codice sorgente di un file e usare wget ?
Inviato: giovedì 9 febbraio 2017, 15:31
da steff
Da qualche parte avevo letto di un bug di wget su Ubuntu.
Se provi con
Codice: Seleziona tutto
LC_ALL=C http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
?
Re: Estrarre il codice sorgente di un file e usare wget ?
Inviato: giovedì 9 febbraio 2017, 18:14
da Rosssiiii
Codice: Seleziona tutto
ubuntu-mate@ubuntu-mate:~$ wget LC_ALL=C http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
--2017-02-09 17:11:01-- http://lc_all=c/
Risoluzione di lc_all=c (lc_all=c)... non riuscito: Nome o servizio sconosciuto.
wget: impossibile risolvere l'indirizzo dell'host "lc_all=c"
--2017-02-09 17:11:01-- http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
Risoluzione di cdimage.ubuntu.com (cdimage.ubuntu.com)... 91.189.88.165, 2001:67c:1360:8001::24
Connessione a cdimage.ubuntu.com (cdimage.ubuntu.com)|91.189.88.165|:80... connesso.
Richiesta HTTP inviata, in attesa di risposta... 200 OK
Lunghezza: 941621248 (898M) [application/x-iso9660-image]
Salvataggio in: "lubuntu-16.10-desktop-amd64.iso.1"
16.10-desktop-amd64 0%[ ] 1,10M 318KB/s prev 55m 5sErrore di segmentazione (core dump creato)
ubuntu-mate@ubuntu-mate:~$
no purtroppo non cambia nulla, ora sto provando una live 64bit di ubuntu mate e lo stesso problema si è presentato.
poi mi è uscito un messaggio di ubuntu con la scritta "wget si è fermata inaspettatamente" !
Dovrei provare su un'altro pc con debian poi non resta che trovare un programma alternativo...tu ne conosci qualcuno ?
Potrei provare a usare una nuova
Re: Estrarre il codice sorgente di un file e usare wget ?
Inviato: giovedì 9 febbraio 2017, 18:30
da steff
Ho dimenticato inserire wget nel comando scusa, deve essere così
Codice: Seleziona tutto
LC_ALL=C wget http://cdimage.ubuntu.com/lubuntu/releases/16.10/release/lubuntu-16.10-desktop-amd64.iso
Se ti funziona con -c usalo così.
Re: Estrarre il codice sorgente di un file e usare wget ?
Inviato: sabato 11 febbraio 2017, 18:41
da Rosssiiii
Ciao
Praticamente si tu non avevi messo wget ma io l'avevo comunque messo, ad ogni modo non credevo ci fosse differenza tra scrivere
wget LC_ALL=C URL
oppure
LC_ALL=C wget URL
comunque nel secondo caso ho provato stasera e va bene,lo scarica,altrimenti esce la scritta core dump !
Ma cosa significa quel LC_ALL=C ? avevo provato a vedere varie opzioni premendo wget -h ma quella non c'è...quando ci si trova nel manuale di un programma usando il terminale c'è un modo per cercare un termine ?
---------------
Comunque ho provato anche usando una live di debian 8 jessy e li quando mettevo wget e il link partiva in automatico il download,forse su ubuntu c'è un bug come avevi detto riguardo al funzionamento di wget

Re: Estrarre il codice sorgente di un file e usare wget ?
Inviato: sabato 11 febbraio 2017, 22:00
da steff
Non è lo stesso,l'ordine conta e come...
LC_ALL=C e deve stare prima, altrimenti wget lo prende come argomento.
Se stai attento vedi che risponde in inglese non più in italiano.
Re: Estrarre il codice sorgente di un file e usare wget ?
Inviato: domenica 12 febbraio 2017, 10:40
da Rosssiiii
Quindi risponde in inglese perchè: quel comando LC_ALL=C non ha a che vedere con il programma wget e fa si che "It forces applications to use the default language for output, and forces sorting to be bytewise. "
Quindi in questo modo si va ad ovviare al bug di wget su ubuntu.
Grazie,per ora proverò a scaricare cosi
