Come scaricare il tuo sito web utilizzando WGET per Windows

postato in: Articles | 0

Cosa fa WGET?

Una volta installato, il comando WGET consente di scaricare file tramite i protocolli TCP / IP: FTP, HTTP e HTTPS.

Se sei un utente Linux o Mac, WGET è già incluso nel pacchetto che stai eseguendo o è un caso banale di installazione da qualsiasi repository che preferisci con un singolo comando.

Sfortunatamente, non è così semplice in Windows (anche se è ancora molto facile!).,

Per eseguire WGET è necessario scaricare, decomprimere e installare manualmente.

Installa WGET in Windows 10

Scarica la classica versione a 32 bit 1.14 qui o, vai a questa raccolta di binari di Windows a Eternally Bored qui per le versioni successive e le build a 64 bit più veloci.

Ecco il file zip scaricabile per la versione 1.2 a 64 bit.

Se vuoi essere in grado di eseguire WGET da qualsiasi directory all’interno del terminale di comando, dovrai conoscere le variabili path in Windows per capire dove copiare il tuo nuovo eseguibile., Se segui questi passaggi, sarai in grado di rendere WGET un comando che puoi eseguire da qualsiasi directory nel prompt dei comandi.

Esegui WGET da qualsiasi luogo

In primo luogo, dobbiamo determinare dove copiare WGET.exe.

Dopo aver scaricato wget.exe (o decompresso i file zip di distribuzione associati) aprire un terminale di comando digitando “cmd” nel menu di ricerca:

Stiamo andando a spostare wget.exe in una directory di Windows che permetterà WGET da eseguire da qualsiasi luogo.

Per prima cosa, dobbiamo scoprire quale directory dovrebbe essere., Digitare:

path

Dovresti vedere qualcosa del genere:

Grazie alla variabile d’ambiente “Path”, sappiamo che dobbiamo copiare wget.exe alla posizione della cartellac:\Windows\System32.

Vai avanti e copia WGET.exe alla directory System32 e riavviare il prompt dei comandi.,

Riavvia il terminale di comando e verifica WGET

Se vuoi testare che WGET funzioni correttamente, riavvia il tuo terminale e digita:

wget -h

Se hai copiato il file nel posto giusto, vedrai apparire un file di aiuto con tutti i comandi disponibili.

Quindi, dovresti vedere qualcosa del genere:

Ora è il momento di iniziare.

Inizia con WGET

Visto che lavoreremo nel prompt dei comandi, creiamo una directory di download solo per i download WGET.,

Per creare una directory, useremo il comando md (“crea directory”).

Passare al prompt c:/e digitare:

md wgetdown

Quindi, passare alla nuova directory e digitare “dir” per vedere il contenuto (vuoto).

Ora, sei pronto per fare un po ‘ di download.

Comandi di esempio

Una volta installato WGET e creata una nuova directory, tutto ciò che devi fare è imparare alcuni dei punti più fini degli argomenti WGET per assicurarti di ottenere ciò di cui hai bisogno.

Gnu.,org WGET manual è una risorsa particolarmente utile per coloro che sono inclini a imparare davvero i dettagli.

Se vuoi alcuni comandi rapidi, continua a leggere. Ho elencato una serie di istruzioni per WGET per rispecchiare ricorsivamente il tuo sito, scaricare tutte le immagini, CSS e JavaScript, localizzare tutti gli URL (in modo che il sito funzioni sul tuo computer locale) e salvare tutte le pagine come .file html.,

A specchio il tuo sito, esegui questo comando:

wget -r https://www.yoursite.com

un mirror del sito e localizzare tutti gli url:

wget --convert-links -r https://www.yoursite.com

Per fare un full offline specchio di un sito:

wget --mirror --convert-links --adjust-extension --page-requisites --no-parent https://www.yoursite.com

un mirror del sito e salvare il file come .html:

wget --html-extension -r https://www.yoursite.com

Per scaricare tutte le immagini jpg da un sito:

wget -A "*.jpg" -r https://www.yoursite.com

Per ulteriori operazioni specifiche del tipo di file, controlla questo utile thread in Stack.,

Imposta un agente utente diverso:

Alcuni server Web sono impostati per negare l’agente utente predefinito di WGET – per ovvi motivi di risparmio della larghezza di banda. Potresti provare a cambiare il tuo user agent per aggirare questo. Ad esempio, fingendo di essere Googlebot:

wget --user-agent="Googlebot/2.1 (+https://www.googlebot.com/bot.html)" -r https://www.yoursite.com

Wget modalità “spider”:

Wget può recuperare le pagine senza salvarle, il che può essere una funzione utile nel caso in cui tu stia cercando collegamenti interrotti su un sito web. Ricorda di abilitare la modalità ricorsiva, che consente a wget di scansionare il documento e cercare i collegamenti da attraversare.,

wget --spider -r https://www.yoursite.com

È anche possibile salvare questo in un file di registro aggiungendo questa opzione:

wget --spider -r https://www.yoursite.com -o wget.log

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *