Comment télécharger votre site Web en utilisant WGET pour Windows

Classé dans : Articles | 0

Que fait WGET?

Une fois installée, la commande WGET vous permet de télécharger des fichiers via les protocoles TCP / IP: FTP, HTTP et HTTPS.

Si vous êtes un utilisateur Linux ou Mac, WGET est déjà inclus dans le package que vous exécutez ou il s’agit d’un cas trivial d’installation à partir du référentiel que vous préférez avec une seule commande.

Malheureusement, ce n’est pas si simple sous Windows (même si c’est toujours très facile!).,

Pour exécuter WGET, vous devez télécharger, décompresser et installer manuellement.

Installer WGET dans Windows 10

Téléchargez la version 32 bits classique 1.14 ici ou, allez dans cette collection de binaires Windows à Eternally Bored ici pour les versions ultérieures et les versions 64 bits plus rapides.

Voici le fichier zip téléchargeable pour la version 1.2 64 bits.

Si vous voulez pouvoir exécuter WGET à partir de n’importe quel répertoire à l’intérieur du terminal de commande, vous devrez en apprendre davantage sur les variables de chemin dans Windows pour savoir où copier votre nouvel exécutable., Si vous suivez ces étapes, vous pourrez faire de WGET une commande que vous pouvez exécuter à partir de n’importe quel répertoire dans l’invite de commande.

Exécutez WGET de n’importe où

Tout d’abord, nous devons déterminer où copier WGET.EXE.

Après vous l’avais téléchargé wget.exe (ou décompressé les fichiers zip de distribution associés) ouvrez un terminal de commande en tapant « cmd »dans le menu de recherche:

Nous allons déplacer wget.exe dans un répertoire Windows qui permettra à WGET d’être exécuté de n’importe où.

Tout d’abord, nous devons trouver quel répertoire cela devrait être., Type:

path

Vous devriez voir quelque chose comme ceci:

Merci pour le « Chemin” de la variable d’environnement, nous savons que nous avons besoin de la copie de wget.exe à l’emplacement du dossierc:\Windows\System32.

Allez-y et copiez WGET.exe dans le répertoire System32 et redémarrez votre invite de commande.,

Redémarrez le terminal de commande et testez WGET

Si vous voulez tester WGET fonctionne correctement, redémarrez votre terminal et tapez:

wget -h

Si vous avez copié le fichier au bon endroit, vous verrez apparaître un fichier d’aide avec toutes les commandes disponibles.

Donc, vous devriez voir quelque chose comme ceci:

Maintenant, il est temps de commencer.

Commencez avec WGET

Vu que nous allons travailler dans l’invite de commande, créons un répertoire de téléchargement juste pour les téléchargements WGET.,

Pour créer un répertoire, nous allons utiliser la commande md (« make directory”).

Passez à l’invite c:/et tapez:

md wgetdown

Ensuite, passez à votre nouveau répertoire et tapez « dir” pour voir le contenu (vide).

Maintenant, vous êtes prêt à faire certaines de téléchargement.

Exemples de commandes

Une fois que vous avez installé WGET et que vous avez créé un nouveau répertoire, tout ce que vous avez à faire est d’apprendre certains des points les plus fins des arguments WGET pour vous assurer d’obtenir ce dont vous avez besoin.

Le Gnu.,org WGET manual est une ressource particulièrement utile pour ceux qui sont enclins à vraiment apprendre les détails.

Si vous voulez des commandes rapides, lisez la suite. J’ai répertorié un ensemble d’instructions pour WGET pour refléter récursivement votre site, télécharger toutes les images, CSS et JavaScript, localiser toutes les URL (pour que le site fonctionne sur votre machine locale) et enregistrer toutes les pages en tant que .fichier html.,

Pour le miroir de votre site exécutez cette commande:

wget -r https://www.yoursite.com

un miroir du site et de localiser toutes les url:

wget --convert-links -r https://www.yoursite.com

Pour faire un mode hors connexion complet miroir d’un site:

wget --mirror --convert-links --adjust-extension --page-requisites --no-parent https://www.yoursite.com

un miroir du site et enregistrer les fichiers .html:

wget --html-extension -r https://www.yoursite.com

Pour télécharger toutes les images jpg à partir d’un site:

wget -A "*.jpg" -r https://www.yoursite.com

Pour plus d’un type de fichier à des opérations spécifiques, découvrez ce fil sur Pile.,

Définir un agent utilisateur différent:

Certains serveurs Web sont configurés pour refuser l’agent utilisateur par défaut de WGET – pour des raisons évidentes d’économie de bande passante. Vous pouvez essayer de changer votre agent utilisateur pour contourner ce problème. Par exemple, en se faisant passer pour Googlebot:

wget --user-agent="Googlebot/2.1 (+https://www.googlebot.com/bot.html)" -r https://www.yoursite.com

Wget mode « spider”:

Wget peut récupérer des pages sans les enregistrer, ce qui peut être une fonctionnalité utile au cas où vous rechercheriez des liens cassés sur un site Web. N’oubliez pas d’activer le mode récursif, qui permet à wget de parcourir le document et de rechercher des liens à parcourir.,

wget --spider -r https://www.yoursite.com

Vous pouvez aussi l’enregistrer dans un fichier journal par l’ajout de cette option:

wget --spider -r https://www.yoursite.com -o wget.log

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *