Was macht WGET?
Nach der Installation können Sie mit dem Befehl WGET Dateien über die TCP/IP-Protokolle FTP, HTTP und HTTPS herunterladen.
Wenn Sie ein Linux-oder Mac-Benutzer sind, ist WGET entweder bereits in dem Paket enthalten, das Sie ausführen, oder es ist ein trivialer Fall der Installation aus einem beliebigen Repository, das Sie mit einem einzigen Befehl bevorzugen.
Leider ist es in Windows nicht ganz so einfach (obwohl es immer noch sehr einfach ist!).,
Um WGET auszuführen, müssen Sie manuell herunterladen, entpacken und installieren.
Installieren Sie WGET in Windows 10
Laden Sie die klassische 32-Bit-Version 1.14 hier herunter oder gehen Sie zu dieser Windows-Binärdateien-Sammlung unter Ewig langweilig hier für die späteren Versionen und die schnelleren 64-Bit-Builds.
Hier ist die herunterladbare zip-Datei für version 1.2 64-bit.
Wenn Sie WGET aus einem beliebigen Verzeichnis im Befehlsterminal ausführen möchten, müssen Sie mehr über Pfadvariablen in Windows erfahren, um herauszufinden, wohin Ihre neue ausführbare Datei kopiert werden soll., Wenn Sie diese Schritte ausführen, können Sie WGET zu einem Befehl machen, den Sie in jedem Verzeichnis in der Eingabeaufforderung ausführen können.
Führen Sie WGET von überall aus
Zunächst müssen wir bestimmen, wo WGET kopiert werden soll.exe.
Nachdem Sie wget heruntergeladen haben.exe (oder entpackt die zugehörige Verteilung ZIP-Dateien) öffnen Sie ein Befehlsterminal, indem Sie „cmd“ in das Suchmenü eingeben:
Wir werden wget bewegen.exe in ein Windows-Verzeichnis, mit dem WGET von überall ausgeführt werden kann.
Zuerst müssen wir herausfinden, welches Verzeichnis das sein soll., Typ:
path
Sie sollten so etwas sehen:
Dank der Umgebungsvariablen“ Path “ wissen wir, dass wir wget kopieren müssen.exe in den Ordner c:\Windows\System32
.
Kopieren Sie WGET.wechseln Sie in das System32-Verzeichnis und starten Sie die Eingabeaufforderung neu.,
Befehlsterminal neu starten und WGET testen
Wenn Sie testen möchten, ob WGET ordnungsgemäß funktioniert, starten Sie Ihr Terminal neu und geben Sie Folgendes ein:
wget -h
Wenn Sie die Datei an die richtige Stelle kopiert haben, wird eine Hilfedatei mit allen verfügbaren Befehlen angezeigt.
Also, Sie sollten etwas sehen wie folgt aus:
Jetzt ist es Zeit, um loszulegen.
Erste Schritte mit WGET
Da wir in der Eingabeaufforderung arbeiten, erstellen wir ein Download-Verzeichnis nur für WGET-Downloads.,
Um ein Verzeichnis zu erstellen, verwenden wir den Befehl md
(„Verzeichnis erstellen“).
Wechseln Sie zur Eingabeaufforderung c:/ und geben Sie Folgendes ein:
md wgetdown
Wechseln Sie dann in Ihr neues Verzeichnis und geben Sie „dir“ ein, um den (leeren) Inhalt anzuzeigen.
Jetzt können Sie etwas herunterladen.
Beispielbefehle
Sobald Sie WGET installiert haben und ein neues Verzeichnis erstellt haben, müssen Sie nur einige der Feinheiten von WGET-Argumenten lernen, um sicherzustellen, dass Sie erhalten, was Sie brauchen.
Die Gnu.,das WGET-Handbuch ist eine besonders nützliche Ressource für diejenigen, die dazu neigen, die Details wirklich zu lernen.
Wenn Sie jedoch einige schnelle Befehle möchten, lesen Sie weiter. Ich habe eine Reihe von Anweisungen für WGET aufgelistet, um Ihre Site rekursiv zu spiegeln, alle Bilder, CSS und JavaScript herunterzuladen, alle URLs zu lokalisieren (damit die Site auf Ihrem lokalen Computer funktioniert) und alle Seiten als a zu speichern .html-Datei.,
Um Ihre Site zu spiegeln, führen Sie diesen Befehl aus:
wget -r https://www.yoursite.com
Um die Site zu spiegeln und alle URLs zu lokalisieren:
wget --convert-links -r https://www.yoursite.com
Um eine Site vollständig offline zu spiegeln:
wget --mirror --convert-links --adjust-extension --page-requisites --no-parent https://www.yoursite.com
Zum Spiegeln der Site und Speichern der Dateien unter .html:
wget --html-extension -r https://www.yoursite.com
Um alle JPG-Bilder von einer Site herunterzuladen:
wget -A "*.jpg" -r https://www.yoursite.com
Weitere dateitypspezifische Vorgänge finden Sie in diesem nützlichen Thread auf Stack.,
Legen Sie einen anderen Benutzeragenten fest:
Einige Webserver sind so eingerichtet, dass sie den Standardbenutzeragenten von WGET ablehnen – aus offensichtlichen, bandbreitensparenden Gründen. Sie könnten versuchen, Ihren Benutzeragenten zu ändern, um dies zu umgehen. Zum Beispiel, indem Sie vorgeben, Googlebot zu sein:
wget --user-agent="Googlebot/2.1 (+https://www.googlebot.com/bot.html)" -r https://www.yoursite.com
Wget“ spider “ – Modus:
Wget kann Seiten abrufen, ohne sie zu speichern, was eine nützliche Funktion sein kann, falls Sie nach defekten Links auf einer Website suchen. Denken Sie daran, den rekursiven Modus zu aktivieren, mit dem wget das Dokument durchsuchen und nach Links zum Durchlaufen suchen kann.,
wget --spider -r https://www.yoursite.com
Sie können dies auch in einer Protokolldatei speichern, indem Sie diese Option hinzufügen:
wget --spider -r https://www.yoursite.com -o wget.log
Schreibe einen Kommentar