jak stahovat své webové stránky pomocí WGET pro Windows

posted in: Articles | 0

co dělá WGET?

po instalaci vám příkaz WGET umožňuje stahovat soubory přes protokoly TCP / IP: FTP, HTTP a HTTPS.

Pokud jste Linux nebo Mac uživatele, WGET je buď již zahrnuty v balíčku, který používáte, nebo to je triviální případ instalace z jakéhokoli úložiště dáváte přednost pomocí jediného příkazu.

bohužel to není tak jednoduché v systému Windows (i když je to stále velmi snadné!).,

Chcete-li spustit WGET, musíte jej stáhnout, rozbalit a nainstalovat ručně.

nainstalujte WGET v systému Windows 10

stáhněte si klasickou 32bitovou verzi 1.14 zde nebo přejděte do této kolekce Windows binaries na věčně znuděný zde pro pozdější verze a rychlejší 64 bit staví.

zde je stahovatelný zip soubor pro verzi 1.2 64 bit.

Pokud chcete být schopni spustit WGET z libovolného adresáře uvnitř příkazu terminálu, budete potřebovat, aby se dozvěděli o proměnné path v systému Windows zjistit, kde zkopírujte nový spustitelný soubor., Pokud budete postupovat podle těchto kroků, budete moci vytvořit příkaz WGET, který můžete spustit z libovolného adresáře v příkazovém řádku.

spustit WGET odkudkoli

nejprve musíme určit, kde kopírovat WGET.exe.

poté, co jste stáhli wget.exe (nebo rozbalené přidružené distribuční soubory zip) otevřete příkazový terminál zadáním „cmd“do nabídky vyhledávání:

přesuneme wget.exe do adresáře Windows, který umožní wget být spuštěn odkudkoli.

nejprve musíme zjistit, který adresář by měl být., Typ:

path

měli Byste vidět něco jako toto:

Díky „Cesta“ proměnné prostředí, víme, že musíme kopírovat wget.exe nac:\Windows\System32 umístění složky.

pokračujte a zkopírujte WGET.exe do adresáře System32 a restartujte příkazový řádek.,

Restartujte příkazů terminálu a vyzkoušet WGET

Pokud si chcete vyzkoušet WGET funguje správně, restartujte terminál a zadejte:

wget -h

Pokud jste zkopírovali soubor na správné místo, uvidíte soubor nápovědy se zobrazí všechny dostupné příkazy.

takže byste měli vidět něco takového:

nyní je čas začít.

Začínáme s wget

Když vidíme, že budeme pracovat v příkazovém řádku, vytvoříme adresář ke stažení pouze pro stahování wget.,

pro vytvoření adresáře použijeme příkaz md („make directory“).

Změnit na c:/ řádek a zadejte:

md wgetdown

změnit do nového adresáře a zadejte „dir“ pro zobrazení (prázdné) obsah.

Nyní jste připraveni provést nějaké stahování.

Příklad příkazů

Jakmile máte nainstalován WGET a vy jste vytvořil nový adresář, vše, co musíte udělat, je naučit se některé z jemnější body WGET argumenty, aby se ujistil, dostanete to, co potřebujete.

Gnu.,org wget manual je zvláště užitečný zdroj pro ty, kteří mají tendenci se opravdu naučit detaily.

Pokud však chcete nějaké rychlé příkazy, přečtěte si. Jsem uvedeny instrukce pro WGET rekurzivně zrcadlo webu, stáhnout všechny obrázky, CSS a JavaScript, lokalizovat všechny adresy Url (web funguje na vašem místním počítači), a uložit všechny stránky jako .html soubor.,

zrcadlit vaše stránky spustit tento příkaz:

wget -r https://www.yoursite.com

zrcadlo na web a lokalizovat všechny adresy url:

wget --convert-links -r https://www.yoursite.com

Pro plnou off-line mirror webu:

wget --mirror --convert-links --adjust-extension --page-requisites --no-parent https://www.yoursite.com

zrcadlo na webu a uložit soubory jako .html:

wget --html-extension -r https://www.yoursite.com

stáhnout všechny jpg obrázky z webu:

wget -A "*.jpg" -r https://www.yoursite.com

Pro více filetype-konkrétní operace, podívejte se na tento užitečný vlákno na Zásobníku.,

nastavte jiný uživatelský agent:

některé webové servery jsou nastaveny tak, aby popřely výchozí uživatelský agent WGET – ze zřejmých důvodů pro ukládání šířky pásma. Můžete zkusit změnit svého uživatelského agenta, abyste se dostali kolem tohoto. Například tím, že předstírá, že Googlebot:

wget --user-agent="Googlebot/2.1 (+https://www.googlebot.com/bot.html)" -r https://www.yoursite.com

Wget „pavouk“ mode:

Wget může načíst stránky bez ukládání což může být užitečná funkce v případě, že hledáte pro nefunkční odkazy na webové stránky. Nezapomeňte povolit rekurzivní režim, který umožňuje wget prohledávat dokument a hledat odkazy na traverse.,

wget --spider -r https://www.yoursite.com

můžete také uložit to do souboru protokolu přidáním této možnosti:

wget --spider -r https://www.yoursite.com -o wget.log

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *