Vytvorte Plánovač na stiahnutie s malou programovou zručnosťou

Obsah:

Vytvorte Plánovač na stiahnutie s malou programovou zručnosťou
Vytvorte Plánovač na stiahnutie s malou programovou zručnosťou

Video: Vytvorte Plánovač na stiahnutie s malou programovou zručnosťou

Video: Vytvorte Plánovač na stiahnutie s malou programovou zručnosťou
Video: Leap Motion SDK - YouTube 2024, Marec
Anonim

Všetci radi stiahneme veci z internetu a sú tu hromady skvelých nástrojov pre správcu sťahovania, ktoré môžeme použiť na naplánovanie našich sťahovaní. Možno by bolo jednoduchšie používať správcu sťahovania, ale nie je žiadna škoda pri skúmaní nástrojov, ktoré už prichádzajú s našim Ubuntu, a plne ho využívať.

V tomto článku vám ukážeme vstavaný softvér v Ubuntu, ktorý môžeme použiť na sťahovanie materiálov z internetu wget, Okrem toho vám ukážeme, ako naplánovať sťahovanie pomocou aplikácie Cron.

Stiahnite si pomocou Wget

Wget je bezplatný softvérový balík na načítanie súborov pomocou protokolov HTTP, HTTPS a FTP, najrozšírenejších internetových protokolov. Je to neinteraktívny nástroj príkazového riadku, takže ho možno jednoducho nazývajú skripty, úlohy cron, terminály bez podpory X-Windows atď.

Otvorte svoj terminál a skúmme, ako môžeme použiť wget na stiahnutie z internetu. Základná syntax sťahovania pomocou wgetu je nasledovná:

wget [voľba] … …

Tento príkaz si stiahne príručku wget do vašej lokálnej jednotky

wget https://www.gnu.org/software/wget/manual/wget.pdf

Linux Cron

Ubuntu prichádza s dronom cron, ktorý sa používa na naplánovanie úloh, ktoré sa majú vykonať v určitej dobe. Crontab vám umožňuje určiť akcie a časy, ktoré by mali byť vykonané. Takto by ste mali bežne naplánovať úlohu pomocou nástroja príkazového riadku.

Otvorte okno terminálu a zadajte crontab -e.

To je základom pre wget a ako funguje Cron. Poďme si vziať kořisti v reálnom príklade, ako naplánovať sťahovanie.

Plánovanie sťahovania

Budeme sťahovať Firefox 3.6 v 2:00. Pretože náš ISP poskytuje iba obmedzené množstvo dát, musíme zastaviť sťahovanie o 8:00. Vyzerá to takto.

[Kód] 0 2 * * * wget -c https://download.mozilla.org/?product=firefox-3.6.6&os=win&lang=sk [/Code]

Voľby -c označujú, že wget by mal obnoviť existujúci preberací súbor, ak nebol dokončený.

Štvrtý príkaz zastaví wget o 8:00. 'Killall' je príkaz unix, ktorý zabíja procesy podľa mena.

[Kód] 0 8 * * * killall wget [/Code]

Killall wget povie Ubuntu, aby zastavil wget zo stiahnutého súboru o 8:00.

Ďalšie užitočné príkazy wget

1. Zadanie adresára na stiahnutie súboru

[Kód] wget -output-document = / home / zainul / Na stiahnutie / wget manual.pdf https://www.gnu.org/software/wget/manual/wget.pdf [/Code]

voľba -output-document umožňuje určiť adresár a názov súboru, ktorý si stiahnete

2. Sťahovanie webovej stránky

wget je tiež schopný stiahnuť webové stránky.

[Kód] wget -m https://www.google.com/profiles/zainul.franciscus [/Code]

Vyššie uvedený príkaz si stiahne celú webovú stránku profilu google. Možnosť '-m' hovorí spoločnosti wget, že si stiahne zrkadlový obrázok určenej adresy URL.

Ďalšou dôležitou možnosťou je povedať, wget koľko odkazov by malo nasledovať pri preberaní webových stránok.

[Kód] wget -r -l1 https://www.google.com/profiles/zainul.franciscus [/Code]

Vyššie uvedený príkaz wget používa dve možnosti. Prvá voľba "-r" hovorí spoločnosti Wget, že sťahuje zadanú webovú stránku rekurzívne. Druhá možnosť '-l1' hovorí, že Wget má len prvú úroveň odkazov z uvedenej webovej lokality. Môžeme nastaviť tri úrovne "-l2" a "-l3".

3. Ignorovanie vstupu robota

Webový majster udržiava textový súbor s názvom Robot.txt. Súbor "Robot.txt" udržiava zoznam adries URL, ktoré prehľadávač webových stránok, ako napríklad wget, nemal indexovo prehľadávať. Môžeme povedať, že wget ignoruje možnosť 'Robot.txt' s voľbou '-erobots = off'. Nasledujúci príkaz informuje wget, že stiahne prvú stránku môjho google profilu a ignoruje súbor Robot.txt.

[Kód] wget -erobots = vypnuté https://www.google.com/profiles/zainul.franciscus [/Code]

Ďalšou užitočnou možnosťou je -U. Táto možnosť bude maskovať wget ako prehliadač. Majte na pamäti, že maskovanie aplikácie ako inej aplikácie môže porušovať termín a službu poskytovateľa webových služieb.

[Kód] wget -erobots = off -U Mozilla https://www.google.com/profiles/zainul.franciscus [/Code]

záver

Wget je veľmi stará škola, ktorá však hackletuje softvérový balík GNU, ktorý môžeme použiť na sťahovanie súborov. Wget je interaktívny nástroj príkazového riadku, čo znamená, že ho môžeme nechať bežať na našom počítači na pozadí bez nutnosti spustenia žiadnej aplikácie. Pozrite sa na stránku manga wget

[Kód] $ man wget [/Code]

aby sme pochopili ďalšie možnosti, ktoré môžeme použiť s wget.

odkazy

Wget Manual Ako skombinovať dva stiahnuté súbory, keď wget zlyhá v polovici cesty Linux QuickTip: Stiahnutie a Un-taring v jednom kroku

Odporúča: