12Sep

Vytvorte Plánovač na stiahnutie s malou programovou zručnosťou

Všetci radi sťahujeme veci z internetu a sú tu hromady veľkých nástrojov pre správcov na stiahnutie, ktoré môžeme použiť na naplánovanie našich sťahovaní.Možno by bolo jednoduchšie používať správcu sťahovania, ale nie je žiadna škoda pri skúmaní nástrojov, ktoré už prichádzajú s našim Ubuntu, a plne ho využívať.

V tomto článku vám ukážeme vstavaný softvér v Ubuntu, ktorý môžeme použiť na sťahovanie materiálov z internetu pomocou wget .Okrem toho vám ukážeme, ako naplánovať sťahovanie pomocou programu Cron.

Prevzatie pomocou Wget

Wget je bezplatný softvérový balík na načítanie súborov pomocou HTTP, HTTPS a FTP, najrozšírenejších internetových protokolov. Je to neinteraktívny nástroj príkazového riadka, takže ho možno jednoducho nazývajú skripty, úlohy cron, terminály bez podpory X-Windows atď.

Otvorte terminál a skúmme, ako môžeme použiť wget na stiahnutie z internetu. Základnou syntaxou sťahovania pomocou wget je nasledovné:

wget [option]. .. [URL]. ..

Tento príkaz si stiahne príručku wget do vašej lokálnej jednotky

wget http: //www.gnu.org/software/wget/manual/ wget.pdf

Linux Cron

Ubuntu je dodávaný s crondémon používaný na plánovanie úloh, ktoré sa majú vykonať v určitej dobe. Crontab vám umožňuje určiť akcie a časy, ktoré by mali byť vykonané.Takto by ste mali bežne naplánovať úlohu pomocou nástroja príkazového riadku.

Otvorte okno terminálu a zadajte crontab -e.

Každá sekcia v crontab je oddelená medzerou, pričom posledná časť má jeden alebo viac medzery. Položka cron sa skladá z minúty( 0-59), hodiny( 0-23, 0 = polnoc), deň( 1-31), mesiac( 1-12), deň v týždni( 0-6, 0 = nedeľa).Tretia položka vo vyššie uvedenom crontab sťahuje wget.pdf o 2 hod. Prvý záznam( 0) a druhý záznam( 2) znamená 2:00.Tretí až piaty záznam( *) znamená akýkoľvek čas v priebehu dňa, mesiaca alebo týždňa. Poslednou položkou je príkaz wget na stiahnutie wget.pdf zo zadanej URL.

To je základom pre wget a ako funguje Cron. Poďme si vziať kořisti v reálnom príklade, ako naplánovať sťahovanie.

Plánovanie Stiahnite si

Sťahujeme Firefox 3.6 v 2 AM.Pretože náš ISP dáva len obmedzené množstvo dát, musíme zastaviť sťahovanie o 8:00.Vyzerá to takto.

Ignorujte prvé 2 položky vo vyššie uvedenom crontab. Tretí a štvrtý príkaz sú iba 2 príkazy, ktoré potrebujete. Tretí príkaz nastaví úlohu, ktorá bude sťahovať Firefox o 2:00 hod.:

[code]
0 2 * * * wget -c http: //download.mozilla.org/? Product = firefox-3.6.6 & os = win & lang = en-GB
[/ code]

Voľby -c označujú, že wget by mal obnoviť existujúci súbor, ak nebol dokončený.

Štvrtý príkaz zastaví Wget o 8:00.'Killall' je príkaz unix, ktorý zabíja procesy podľa mena.

[kód]
0 8 * * * killall wget
[/ code]

Killall wget povie Ubuntu, aby zastavil wget zo stiahnutého súboru o 8:00.

Ďalšie užitočné príkazy wget

1. Zadanie adresára na stiahnutie súboru

[code]
wget -output-document = /home/zainul/Downloads/ wget manual.pdf http: //www.gnu.org/software/wget/manual/ wget.pdf
[/ code]

voľba -output-document umožňujezadáte adresár a názov súboru, ktorý si stiahnete

2. Stiahnutie webovej stránky

wget je tiež schopný stiahnuť webové stránky.

[kód]
wget -m http: //www.google.com/profiles/ zainul.franciscus
[/ code]

Vyššie uvedený príkaz si stiahne celú webovú stránku profilu google. Možnosť '-m' hovorí spoločnosti wget, že si stiahne zrkadlový obrázok určenej adresy URL.

Ďalšou dôležitou možnosťou je povedať, wget koľko odkazov by malo nasledovať pri stiahnutí webových stránok.

[kód]
wget -r -l1 http: //www.google.com/profiles/ zainul.franciscus
[/ code]

Vyššie uvedený príkaz wget používa dve možnosti. Prvá voľba "-r" hovorí spoločnosti Wget, že sťahuje zadanú webovú stránku rekurzívne. Druhá možnosť '-l1' hovorí, že Wget má len prvú úroveň odkazov z uvedenej webovej lokality. Môžeme nastaviť tri úrovne "-l2" a "-l3".

3. Ignorovanie vstupu robota

Web master

zachováva textový súbor s názvom Robot.txt. Súbor "Robot.txt" udržiava zoznam adries URL, ktoré prehľadávač webových stránok, ako napríklad wget, nemal indexovo prehľadávať.Môžeme povedať, že wget ignoruje možnosť 'Robot.txt' s voľbou '-erobots = off'.Nasledujúci príkaz informuje wget, že stiahne prvú stránku môjho google profilu a ignoruje súbor Robot.txt.

[kód]
wget -erobots = vypnutie http: //www.google.com/profiles/ zainul.franciscus
[/ code]

Ďalšou užitočnou voľbou je -U.Táto možnosť bude maskovať wget ako prehliadač.Majte na pamäti, že maskovanie aplikácie ako inej aplikácie môže porušovať termín a službu poskytovateľa webových služieb.

[kód]
wget -erobots = off -U Mozilla http: //www.google.com/profiles/ zainul.franciscus
[/ code]

Záver

Wget je veľmi stará škola, ktorá však hackletuje softvérový balík GNU, ktorý môžeme použiť na sťahovanie súborov. Wget je interaktívny nástroj príkazového riadku, čo znamená, že ho môžeme nechať bežať na našom počítači na pozadí bez nutnosti spustenia žiadnej aplikácie. Pozrite sa na stránku s manuálom Wget

[kód]
$ man wget
[/ code]

, aby ste pochopili ďalšie možnosti, ktoré môžeme použiť s wget.

Odkazy

Wget Manuál
Ako skombinovať dva stiahnuté súbory, keď wget prestane v polovici
Linux QuickTip: Stahovanie a un-tarring v jednom kroku