12Sep

Izgradite raspored preuzimanja s malim programskim vještinama

Svi volimo preuzimati sadržaje s interneta i postoje gomile sjajnih alata za upravljanje preuzimanjem koje možemo koristiti za zakazivanje naših preuzimanja. Možda bi bilo jednostavnije upotrebljavati upravitelja preuzimanja, ali nema štetu u istraživanju alata koji već dolaze s našim Ubuntu i čine ga u potpunosti iskoristiti.

U ovom članku ćemo vam pokazati izgrađen softver u Ubuntu koji možemo koristiti za preuzimanje sadržaja s interneta pomoću wget .Na vrhu toga ćemo vam pokazati kako zakazati preuzimanje pomoću programa Cron.

Preuzimanje Korištenje Wget

Wget je besplatni programski paket za preuzimanje datoteka pomoću HTTP, HTTPS i FTP, najčešće korištenih internetskih protokola. To je ne-interaktivni alat naredbenog retka, tako da se lako može nazvati iz skripti, cron radnih mjesta, terminala bez podrške X-Windows, itd.

Otvorite svoj terminal i neka je istražiti kako možemo koristiti wget za preuzimanje stvari s mreže. Osnovna sintaksa skidanja s wgetom je sljedeća:

wget [opcija]. .. [URL]. ..

Ova naredba će preuzeti wget priručnik u vaš lokalni pogon

wget http: //www.gnu.org/software/wget/manual/ wget.pdf

Linux Cron

Ubuntu dolazi s crondaemon se koristi za zakazivanje zadataka koji će se izvršiti u određeno vrijeme. Crontab vam omogućuje da odredite radnje i vremena za izvršavanje. Ovo je način na koji biste obično zakazali zadatak pomoću alata naredbenog retka.

Otvorite prozor terminala i unesite crontab -e.

Svaki od odjeljaka u crontabu je odijeljen prostorom, a završni dio ima jedan ili više mjesta u njemu. Cron ulaz sastoji se od minute( 0-59), sata( 0-23, 0 = ponoć), dana( 1-31), mjeseca( 1-12), radnog dana( 0-6, 0 = nedjelja).Treći unos u gore navedenom crontab preuzimanju wget.pdf u 2 sata ujutro. Prvi unos( 0) i drugi unos( 2) znači 2:00.Treći od pete stavke( *) označava bilo koje doba dana, mjeseca ili tjedna. Posljednji unos je naredba wget za preuzimanje wget.pdf iz navedenog URL-a.

To je osnovno na wgetu i kako funkcionira Cron. Uzmimo plijen u pravi život primjer o tome kako raspored preuzimanje.

Zakazivanje Download

Preuzeti ćemo Firefox 3.6 u 2 ujutro. Budući da naš ISP daje samo ograničenu količinu podataka, moramo zaustaviti preuzimanje u 8 sati ujutro. Ovo je ono što izgleda postava.

Zanemari prva 2 unosa u gornjem crontabu. Treća i četvrta naredba su samo dvije naredbe koje vam trebaju. Treći naredba postavlja zadatak koji će preuzeti Firefox u 2 ujutro:

[kod]
0 2 * * * wget -c http: //download.mozilla.org/? Product = firefox-3.6.6 & os = win & lang = en-GB
[/ code]

Opcije -c označavaju da wget treba nastaviti postojeći preuzimanje ako nije dovršen.

Četvrti naredba zaustavlja wget u 8 sati ujutro.'Killall' je unix naredba koja ublažava procese po imenu.

[/ code]

Ubuntu Wget kaže Ubuntu da zaustavi wget da preuzme datoteku u 8 sati ujutro.

Ostale korisne naredbe wget

1. Određivanje direktorija za preuzimanje datoteke

[kod]
wget -output-document = /home/zainul/Downloads/ wget manual.pdf http: //www.gnu.org/software/wget/manual/ wget.pdf

opcija -output-document omogućujenavedite imenik i naziv datoteke koju preuzimate

2. Preuzimanje web stranice

wget također može preuzeti web stranicu.

[kod]
wget -m http: //www.google.com/profiles/ zainul.franciscus
[/ code]

Gornja naredba će preuzeti čitavu web stranicu google profila. Opcija "-m" navodi wget da preuzme sliku "zrcala" navedenog URL-a.

Još jedna važna mogućnost je da kažem wget koliko veza treba slijediti kada preuzme web stranicu.

[kod]
wget -r-l1 http: //www.google.com/profiles/ zainul.franciscus
[/ code]

Gornja wget naredba koristi dvije opcije. Prva opcija "-r" kaže wgetu da preuredi rekurzivno navedenu web stranicu. Druga opcija "-l1" govori wget da dobije samo prvu razinu veza s navedene web stranice. Možemo postaviti do tri razine "-1 2" i "-13".

3. Zanemarivanje ulaza robota

Web master održava tekstnu datoteku Robot.txt."Robot.txt" održava popis URL-a koji alat za indeksiranje web stranice, kao što je wget, ne bi trebao puzati. Možemo reći Wgetu da ignorira 'Robot.txt' s opcijom '-erobots = off'.Sljedeća naredba kaže wgetu da preuzme prvu stranicu svog google profila i zanemari 'Robot.txt.

[kod]
wget -erobots = off http: //www.google.com/profiles/ zainul.franciscus
[/ code]

Druga korisna opcija je -U.Ova opcija će maskirati wget kao preglednik. Imajte na umu da maskiranje aplikacije kao druge aplikacije može kršiti termin i servis davatelja internetskih usluga.
[code]
wget -erobots = off -U Mozilla http: //www.google.com/profiles/ zainul.franciscus
[/ code]

Zaključak

Wget je vrlo stara škola, ali još uvijek hackable GNU softverski paket koji možemo koristiti za preuzimanje datoteka. Wget je interaktivni alat naredbenog retka, što znači da možemo dopustiti da se pokreće na našem računalu u pozadini bez potrebe za pokretanjem bilo kakve aplikacije. Provjerite stranicu Wget Man

[kod]
$ man wget
[/ code]

razumjeti druge opcije koje možemo koristiti s wgetom.

Linkovi

Wget Priručnik
Kako kombinirati dvije preuzete datoteke kada wget ne uspije na pola puta
Linux QuickTip: preuzimanje i uklanjanje unazad