12Sep

Sukurkite atsisiųsti planuotoją su mažu programavimo įgūdžiu

Mes visi mėgsta atsisiųsti medžiagą iš interneto, yra daugybė puikių atsisiųsti tvarkyklių įrankių, kuriuos galime naudoti, kad planuotume savo atsisiuntimus. Tai gali būti lengviau naudoti atsisiuntimų tvarkytuvą, tačiau nėra jokios žalos, ieškant įrankių, kurie jau yra su mūsų Ubuntu, ir visapusiškai jį panaudoti.

Šiame straipsnyje mes parodysime jums įmontuotą "Ubuntu" programinę įrangą, kurią galėtume atsisiųsti iš interneto, naudodamiesi wget .Be to, mes parodysime, kaip planuoti atsisiųsti naudojant Cron.

Atsisiųsti naudojant Wget

"Wget" yra nemokama programinės įrangos paketė, skirta rinkmenoms gauti naudojant HTTP, HTTPS ir FTP, dažniausiai naudojamus interneto protokolus. Tai yra neinteraktyvus komandinės eilutės įrankis, todėl jis gali būti lengvai paragintas iš scenarijų, cron darbo vietų, terminalų be "X-Windows" palaikymo ir tt

Atidarykite savo terminalą ir išmokskime, kaip mes galime naudoti "wget", kad atsisiųstumėte medžiagą iš tinklo. Pagrindinė atsisiuntimo su wget sintaksė yra tokia:

wget [parinktis]. .. [URL]. ..

Ši komanda atsisiųs wget vadovą į vietinį diską

wget http: //www.gnu.org/software/wget/manual/ wget.pdf

Linux Cron

Ubuntu ateina su crondaina, naudojamas planuojant užduotis, kurios bus įvykdytos tam tikru laiku. Crontab leidžia jums nurodyti veiksmus ir jų vykdymo laiką.Taip, kaip paprastai, užduočių atlikite komandinės eilutės įrankiu.

Atidarykite terminalo langą ir įveskite crontab -e.

Kiekvienas crontab skirsnis yra atskirtas tarpu, o paskutinė sekcija turi vieną arba daugiau tarpų.Crono įrašas susideda iš minutės( 0-59), valandos( 0-23, 0 = vidurnakčio), dienos( 1-31), mėnesio( 1-12), darbo dienos( 0-6, 0 = sekmadienis), komandos. Trečias įrašas aukščiau esančiame crontab atsisiunčia wget.pdf 2 val. Pirmasis įrašas( 0) ir antras įrašas( 2) reiškia 2:00.Trečias-penktasis įrašas( *) reiškia bet kurį dienos, mėnesio ar savaitės laiką.Paskutinis įrašas yra wget komanda, norint atsisiųsti wget.pdf iš nurodyto URL.

Tai yra wget pagrindas ir kaip veikia Cron. Paimkime nelaisvę realiu gyvenimo pavyzdžiu, kaip planuoti atsisiuntimą.

planavimas Atsisiųskite

Mes atsisiųsime "Firefox 3.6" 2 val. Kadangi mūsų interneto tiekėjas pateikia tik tam tikrą duomenų kiekį, mes turime atsisakyti atsisiųsti 8 val.Štai kaip atrodo įrenginys.

Ignoruoti pirmuosius 2 įrašus aukščiau esančiame crontab. Trečioji ir ketvirta komanda yra tik 2 komandos, kurias jums reikia. Trečioji komanda sukonfigūruoja užduotį, kuri bus atsisiųsti "Firefox" 2 val.:

[kodas]
0 2 * * * wget-c http: //download.mozilla.org/? Product = firefox-3.6.6 & os = win & lang = lt-GB
[/ code]

Parinktys -c rodo, kad wget turi atnaujinti esamą atsisiuntimą, jei jis dar nebuvo baigtas.

Ketvirtoji komanda nustos wget 8 val."Killall" yra unix komanda, kuri nužudo procesus pagal pavadinimą.

[code]
0 8 * * * killall wget
[/ code]

"killall wget" pasakoja Ubuntui, norėdamas sustabdyti "wget" nuo failo atsisiuntimo 8 val.

Kitos naudingos wget komandos

1. Katalogo nustatymas, norint atsisiųsti failą

[kodas]
wget -output-document = /home/zainul/Downloads/ wget manual.pdf http: //www.gnu.org/software/wget/manual/ wget.pdf
[/ code]

parinktis-išvesties dokumentas leidžiajūs nurodote katalogą ir failo pavadinimą, kurį atsisiųstėte

2. Puslapio atsisiuntimas

wget taip pat gali atsisiųsti svetainę.

[kodas]
wget-m http: //www.google.com/profiles/ zainul.franciscus
[/ code]

Pirmiau nurodyta komanda atsisiųs visą mano "Google" profilio tinklalapį.Parinktis "-m" nurodo, kad "wget" atsisiųs "nurodytą URL" vaizdą "veidrodis".

Kita svarbi galimybė yra pasakyti wget, kiek nuorodų turėtų būti, kai atsisiųsite svetainę.

[kodas]
wget -r -l1 http: //www.google.com/profiles/ zainul.franciscus
[/ code]

Pirmiau aprašyta wget komanda naudoja dvi parinktis. Pirmasis variantas "-r" nurodo wget atsisiųsti nurodytą svetainę rekursiškai. Antrasis variantas "-l1" nurodo "wget" tik gauti pirmojo lygio nuorodas iš nurodytos svetainės. Mes galime nustatyti iki trijų lygių "-l2" ir "-l3".

3. Nepageidaujamas robotas įrašas

žiniatinklio tvarkyklė palaiko teksto failą Robot.txt."Robot.txt" palaiko URL adresą, kurį interneto naršyklė, pvz., Wget, neturėtų nuskaityti. Mes galime pasakyti, kad wget ignoruoja "Robot.txt" su parinktimi "-erobots = off".Šioje komandoje "wget" nurodoma atsisiųsti pirmąjį mano "Google" profilio puslapį ir ignoruoti "Robot.txt".

[kodas]
wget -erobots = išjungti http: //www.google.com/profiles/ zainul.franciscus
[/ code]

Kita naudinga parinktis yra -U.Ši parinktis pakeis wget naršykle. Atkreipkite dėmesį, kad maskavimas programos, kaip kitos programos, gali pažeisti interneto paslaugų teikėjo terminą ir paslaugą.

[code]
wget -erobots = off-U Mozilla http: //www.google.com/profiles/ zainul.franciscus
[/ code]

Išvada

Wget - tai labai senoji, bet hackable GNU programinės įrangos paketas, kurį galime naudoti failams atsisiųsti. Wget yra interaktyvus komandų eilutės įrankis, kuris reiškia, kad mes galime paleisti jį kompiuteryje fone, nereikalaujant paleisti jokios programos. Patikrinkite wget meno puslapį

[code]
$ man wget
[/ code]

, kad suprastumėte kitas parinktis, kurias galime naudoti su wget.

Nuorodos

Wget vadovas
Kaip sujungti du atsiųstus failus, kai wget neveikia pusiau per
Linux QuickTip: atsisiunčiama ir išjungiama vienu etapu