12Sep
Mēs visi mīlam lejupielādēt sīkumus no interneta, un ir liels lejupielādes pārvaldnieku rīku krājums, ko mēs varam izmantot, lai ieplānotu mūsu lejupielādes. Iespējams, ka būs vieglāk izmantot lejupielādes pārvaldnieku, taču nav ļauna izpētīt instrumentus, kas jau nāk ar mūsu Ubuntu, un pilnībā izmantot to.
Šajā rakstā mēs parādīsim Ubuntu iebūvētu programmatūru, ko mēs varam izmantot, lai lejupielādētu saturu no interneta, izmantojot wget .Papildus tam mēs parādīsim, kā plānot lejupielādi, izmantojot Cron.
Lejupielādēt, izmantojot Wget
Wget ir bezmaksas programmatūras pakotne failu ielādei, izmantojot HTTP, HTTPS un FTP, visplašāk izmantotos interneta protokolus. Tas ir neinteraktīvs komandrindas rīks, tāpēc to var viegli izsaukt no skriptiem, cron darbiem, termināļiem bez X-Windows atbalsta u.tml.
Atveriet savu termināli un ļaujiet mums izpētīt, kā mēs varam izmantot wget, lai sīkumi no tīkla tiktu lejupielādēti. Lejupielādes pamattekstax ar wget ir šāda:
wget [opcija]. .. [URL]. ..
Šī komanda lejupielādēs wget rokasgrāmatu vietējā diskā
wget http: //www.gnu.org/software/wget/manual/ wget.pdf
Linux Cron
Ubuntu nāk ar crondaemon, ko izmanto uzdevumu plānošanai noteiktā laikā.Crontab ļauj jums norādīt darbības un laiku, kad tie būtu jāizpilda. Tas, kā jūs parasti uzdevumu plānojat, izmantojot komandrindas rīku.
Atveriet termināla logu un ievadiet crontab -e.
Katru no crontab sadaļām atdala atstarpe, bet pēdējā sadaļā ir viena vai vairākas atstarpes tajā.Cron ieraksts sastāv no minūtes( 0-59), stundas( 0-23, 0 = pusnakts), diena( 1-31), mēnesis( 1-12), darba dienas( 0-6, 0 = svētdiena), komanda. Trešais ieraksts iepriekš crontab lejupielādē wget.pdf plkst. 2:00.Pirmais ieraksts( 0) un otrais ieraksts( 2) nozīmē 2:00.Trešā līdz piektajā ierakstā( *) apzīmē jebkuru dienu, mēnesi vai nedēļu. Pēdējais ieraksts ir wget komanda, lai lejupielādētu wget.pdf no norādītā URL.
Tas ir pamata par wget un kā darbojas Cron. Uzņemsim laupījumu par īstu dzīves piemēru, kā plānot lejupielādi.
plānošana Lejupielādēt
Mēs gatavojamies lejupielādēt Firefox 3.6 2 AM. Tā kā mūsu ISP sniedz tikai ierobežotu datu apjomu, mums jāpārtrauc lejupielāde 8:00.Tas ir iestatījums.
Ignorēt pirmos 2 ierakstus iepriekš crontab. Trešā un ceturtā komanda ir tikai 2 nepieciešamās komandas. Trešā komanda iestatīs uzdevumu, kas Firefox ielādēs plkst. 2:00:
[kods]
0 2 * * * wget -c http: //download.mozilla.org/? Product = firefox-3.6.6 & os = win & lang = lv-GB
[/ code]
-c opcijas norāda, ka wget ir jāatjauno esošā lejupielāde, ja tā nav pabeigta.
Ceturtā komanda pārtrauks Wget plkst. 8:00."Killall" ir unix komanda, kas nogalina procesus pēc nosaukuma.
[kods]
0 8 * * * killall wget
[/ code]
Killage wget stāsta Ubuntu, lai apturētu wget no faila lejupielādes 8:00.
Citas noderīgas wget komandas
1. Noteikt direktoriju, lai lejupielādētu failu
[kods]
wget-iziet-document = /home/zainul/Downloads/ wget manual.pdf http: //www.gnu.org/software/wget/manual/ wget.pdf
[/ code]
opcija -izlaides dokuments ļaujjūs norādāt direktoriju un faila nosaukumu, kuru lejupielādējāt
2. Vietnes lejupielāde
wget ir arī iespējams lejupielādēt vietni.
[kods]
wget-m http: //www.google.com/profiles/ zainul.franciscus
[/ code]
Iepriekš minētā komanda lejupielādēs visu manu Google profila tīmekļa lapu. Opcija "-m" norāda, ka wget lejupielādē norādīto URL spoguļattēlu.
Vēl viena svarīga iespēja ir pateikt wget, cik daudz saites vajadzētu notikt, lejupielādējot vietni.
[kods]
wget -r -l1 http: //www.google.com/profiles/ zainul.franciscus
[/ code]
Iepriekš minētā wget komanda izmanto divas opcijas. Pirmā opcija '-r' norāda, ka wget lejupielādē norādīto vietni rekursīvi. Otrā opcija "-l1" norāda, ka wget iegūst tikai pirmo saišu līmeni no minētās norādītās vietnes. Mēs varam iestatīt līdz trim līmeņiem "-l2" un "-l3".
3. Ignorējot robotu ierakstu
Web master saglabā teksta failu ar nosaukumu Robot.txt.'Robot.txt' saglabā URL sarakstu, kuru nevar pārmeklēt tādai tīmekļa pārmeklēšanai kā wget. Mēs varam pateikt, ka wget ignorē 'Robot.txt' ar opciju '-erobots = off'.Tālāk norādītā komanda saka, ka wget lejupielādē manu Google profila pirmo lapu un ignorē "Robot.txt".
[kods]
wget -erobots = izslēgts http: //www.google.com/profiles/ zainul.franciscus
[/ code]
Vēl viena noderīga iespēja ir -U.Šī opcija maskē wget kā pārlūku.Ņem vērā, ka, aizklājot pieteikumu kā citu lietojumprogrammu, var tikt pārkāpts tīmekļa pakalpojumu sniedzēja termins un pakalpojums.
[kods]
wget -erobots = off-U Mozilla http: //www.google.com/profiles/ zainul.franciscus
[/ code]
Secinājums
Wget ir ļoti vecs, bet hackable GNU programmatūras pakotne, ko mēs varam izmantot, lai lejupielādētu failus. Wget ir interaktīvs komandrindas rīks, kas nozīmē, ka mēs varam palaist to savā datorā fonā, neuzstādot nevienu pieteikumu. Apskatiet wget man lapu
[code]
$ man wget
[/ code]
, lai saprastu citas opcijas, kuras mēs varam izmantot ar wget.
saites
Wget rokasgrāmata
Kā apvienot divus lejupielādētos failus, kad wget neizdodas pāriet caur
Linux QuickTip: lejupielāde un vienlaicīga atrašana vienā posmā