12Sep

Rakenna Download Scheduler pienellä ohjelmointitaito

Me kaikki rakastamme ladata tavaraa internetistä, ja hyviä latausjohtajan työkaluja löytyy paljon, joita voimme käyttää latausten aikatauluun. Latausjohtajan käyttö saattaa olla helpompaa, mutta ei ole haittaa Ubuntun mukana tulevien työkalujen tutkimisessa ja sen hyödyntämisessä.

Tässä artikkelissa näytämme sisäänrakennetun Ubuntun ohjelmiston, jonka avulla voimme ladata juttuja internetistä wget : n avulla. Tämän lisäksi näytämme sinulle, kuinka aikataulun lataaminen Cronilla on.

Lataa Wget

-ohjelmiston avulla Wget on ilmainen ohjelmistopaketti tiedostojen hakemiseen HTTP-, HTTPS- ja FTP-palvelimilla, yleisimpiä Internet-protokollia. Se on ei-interaktiivinen komentorivityökalu, joten sitä voi helposti kutsua komentosarjoilta, cron-töistä, päätteistä ilman X-Windows-tukea jne.

Avaa päätelaitteesi ja tutkia, miten voimme käyttää wget ladata tavaraa verkosta. Latauksen peruskäsikirja wgetin kanssa on seuraava:

wget [option]. .. [URL]. ..

Tämä komento lataa wget-käsikirjan paikalliseen asemaan

wget http: //www.gnu.org/software/wget/manual/ wget.pdf

Linux Cron

Ubuntu mukana crondaemonia, jota käytetään aikataulujen suorittamiseen tiettyyn aikaan. Crontabin avulla voit määrittää toimet ja ajat, joiden aikana ne on suoritettava. Näin teet normaalisti tehtävän suorittamisen komentorivityökalulla.

Avaa päätelaite ja syötä crontab -e.

Kukin crontabin osista erottaa välilyönti, jossa viimeinen osa sisältää yhden tai useamman tilan. Cron-merkintä koostuu minuutista( 0-59), tunnit( 0-23, 0 = keskiyö), päivä( 1-31), kuukausi( 1-12), arkipäivä( 0-6, 0 = sunnuntai).Kolmannen merkinnän edellä crontab lataa wget.pdf klo 2 am. Ensimmäinen merkintä( 0) ja toinen merkintä( 2) merkitsevät 2:00.Kolmannen viidennen merkinnän( *) tarkoittaa päivämäärää, kuukautta tai viikkoa. Viimeinen merkintä on wget-komento ladata wget.pdf määritetystä URL-osoitteesta.

Tämä on perustana wgetille ja miten Cron toimii. Otetaan ryöstö todellisessa esimerkissä aikataulun lataamisesta.

Ajoitus Lataa

Aiomme ladata Firefox 3.6 klo 2 AM. Koska meidän palveluntarjoaja antaa vain rajallisen määrän tietoja, meidän täytyy lopettaa lataus klo 8 AM.Tämä on asennus näyttää.

Ohita ensimmäiset 2 merkinnät edellä crontab. Kolmas ja neljäs komento ovat vain 2 komentoa, joita tarvitset. Kolmas komento asentaa tehtävän, joka lataa Firefoxin kello 2:

[koodi]
0 2 * * * wget -c http: //download.mozilla.org/? Product = firefox-3.6.6 & os = win & lang = fi-FI
[/ code]

-c-vaihtoehdolla tarkoitetaan, että wgetin pitäisi jatkaa olemassa olevaa latausta, ellei sitä ole suoritettu.

Neljäs komento lopettaa wgetin klo 8.00.'Killall' on unix-komento, joka tappaa prosessit nimen mukaan.

[code]
0 8 * * * killall wget
[/ code]

killall wget kertoo Ubuntun lopettamasta wgetin lataamasta tiedostoa kello 8.00.

Muita käyttökelpoisia wget-komentoja

1.

: n hakemiston määrittäminen

wget -output-document = /home/zainul/Downloads/ wget manual.pdf http: //www.gnu.org/software/wget/manual/ wget.pdf

-vaihtoehto -output-dokumentti antaamäärität

: n lataamasi tiedoston hakemiston ja nimen. 2. Ladataan verkkosivusto

wget myös lataa verkkosivuston.

[koodi]
wget -m http: //www.google.com/profiles/ zainul.franciscus
[/ code]

Edellä mainittu komento lataa koko google-profiilisivuni. Vaihtoehdolla "-m" kerrotaan, että wget lataa "peilikuva" määritetystä URL-osoitteesta.

Toinen tärkeä vaihtoehto on kertoa wget kuinka monta linkkiä se pitäisi noudattaa, kun se lataa verkkosivuilla.

[koodi]
wget -r -l1 http: //www.google.com/profiles/ zainul.franciscus
[/ code]

Yllä oleva wget-komento käyttää kahta vaihtoehtoa. Ensimmäinen vaihtoehto "-r" kertoo, että wget lataa tietyn sivuston rekursiivisesti. Toinen vaihtoehto "-l1" kertoo, että wget saa vain ensimmäisen sivun tason kyseisestä verkkosivustosta. Voimme asettaa kolme tasoa "-l2" ja "-l3".

3. Robottien sisääntulon puuttuminen

Web-päällikön ylläpitää tekstitiedostoa nimeltä Robot.txt.'Robot.txt' ylläpitää luettelon URL-osoitteista, joita WWW-sivun indeksointirobotti, kuten wget, ei pitäisi indeksoida. Voimme kertoa wgetille, että "Robot.txt" jätetään huomiotta "-erobots = off" -vaihtoehdolla. Seuraava komento kertoo wgetille, että lataan google-profiilin en- simmäisen sivun ja jätän Robot.txt-sivun.

[koodi]
wget -erobots = pois http: //www.google.com/profiles/ zainul.franciscus
[/ code]

Toinen hyödyllinen vaihtoehto on -U.Tämä vaihtoehto peittää wgetin selaimena. Huomaa, että sovelluksen peittäminen muuksi sovellukseksi saattaa rikkoa verkkopalvelujen tarjoajan termiä ja palvelua.

[koodi]
wget -erobots = off -U Mozilla http: //www.google.com/profiles/ zainul.franciscus
[/ code]

Johtopäätös

Wget on hyvin vanha koulu vielä hakkeroiva GNU-ohjelmistopaketti, jota voimme ladata tiedostoja. Wget on vuorovaikutteinen komentorivityökalu, joka tarkoittaa, että voimme antaa sen käydä tietokoneessamme taustalla tarvitsematta käynnistää mitään sovellusta. Katso wget-man sivua

[koodi]
$ man wget
[/ code]

ymmärtää muut vaihtoehdot, joita voimme käyttää wgetin kanssa.

Linkit

Wget Manuaalinen
Kuinka yhdistää kaksi ladattua tiedostoa, kun wget epäonnistuu puolivälissä
Linux QuickTip: lataaminen ja purkaminen yhdellä askeleella