12Sep

Bygg en nedladdningscheduler med lite programmeringsförmåga

click fraud protection

Vi älskar alla att ladda ner saker från internet, och det finns massor av bra verktyg för nedladdningshantering som vi kan använda för att schemalägga våra nedladdningar. Det kan bara vara lättare att använda en nedladdningshanterare, men det är ingen skada att utforska verktygen som redan finns med vår Ubuntu och utnyttja den fullt ut.

I den här artikeln visar vi dig en inbyggd programvara i Ubuntu som vi kan använda för att ladda ner saker från internet med wget .Dessutom kommer vi att visa hur du schemalägger nedladdningen med Cron.

Ladda ner Använda Wget

Wget är ett gratis programvarupaket för att hämta filer med HTTP, HTTPS och FTP, de mest använda Internetprotokollen. Det är ett icke-interaktivt kommandoradsverktyg, så det kan enkelt ringas från skript, cron-jobb, terminaler utan X-Windows-support etc.

Öppna din terminal och låt oss undersöka hur vi kan använda wget för att ladda ner saker från nätet. Den grundläggande syntaxen för nedladdning med wget är följande:

instagram viewer

wget [option]. .. [URL]. ..

Detta kommando kommer att hämta wget manualen till din lokala enhet

wget http: //www.gnu.org/software/wget/manual/ wget.pdf

Linux Cron

Ubuntu kommer med en crondaemon som används för schemaläggning av uppgifter som ska utföras vid en viss tidpunkt. Med Crontab kan du ange åtgärder och tider som de ska utföras. Så här planerar du normalt en uppgift med kommandoradsverktyget.

Öppna ett terminalfönster och ange crontab -e.

Var och en av sektionerna i en crontab är åtskild av ett mellanslag, varvid den sista sektionen har ett eller flera utrymmen i den. En cron-post består av minut( 0-59), timme( 0-23, 0 = midnatt), dag( 1-31), månad( 1-12), veckodag( 0-6, 0 = söndag), kommando. Den tredje posten i ovanstående crontab nedladdningar wget.pdf kl 2.Den första posten( 0) och den andra posten( 2) betyder 2:00.Den tredje till den femte posten( *) betyder vilken tid på dagen, månaden eller veckan som helst. Den sista posten är wget-kommandot för att hämta wget.pdf från den angivna webbadressen.

Det är grundläggande på wget och hur Cron fungerar. Låt oss ta en loot i ett verkligt livsexempel på hur du schemalägger en nedladdning.

Schemaläggning Hämta

Vi ska ladda ner Firefox 3.6 kl 2. Eftersom vår ISP endast ger en begränsad mängd data måste vi stoppa nedladdningen klockan 8.Så här ser inställningen ut.

Ignorera de första 2 inmatningarna i ovanstående crontab. Det tredje och fjärde kommandot är de enda 2 kommandon som du behöver. Den tredje kommandot installerar en uppgift som laddar ner Firefox klockan 2:

[kod]
0 2 * * * wget -c http: //download.mozilla.org/? Product = firefox-3.6.6 & os = win & lang = sv-SE
[/ code]

-c alternativen anger att wget ska återuppta befintlig nedladdning om den inte har slutförts.

Det fjärde kommandot kommer att stoppa wget kl 8.'Killall' är ett unix-kommando som dödar processer med namn.

[kod]
0 8 * * * killall wget
[/ code]

Killall wget berättar Ubuntu att stoppa wget från att ladda ner filen vid 8 AM.

Andra användbara wget-kommandon

1. Ange katalogen för att hämta en fil

[kod]
wget -output-document = /home/zainul/Downloads/ wget manual.pdf http: //www.gnu.org/software/wget/manual/ wget.pdf
[/ code]

alternativet -output-dokumentet låterdu anger katalogen och namnet på filen som du hämtar

2. Ladda ner en webbplats

wget kan också ladda ner en webbplats.

[kod]
wget -m http: //www.google.com/profiles/ zainul.franciscus
[/ code]

Ovanstående kommando laddar ner min hela google profil webbsida. Alternativet '-m' berättar wget att ladda ner en 'spegel' -bild av den angivna webbadressen.

Ett annat viktigt alternativ är att berätta wget hur många länkar som ska följas när den laddar ner en webbplats.

[kod]
wget -r -l1 http: //www.google.com/profiles/ zainul.franciscus
[/ code]

Ovannämnda wget-kommando använder två alternativ. Det första alternativet '-r' berättar att wget hämtar den angivna webbplatsen rekursivt. Det andra alternativet '-l1' berättar att wget bara får den första nivån på länkar från den angivna webbplatsen. Vi kan ställa upp till tre nivåer '-l2' och '-l3'.

3. Ignorera robotinmatning

Webmaster behåller en textfil som heter Robot.txt."Robot.txt" behåller en lista med URL som en webbläsare som wget inte ska genomsöka. Vi kan berätta för wget att ignorera alternativet 'Robot.txt' med '-erobots = av'.Följande kommando berättar wget att ladda ner den första sidan i min google-profil och ignorera "Robot.txt.

[kod]
wget -erobots = av http: //www.google.com/profiles/ zainul.franciscus
[/ code]

Ett annat användbart alternativ är -U.Det här alternativet kommer att maskera wget som en webbläsare. Observera att maskering av ett program som en annan applikation kan bryta mot en tjänsteleverantörs term och tjänst.

[kod]
wget -erobots = av -U Mozilla http: //www.google.com/profiles/ zainul.franciscus
[/ code]

Slutsats

Wget är en mycket gammal skola men fortfarande hackbar GNU-mjukvarupaket som vi kan använda för att ladda ner filer. Wget är ett interaktivt kommandoradsverktyg som innebär att vi kan låta det springa på vår dator i bakgrunden utan att behöva starta någon applikation. Kolla in wget man sidan

[code]
$ man wget
[/ code]

för att förstå andra alternativ som vi kan använda med wget.

Länkar

Wget Manual
Så här kombinerar du två nedladdade filer När wget misslyckas halvvägs genom
Linux QuickTip: Hämtning och un-tarring i ett steg