12Sep

Byg en Download Scheduler med lidt programmering færdighed

Vi elsker alle at downloade ting fra internettet, og der er masser af gode downloadhåndteringsværktøjer, som vi kan bruge til at planlægge vores downloads. Det kan bare være nemmere at bruge en download manager, men der er ingen skade i at udforske de værktøjer, der allerede kommer med vores Ubuntu og udnytte det fuldt ud.

I denne artikel vil vi vise dig en indbygget software i Ubuntu, som vi kan bruge til at downloade ting fra internettet ved hjælp af wget .Derudover vil vi vise dig, hvordan du planlægger downloaden ved hjælp af Cron.

Download Brug Wget

Wget er en gratis softwarepakke til hentning af filer ved hjælp af HTTP, HTTPS og FTP, de mest anvendte internetprotokoller. Det er et ikke-interaktivt kommandolinjeværktøj, så det kan nemt kaldes fra scripts, cron-job, terminaler uden X-Windows-support osv.

Åbn din terminal og lad os undersøge, hvordan vi kan bruge wget til at downloade ting fra nettet. Den grundlæggende syntaks for downloading med wget er følgende:

wget [option]. .. [URL]. ..

Denne kommando vil downloade wget manualen til dit lokale drev

wget http: //www.gnu.org/software/wget/manual/ wget.pdf

Linux Cron

Ubuntu leveres med en crondaemon bruges til planlægning af opgaver, der skal udføres på et bestemt tidspunkt. Crontab giver dig mulighed for at angive handlinger og tider, som de skal udføres. Sådan planlægger du normalt en opgave ved hjælp af kommandolinjeværktøjet.

Åbn et terminalvindue og indtast crontab -e.

Hver af sektionerne i en crontab er adskilt af et mellemrum, hvor den sidste sektion har et eller flere mellemrum i den. En cron indtastning består af minut( 0-59), time( 0-23, 0 = midnat), dag( 1-31), måned( 1-12), hverdag( 0-6, 0 = søndag), kommando. Den tredje post i ovenstående crontab downloads wget.pdf kl 2.Første indgang( 0) og anden indgang( 2) betyder 2:00.Den tredje til den femte post( *) betyder enhver tid på dagen, måneden eller ugen. Den sidste post er wget-kommandoen for at downloade wget.pdf fra den angivne webadresse.

Det er det grundlæggende på wget og hvordan Cron virker. Lad os tage et løfte på et rigtigt livs eksempel på, hvordan du planlægger en download.

Planlægning Download

Vi skal downloade Firefox 3.6 klokken 2. Da vores internetudbyder kun giver en begrænset mængde data, skal vi stoppe overførslen klokken 8.Sådan ser opsætningen ud.

Ignorer de første 2 poster i ovenstående crontab. Den tredje og fjerde kommando er de eneste 2 kommandoer, du har brug for. Den tredje kommando opsæt en opgave, der downloader Firefox klokken 2:

[kode]
0 2 * * * wget -c http: //download.mozilla.org/? Product = firefox-3.6.6 & os = win & lang = da-GB
[/ kode]

De-c indstillinger angiver, at wget skal genoptage den eksisterende download, hvis den ikke er afsluttet.

Den fjerde kommando stopper wget klokken 8.'Killall' er en unix-kommando, der dræber processer ved navn.

[kode]
0 8 * * * killall wget
[/ kode]

Killall wget fortæller Ubuntu at stoppe wget fra at downloade filen klokken 8 AM.

Andre nyttige wget-kommandoer

1. Angivelse af mappen for at hente en fil

[kode]
wget -output-document = /home/zainul/Downloads/ wget manual.pdf http: //www.gnu.org/software/wget/manual/ wget.pdf
[/ kode]

indstillingen option -output-dokument laderdu angiver mappen og navnet på den fil, du downloader

2. Downloadning af et websted

wget kan også downloade et websted.

[kode]
wget -m http: //www.google.com/profiles/ zainul.franciscus
[/ kode]

Ovennævnte kommando downloader hele min google profil webside. Alternativet '-m' fortæller wget at downloade et 'spejl' billede af den angivne webadresse.

En anden vigtig mulighed er at fortælle wget, hvor mange links der skal følge, når den downloader et websted.

[kode]
wget -r -l1 http: //www.google.com/profiles/ zainul.franciscus
[/ kode]

Den ovennævnte wget-kommando bruger to muligheder. Den første mulighed '-r' fortæller wget at downloade den angivne hjemmeside rekursivt. Den anden mulighed '-l1' fortæller wget at kun få det første niveau af links fra den angivne hjemmeside. Vi kan indstille op til tre niveauer '-l2' og '-l3'.

3. Ignorerer robot entry

Webmaster vedligeholder en tekstfil kaldet Robot.txt.'Robot.txt' vedligeholde en liste over webadresser, som en websidercrawler som wget ikke skal gennemgå.Vi kan fortælle wget at ignorere 'Robot.txt' med '-erobots = off' indstillingen. Følgende kommando fortæller wget at downloade den første side i min google-profil og ignorere 'Robot.txt.

[kode]
wget -erobots = fra http: //www.google.com/profiles/ zainul.franciscus
[/ kode]

En anden nyttig mulighed er -U.Denne indstilling vil maskere wget som en browser. Bemærk, at maskering af et program, da en anden applikation kan krænke en webudbyders betegnelse og service.

[kode]
wget -erobots = off -U Mozilla http: //www.google.com/profiles/ zainul.franciscus
[/ kode]

Konklusion

Wget er en meget gammel skole, men endnu en hackbar GNU-softwarepakke, som vi kan bruge til at downloade filer. Wget er et interaktivt kommandolinjeværktøj, hvilket betyder at vi kan lade det køre på vores computer i baggrunden uden at skulle starte nogen applikation. Tjek wget man siden

[kode]
$ man wget
[/ kode]

for at forstå andre muligheder, som vi kan bruge med wget.

Links

Wget Manual
Sådan kombineres to downloadede filer Når wget fejler halvvejs igennem
Linux QuickTip: Download og un-tarring i et trin