12Sep

Bouw een downloadschema met weinig programmeervaardigheden

We houden er allemaal van om dingen van internet te downloaden en er zijn enorm veel geweldige downloadmanager-tools die we kunnen gebruiken om onze downloads te plannen. Het is misschien eenvoudiger om een ​​downloadbeheerder te gebruiken, maar het is niet schadelijk om de tools te verkennen die al bij onze Ubuntu horen en deze volledig te gebruiken.

In dit artikel laten we je een ingebouwde software zien in Ubuntu die we kunnen gebruiken om dingen van internet te downloaden met wget .Bovendien laten we u zien hoe u de download plant met Cron.

Downloaden met Wget

Wget is een gratis softwarepakket voor het ophalen van bestanden met HTTP, HTTPS en FTP, de meest gebruikte internetprotocollen. Het is een niet-interactieve opdrachtregelhulpprogramma, dus het kan gemakkelijk worden aangeroepen vanuit scripts, cron-taken, terminals zonder X-Windows-ondersteuning, enz.

Open uw terminal en laten we onderzoeken hoe we wget kunnen gebruiken om dingen van het net te downloaden. De basissyntaxis van downloaden met wget is de volgende:

wget [optie]. .. [URL]. ..

Deze opdracht zal de wget-handleiding downloaden naar uw lokale schijf

wget http: //www.gnu.org/software/wget/manual/ wget.pdf

Linux Cron

Ubuntu wordt geleverd met een crondaemon gebruikt voor het plannen van taken die op een bepaald moment moeten worden uitgevoerd. Met Crontab kunt u acties en tijdstippen opgeven waarop ze moeten worden uitgevoerd. Dit is hoe u een taak normaal zou plannen met behulp van de opdrachtregel.

Open een terminalvenster en voer crontab -e in.

Elk van de secties in een crontab wordt gescheiden door een spatie, waarbij het laatste gedeelte een of meer spaties bevat. Een cron-invoer bestaat uit minuten( 0-59), uur( 0-23, 0 = middernacht), dag( 1-31), maand( 1-12), weekdag( 0-6, 0 = zondag), opdracht. De derde invoer in het bovenstaande crontab downloadt wget.pdf om 2 uur 's ochtends. De eerste invoer( 0) en de tweede invoer( 2) betekent 2:00.Het derde tot en met het vijfde item( *) betekent elk tijdstip van de dag, maand of week. De laatste invoer is de wget-opdracht om wget.pdf te downloaden van de opgegeven URL.

Dat is de basis op wget en hoe Cron werkt. Laten we een buit maken voor een realistisch voorbeeld van hoe je een download plant.

Planning Downloaden

We gaan Firefox 3.6 om 2 uur 's ochtends downloaden. Omdat onze ISP maar een beperkte hoeveelheid gegevens geeft, moeten we de download om 8 uur stoppen. Dit is hoe de installatie eruit ziet.

Negeer de eerste 2 vermeldingen in bovenstaande crontab. Het derde en vierde commando zijn de enige 2 bevelen die je nodig hebt. Het derde commando stelt een taak in die Firefox om 2 uur 's ochtends zal downloaden:

[code]
0 2 * * * wget -c http: //download.mozilla.org/? Product = firefox-3.6.6 & os = win & lang = en-GB
[/ code]

De -c opties geven aan dat wget de bestaande download moet hervatten als deze nog niet is voltooid.

Het vierde commando stopt wget om 8 uur.'Killall' is een unix-opdracht die processen op naam doodt.

[code]
0 8 * * * killall wget
[/ code]

De killall-wget vertelt Ubuntu om wget te stoppen om het bestand om 8 uur 's ochtends te downloaden.

Andere nuttige wget-opdrachten

1. De map opgeven om een ​​bestand te downloaden

[code]
wget -output-document = /home/zainul/Downloads/ wget manual.pdf http: //www.gnu.org/software/wget/manual/ wget.pdf
[/ code]

de optie -output-document laatu geeft de map en de naam op van het bestand dat u downloadt

2. Een website downloaden

wget is ook in staat om een ​​website te downloaden.

[code]
wget -m http: //www.google.com/profiles/ zainul.franciscus
[/ code]

Met de opdracht hierboven wordt mijn volledige webpagina met google profielen gedownload. De optie '-m' vertelt wget om een ​​'spiegelbeeld' van de opgegeven URL te downloaden.

Een andere belangrijke optie is om Wget te vertellen hoeveel links het moet volgen wanneer het een website downloadt.

[code]
wget -r -l1 http: //www.google.com/profiles/ zainul.franciscus
[/ code]

Het bovenstaande wget-commando gebruikt twee opties. De eerste optie '-r' vertelt wget om de gespecificeerde website recursief te downloaden. De tweede optie '-l1' vertelt wget om alleen het eerste niveau van links van die gespecificeerde website te krijgen. We kunnen maximaal drie niveaus '-l2' en '-l3' instellen.

3. Robotinvoer negeren

Webmaster onderhoudt een tekstbestand met de naam Robot.txt.'Robot.txt' onderhoudt een lijst met URL's die een webcrawler zoals wget niet mag crawlen. We kunnen WLT vertellen om de 'Robot.txt' met de optie '-erobots = uit' te negeren. Het volgende commando vertelt wget om de eerste pagina van mijn google profiel te downloaden en de 'Robot.txt' te negeren.

[code]
wget -erobots = uit http: //www.google.com/profiles/ zainul.franciscus
[/ code]

Een andere nuttige optie is -U.Deze optie maskeert wget als een browser. Houd er rekening mee dat het maskeren van een toepassing als een andere toepassing mogelijk de voorwaarden en service van een webserviceprovider schendt.

[code]
wget -erobots = off -U Mozilla http: //www.google.com/profiles/ zainul.franciscus
[/ code]

Conclusie

Wget is een heel oud en toch hackbaar GNU-softwarepakket dat we kunnen gebruiken om bestanden te downloaden. Wget is een interactieve opdrachtregelhulpprogramma, wat betekent dat we het op de achtergrond op onze computer kunnen laten werken zonder een toepassing te hoeven starten. Bekijk de wget man-pagina

[code]
$ man wget
[/ code]

om andere opties te begrijpen die we met wget kunnen gebruiken.

Koppelingen

Wget Handleiding
Twee gedownloade bestanden combineren wanneer wget mislukt Halverwege
Linux QuickTip: downloaden en niet-targeten in één stap