12Sep
Nous aimons tous télécharger des choses sur Internet, et il existe de nombreux outils de gestion de téléchargement que nous pouvons utiliser pour planifier nos téléchargements. Il pourrait être plus facile d'utiliser un gestionnaire de téléchargement, mais il n'y a aucun mal à explorer les outils qui sont déjà fournis avec Ubuntu et à en tirer pleinement parti.
Dans cet article, nous allons vous montrer un logiciel intégré dans Ubuntu que nous pouvons utiliser pour télécharger des choses sur Internet en utilisant wget .En plus de cela, nous allons vous montrer comment planifier le téléchargement en utilisant Cron.
Télécharger Utiliser Wget
Wget est un logiciel gratuit pour récupérer des fichiers en utilisant HTTP, HTTPS et FTP, les protocoles Internet les plus utilisés. C'est un outil de ligne de commande non interactif, donc il peut facilement être appelé depuis des scripts, des tâches cron, des terminaux sans support X-Windows, etc.
Ouvrez votre terminal et expliquons comment utiliser wget pour télécharger des choses sur le net. La syntaxe de base du téléchargement avec wget est la suivante:
wget [option]. .. [URL]. ..
Cette commande va télécharger le manuel wget dans votre lecteur local
wget http: //www.gnu.org/software/wget/manual/ wget.pdf
Linux Cron
Ubuntu est livré avec un crondémon utilisé pour planifier les tâches à exécuter à un certain moment. Crontab vous permet de spécifier les actions et les heures auxquelles elles doivent être exécutées. C'est ainsi que vous planifiez normalement une tâche à l'aide de l'outil de ligne de commande.
Ouvrez une fenêtre de terminal et entrez crontab -e.
Chacune des sections d'une crontab est séparée par un espace, la section finale contenant un ou plusieurs espaces. Une entrée de cron est composée de la commande de minutes( 0-59), d'heures( 0-23, 0 = minuit), de jours( 1-31), de mois( 1-12), de jours de semaine( 0-6, 0 = dimanche).La troisième entrée dans le crontab ci-dessus télécharge wget.pdf à 2 heures du matin. La première entrée( 0) et la deuxième entrée( 2) signifient 2:00.La troisième à la cinquième entrée( *) signifie n'importe quelle heure du jour, du mois ou de la semaine. La dernière entrée est la commande wget pour télécharger le fichier wget.pdf à partir de l'URL spécifiée.
C'est la base sur wget et comment fonctionne Cron. Prenons un butin sur un exemple réel sur la façon de planifier un téléchargement.
Scheduling Télécharger
Nous allons télécharger Firefox 3.6 à 2 heures du matin. Puisque notre fournisseur de services Internet ne donne qu'une quantité limitée de données, nous devons arrêter le téléchargement à 8 heures du matin. C'est à quoi ressemble l'installation.
Ignorez les 2 premières entrées dans la crontab ci-dessus. Les troisième et quatrième commandes sont les deux seules commandes dont vous avez besoin. La troisième commande configure une tâche qui télécharge Firefox à 2 heures du matin:
[code]
0 2 * * * wget -c http: //download.mozilla.org/? Produit = firefox-3.6.6 & os = win & lang = fr-FR
[/ code]
Les options -c indiquent que wget devrait reprendre le téléchargement existant s'il n'est pas terminé.
La quatrième commande arrêtera wget à 8 heures.'Killall' est une commande unix qui tue les processus par leur nom.
[code]
0 8 * * * killall wget
[/ code]
Le killall wget dit à Ubuntu d'arrêter wget de télécharger le fichier à 8 heures du matin.
Autres commandes wget utiles
1. Spécification du répertoire pour télécharger un fichier
[code]
wget -output-document = /home/zainul/Downloads/ wget manuel.pdf http: //www.gnu.org/software/wget/manual/ wget.pdf
[/ code]
l'option -output-document permetvous spécifiez le répertoire et le nom du fichier que vous téléchargez
2. Téléchargement d'un site web
wget est également capable de télécharger un site web.
[code]
wget -m http: //www.google.com/profiles/ zainul.franciscus
[/ code]
La commande ci-dessus va télécharger toute ma page web de profil google. L'option '-m' indique à wget de télécharger une image 'miroir' de l'URL spécifiée.
Une autre option importante est de dire à wget combien de liens devrait-il suivre lorsqu'il télécharge un site web.
[code]
wget -r -l1 http: //www.google.com/profiles/ zainul.franciscus
[/ code]
La commande wget ci-dessus utilise deux options. La première option '-r' indique à wget de télécharger récursivement le site Web spécifié.La deuxième option '-l1' indique à wget de n'obtenir que le premier niveau de liens depuis ce site web. Nous pouvons configurer jusqu'à trois niveaux '-l2' et '-l3'.
3. Ignorer l'entrée du robot
Web master gère un fichier texte appelé Robot.txt.'Robot.txt' gère une liste d'URL qu'un robot d'exploration de pages Web tel que wget ne doit pas explorer. Nous pouvons dire à wget d'ignorer l'option 'Robot.txt' avec '-erobots = off'.La commande suivante indique à wget de télécharger la première page de mon profil google et d'ignorer le fichier 'Robot.txt'.
[code]
wget -erobots = désactivé http: //www.google.com/profiles/ zainul.franciscus
[/ code]
Une autre option utile est -U.Cette option masquera wget en tant que navigateur. Prenez note que le masquage d'une application en tant qu'application peut constituer une violation de la durée et du service d'un fournisseur de services Web.
[code]
wget -erobots = off -U Mozilla http: //www.google.com/profiles/ zainul.franciscus
[/ code]
Conclusion
Wget est un logiciel GNU très vieux et pourtant bidouillable que nous pouvons utiliser pour télécharger des fichiers. Wget est un outil de ligne de commande interactif qui signifie que nous pouvons le laisser fonctionner en arrière-plan sur notre ordinateur sans avoir à démarrer une application. Découvrez la page de manuel wget
[code]
$ man wget
[/ code]
pour comprendre les autres options que nous pouvons utiliser avec wget.
Liens
Manuel Wget
Comment combiner deux fichiers téléchargés lorsque wget échoue à mi-chemin
Linux QuickTip: Téléchargement et désancrage en une seule étape