12Sep

Cree un programa de descarga con poca habilidad de programación

A todos nos encanta descargar cosas de Internet, y hay montones de excelentes herramientas de administración de descargas que podemos usar para programar nuestras descargas. Puede que sea más fácil usar un administrador de descargas, pero no hay inconveniente en explorar las herramientas que ya vienen con nuestro Ubuntu y aprovecharlo al máximo.

En este artículo, le mostraremos un software integrado en Ubuntu que podemos usar para descargar cosas de Internet usando wget .Además de eso, le mostraremos cómo programar la descarga usando Cron.

Descargar Using Wget

Wget es un paquete de software gratuito para recuperar archivos mediante HTTP, HTTPS y FTP, los protocolos de Internet más utilizados. Es una herramienta de línea de comando no interactiva, por lo que se puede invocar fácilmente desde scripts, trabajos cron, terminales sin soporte de X-Windows, etc.

Abra su terminal y exploremos cómo podemos usar wget para descargar cosas de la red. La sintaxis básica de la descarga con wget es la siguiente:

wget [opción]. .. [URL]. ..

Este comando descargará el manual de wget en su unidad local

wget http: //www.gnu.org/software/wget/manual/ wget.pdf

Linux Cron

Ubuntu viene con crondaemon utilizado para programar tareas que se ejecutarán en un momento determinado. Crontab le permite especificar las acciones y los tiempos que deben ejecutarse. Así es como normalmente programarías una tarea usando la herramienta de línea de comando.

Abra una ventana de terminal e ingrese crontab -e.

Cada una de las secciones en un crontab está separada por un espacio, y la sección final tiene uno o más espacios. Una entrada de cron consta de minutos( 0-59), hora( 0-23, 0 = medianoche), día( 1-31), mes( 1-12), día de la semana( 0-6, 0 = domingo), comando. La tercera entrada en el crontab anterior descarga wget.pdf a las 2 a. M.La primera entrada( 0) y la segunda entrada( 2) significan 2:00.La tercera a la quinta entrada( *) significa cualquier hora del día, mes o semana. La última entrada es el comando wget para descargar wget.pdf de la URL especificada.

Eso es básico en wget y cómo funciona Cron. Tomemos un botín en un ejemplo de la vida real sobre cómo programar una descarga.

Programación Descargar

Vamos a descargar Firefox 3.6 a las 2 a. M. Como nuestro ISP solo proporciona una cantidad limitada de datos, debemos detener la descarga a las 8 a. M.Así es como se ve la configuración.

Ignora las primeras 2 entradas en el crontab anterior. El tercer y cuarto comando son los únicos 2 comandos que necesita. El tercer comando configura una tarea que descargará Firefox a las 2 a.m.:

[código]
0 2 * * * wget -c http: //download.mozilla.org/? Product = firefox-3.6.6 & os = win & lang = en-GB
[/ code]

Las opciones -c indican que wget debe reanudar la descarga existente si no se ha completado.

El cuarto comando dejará de funcionar a las 8 a. M.'Killall' es un comando de Unix que mata procesos por nombre.

[código]
0 8 * * * killall wget
[/ code]

El widge de killall le dice a Ubuntu que deje de descargar el archivo a las 8 a.m.

Otros comandos wget útiles

1. Especificación del directorio para descargar un archivo

[código]
wget -output-document = /home/zainul/Downloads/ wget manual.pdf http: //www.gnu.org/software/wget/manual/ wget.pdf
[/ code]

la opción -output-document permiteusted especifica el directorio y el nombre del archivo que descarga

2. Descargando un sitio web

wget también es capaz de descargar un sitio web.

[código]
wget -m http: //www.google.com/profiles/ zainul.franciscus
[/ code]

El comando anterior descargará toda mi página web de perfil de Google. La opción '-m' le dice a wget que descargue una imagen 'espejo' de la URL especificada.

Otra opción importante es saber cuántos enlaces debería seguir cuando descargue un sitio web.

[código]
wget -r -l1 http: //www.google.com/profiles/ zainul.franciscus
[/ code]

El comando wget anterior utiliza dos opciones. La primera opción '-r' le dice a wget que descargue el sitio web especificado recursivamente. La segunda opción '-l1' le dice a wget que solo obtenga el primer nivel de enlaces de ese sitio web específico. Podemos configurar hasta tres niveles '-l2' y '-l3'.

3. Ignorando la entrada del robot

Web master mantiene un archivo de texto llamado Robot.txt.'Robot.txt' mantiene una lista de URL que un rastreador de página web como wget no debe rastrear. Podemos decirle a wget que ignore el 'Robot.txt' con la opción '-erobots = off'.El siguiente comando le dice a wget que descargue la primera página de mi perfil de Google e ignore el 'Robot.txt'.

[código]
wget -erobots = desactivado http: //www.google.com/profiles/ zainul.franciscus
[/ code]

Otra opción útil es -U.Esta opción enmascarará wget como un navegador. Tenga en cuenta que enmascarar una aplicación como otra aplicación puede violar el término y el servicio de un proveedor de servicios web.

[código]
wget -erobots = off -U Mozilla http: //www.google.com/profiles/ zainul.franciscus
[/ code]

Conclusión

Wget es un paquete de software de GNU muy antiguo pero hackeable que podemos usar para descargar archivos. Wget es una herramienta de línea de comandos interactiva que significa que podemos dejar que se ejecute en nuestra computadora en segundo plano sin tener que iniciar ninguna aplicación. Consulte la página del manual de wget

[código]
$ man wget
[/ code]

para comprender otras opciones que podemos usar con wget.

Enlaces

Wget Manual
Cómo combinar dos archivos descargados Cuando wget falla a medio camino a través de
Linux Sugerencias rápidas: Descarga y liberación en un solo paso