12Sep
Todos nós adoramos baixar coisas da internet, e há montes de ferramentas de gerenciador de download excelentes que podemos usar para agendar nossos downloads. Pode ser mais fácil usar um gerenciador de download, mas não há nenhum dano em explorar as ferramentas que já vem com o Ubuntu e usá-lo.
Neste artigo, mostraremos um software incorporado no Ubuntu que podemos usar para baixar coisas da internet usando o wget .Além disso, mostraremos como agendar o download usando o Cron.
Download Usando o Wget
O Wget é um pacote de software gratuito para recuperar arquivos usando HTTP, HTTPS e FTP, os protocolos de Internet mais utilizados.É uma ferramenta de linha de comando não-interativa, por isso pode ser facilmente chamada a partir de scripts, trabalhos cron, terminais sem suporte X-Windows, etc.
Abra seu terminal e vamos explorar como podemos usar o wget para fazer o download da rede. A sintaxe básica do download com o wget é a seguinte:
wget [opção]. .. [URL]. ..
Este comando irá baixar o manual do wget na sua unidade local
wget http: //www.gnu.org/software/wget/manual/ wget.pdf
Linux Cron
O Ubuntu vem com um cronDaemon usado para agendar tarefas a serem executadas em um determinado momento. O Crontab permite que você especifique ações e tempos em que eles devem ser executados.É assim que você normalmente agende uma tarefa usando a ferramenta de linha de comando.
Abra uma janela do terminal e entre no crontab -e.
Cada uma das seções em um crontab é separada por um espaço, com a seção final tendo um ou mais espaços nele. Uma entrada cron consiste em minutos( 0-59), hora( 0-23, 0 = meia-noite), dia( 1-31), mês( 1-12), dia da semana( 0-6, 0 = domingo), comando. A terceira entrada no crontab acima é baixada wget.pdf às 2 da manhã.A primeira entrada( 0) e a segunda entrada( 2) significa 2:00.A terceira a quinta entrada( *) significa qualquer hora do dia, mês ou semana. A última entrada é o comando wget para baixar o wget.pdf a partir do URL especificado.
Esse é o básico no wget e como funciona o Cron. Vamos pegar um loot em um exemplo da vida real sobre como agendar um download.
Agendamento Download
Vamos baixar o Firefox 3.6 às 2 da manhã. Como o nosso ISP apenas fornece uma quantidade limitada de dados, precisamos parar o download às 8 da manhã.É assim que a configuração se parece.
Ignore as primeiras 2 entradas no crontab acima. O terceiro e quarto comando são os únicos 2 comandos que você precisa. O terceiro comando configura uma tarefa que irá baixar o Firefox às 2 da manhã:
[código]
0 2 * * * wget -c http: //download.mozilla.org/? Product = firefox-3.6.6 & os = win & lang = en-GB
[/ código]
As opções -c indicam que o wget deve retomar o download existente se não for concluído.
O quarto comando irá parar o wget às 8 da manhã.'Killall' é um comando unix que mata processos por nome.
[código]
0 8 * * * killall wget
[/ code]
O killall wget diz ao Ubuntu para parar o wget de baixar o arquivo às 8 da manhã.
Outros comandos úteis do wget
1. Especificando o diretório para baixar um arquivo
[código]
wget -output-document = /home/zainul/Downloads/ wget manual.pdf http: //www.gnu.org/software/wget/manual/ wget.pdf
[/ código]
a opção -output-document permitevocê especifica o diretório e o nome do arquivo que você baixou
2. Carregando um site
O wget também é capaz de baixar um site.
[código]
wget -m http: //www.google.com/profiles/ zainul.franciscus
[/ code]
O comando acima irá baixar minha página inteira do perfil do google. A opção '-m' diz ao wget que baixe uma imagem 'espelhada' do URL especificado.
Outra opção importante é dizer ao wget quantos links deve seguir quando ele baixar um site.
[código]
wget -r -l1 http: //www.google.com/profiles/ zainul.franciscus
[/ code]
O comando wget acima usa duas opções. A primeira opção '-r' diz ao wget para baixar o site especificado de forma recursiva. A segunda opção '-l1' diz ao wget que obtenha apenas o primeiro nível de links desse site especificado. Podemos configurar até três níveis '-l2' e '-l3'.
3. Ignorar a entrada do robô
Web Master mantêm um arquivo de texto chamado Robot.txt.'Robot.txt' mantém uma lista de URL que um rastreador de páginas da Web, como o wget, não deve rastrear. Podemos dizer ao wget que ignore a opção 'Robot.txt' com '-erobots = off'.O seguinte comando diz ao wget que baixe a primeira página do meu perfil do google e ignore o 'Robot.txt.
[código]
wget -erobots = off http: //www.google.com/profiles/ zainul.franciscus
[/ code]
Outra opção útil é -U.Esta opção irá mascarar o wget como um navegador. Tome nota que encarar um aplicativo como outro aplicativo pode violar o termo e o serviço de um provedor de serviços da Web.
[código]
wget -erobots = off -U Mozilla http: //www.google.com/profiles/ zainul.franciscus
[/ code]
Conclusão
O Wget é um pacote de software GNU muito antigo, ainda pirateável, que podemos usar para baixar arquivos. O Wget é uma ferramenta de linha de comando interativa, o que significa que podemos deixá-lo funcionar em nosso computador em segundo plano sem ter que iniciar qualquer aplicativo. Confira a página do manual do wget
[código]
$ man wget
[/ code]
para entender outras opções que podemos usar com o wget.
Links
Wget Manual
Como combinar dois arquivos baixados quando o wget falha a meio caminho através do
Linux QuickTip: Download e Un-tarring em uma etapa