16 de jul. de 2010

Baixando Sites Inteiros da Internet

Muitas vezes encontramos na Internet sites interessantíssimos que vale a pena ter ele em nosso disco rígido, para navegação off-line, isto é, sem estarmos conectados à Internet. A navegação off-line, além de muito mais rápida, ainda faz com que você economize na conta telefônica, pois não precisará ficar pendurado na Internet. Mesmo quem tem Internet banda larga sabe que a navegação off-line vale muito a pena.

Imagine que você assinou um desses sites de conteúdo adulto cheia de fotos interessantes. Sua assinatura um dia vai expirar, então vale a pena baixar logo todas as fotos enquanto ainda é tempo. O dia em que sua assinatura expirar, você terá as fotos todas ainda em seu disco rígido, podendo vê-las sem precisar estar conectado e muito menos pagando ao site de onde você as baixou.

Existem vários programas com o intuito de baixar um site inteiro da Internet para o seu disco rígido.
Nós testamos quatro deles: Express WebPictures
 (http://www.express-soft.com), Grab-a-Sit
(http://www.bluesquirrel.com/), WebLooper
(http://www.winsite.com/bin/Info?500000033792) e WebReaper
(http://www.webreaper.net/).Íamos testar um quinto programa, WebRipper 
(http://dasf.8m.net), só que ele deu um conflito de DLL e não instalou em nossa máquina. Mas fica aí registrado o endereço dele para quem quiser experimentá-lo.


Cada um tem as suas vantagens e as suas desvantagens. O WebLooper, por exemplo, é um programa que permite que você baixe fotos (arquivos do tipo Jpg ou Gif) que estejam numeradas seqüencialmente em um servidor da Internet automaticamente. Você só precisa entrar o nome da primeira foto (ex: http://www.site.com/pics/foto01.jpg), configurar a maneira com que a numeração é feita e o número da última foto. O programa baixa tudo automaticamente. A vantagem é que o programa anda rápido, já que ele não irá baixar arquivos HTML para analisar. A desvantagem é que, além de você precisar saber o endereço correto das fotos, o programa não permite que você configure um login e senha. Assim, esse programa não serve para baixar fotos presentes em um site protegido por login e senha - ao contrário de todos os demais programas testados.

O Grab-a-Site sem dúvida é um dos mais famosos, já que foi um dos primeiros programas desse tipo a surgirem no mercado. Você entra o endereço inicial do site e ele baixa o site inteiro para o seu disco rígido. Você deve configurar detalhes como a "profundidade" de navegação (até quantas páginas depois da inicial ele deve analisar) e se os arquivos no disco rígido deverão ser salvos com a mesma estrutura de diretórios do servidor original. O Grab-a-Site tem ainda como grande vantagem alterar os arquivos HTML salvos no disco para que ele aponte os arquivos presentes no disco rígido, e não mais na Internet, para que você realmente possa navegar off-line. A grande desvantagem desse programa é que ele não possui uma função de pausa. Se a sua conexão cair e você tiver que começar tudo de novo, ele simplesmente apaga todos os arquivos já baixados (!) para começar tudo novamente. Ao pedir para baixar um site em que você já tenha alguns arquivos dele no seu disco, ele faz a mesma coisa: apaga tudo para começar a baixá-lo de novo.


O Express WebPictures é fantástico. Ele vasculha um site e baixa somente as fotos. E mais, você pode configurar o que é "lixo". Assim, ele sabe que fotos pequenas (seja em tamanho dado em pixels ou em KB) não devem se baixadas. Se você está interessado em baixar somente as fotos de um site (inclusive em sites protegidos com login e senha), esse programa é bem melhor que o Grab-a-Site. E mais rápido, já que ele não baixará os arquivos HTML nem tampouco fotos que não te interessam. Você pode ainda configurar filtros, fazendo com que ele ignore arquivos que tenham um determinado conjunto de caracteres em seu nome. A única desvantagem é que ele é shareware e enquanto você não pagar de vez em quando ele para o download para mostrar uma mensagem de como adquirir o programa.

Mas o melhor de todos mesmo é o WebReaper. Ele é totalmente de graça e você pode optar entre baixar o site inteiro, como o Grab-a-Site, ou então baixar somente arquivos de um determinado tipo. A estrutura de filtros dele permite configurar o programa para baixar não só arquivos a partir de um determinado tamanho, mas também pela data de última atualização, permitindo que você atualize um site que já esteja em seu disco, baixando somente os arquivos novos. Ele tem também a vantagem de não baixar os arquivos já existentes em seu disco rígido.





Nenhum comentário:

Postar um comentário

 https://drive.google.com/file/d/1Ag5iGkR2PKI9dGm5KABWwLNGTIuFlQ4u/view