Um projeto Python com interface gráfica para download completo do conteúdo de um site. O aplicativo permite baixar arquivos HTML, CSS, JavaScript, imagens, e outros ativos de um site, mantendo a estrutura de pastas original, e cria um arquivo ZIP com todo o conteúdo baixado.
- Download Completo: Baixa arquivos HTML, CSS, JavaScript, imagens e outros ativos relacionados ao site.
- Estrutura de Pastas: Mantém a estrutura de pastas do site conforme exibida na aba de fontes do navegador.
- Compactação: Cria um arquivo ZIP com o conteúdo baixado.
- Python 3.x instalado
- Bibliotecas necessárias:
requests
bs4
(BeautifulSoup4)tkinter
(nativo do Python para interface gráfica)
-
Clone o repositório:
git clone https://github.com/usuario/site-extractor.git cd site-extractor
-
Instale as dependências:
pip install -r requirements.txt
-
Execute o aplicativo:
python siteextrator.py
- Insira a URL do site que deseja baixar.
- Escolha uma pasta de destino para salvar o conteúdo.
- Clique no botão "Baixar Conteúdo do Site e Compactar".
- O conteúdo do site será baixado e compactado em um arquivo ZIP na pasta de destino escolhida.
siteextrator.py
- Arquivo principal que contém o código para baixar o site.extrair_links
- Função responsável por encontrar e baixar todos os arquivos relacionados ao site.baixar_arquivo
- Função que baixa um único arquivo e o salva na estrutura de pastas correspondente.iniciar_download
- Função principal para iniciar o processo de download e compactação.
- O programa pode não baixar certos arquivos protegidos por restrições de acesso (como conteúdo dinâmico gerado por JavaScript ou protegido por autenticação).
- Recomendado para uso em sites de domínio público ou para os quais você tem permissão de download.
Este projeto é de código aberto e está disponível sob a licença MIT.