Projeto simples para leitura e interpretação de texto de imagens, PDFs e texto puro
- Streamlit 📊
- EasyOCR 👁️
- pdf2image 📄
- Google Gemini LLM 🤖
Com a Docker Engine instalada e sendo executada na sua máquina, primeiro clone o repositório:
# Clonando o repositório
git clone https://github.com/Educg550/document_reader.gitApós, insira a sua chave da API do Gemini em um arquivo .env na raiz do projeto (caso deseje utilizar a LLM para detecção):
Exemplo de arquivo .env:
GOOGLE_API_KEY="SUA_CHAVE_AQUI"Você pode manter o arquivo .env vazio caso não vá usar detecção com LLM. Em seguida, execute os comandos:
# Criando a imagem Docker
make
# Executando o container
make runUma imagem ocr-image-reader será criada na sua máquina e um container de mesmo nome será executado.
Com o container em execução, acesse o endereço http://localhost:8501 no seu navegador para acessar a interface gráfica feita com Streamlit. Você verá uma página com um campo para upload de arquivos. Os seguintes arquivos são compatíveis:
- Texto puro (
.txt) - PDF (
.pdf) - Imagens (
.png,.jpg,.jpeg)
Após feita uma modificação no código, você pode reconstruir a imagem Docker com o comando:
make rebuildO comando acima irá reconstruir e executar a imagem ocr-image-reader em um novo container, com a última versão do código.
