Skip to content

加入Tesseract OCR与自动朗读功能的团子翻译器,可以识别并翻译小语种

License

Notifications You must be signed in to change notification settings

NewComer00/Dango-Translator-tesseract

This branch is 5 commits ahead of, 483 commits behind PantsuDango/Dango-Translator:master.

Folders and files

NameName
Last commit message
Last commit date

Latest commit

3b1196f · Oct 8, 2022
Oct 7, 2022
Dec 1, 2021
Oct 5, 2022
Oct 8, 2022
Oct 7, 2022
Oct 7, 2022
Oct 5, 2022
Nov 28, 2021
Oct 7, 2022
Apr 30, 2022
Oct 7, 2022

Repository files navigation

团子翻译器 + Tesseract OCR

基于2022年7月29日PantsuDango/Dango-Translator主线分支的魔改版本,为团子翻译器添加了以下功能:

  • 使用离线OCR引擎Tesseract进行文本识别
  • 自动朗读当前OCR的文本识别结果

Tesseract是一款历史悠久的强大离线OCR引擎,可以识别超过100种的语言。现在用户可以使用团子翻译器中的Tesseract OCR来识别并翻译小语种了。

示例图片

assets/tesseract_ui.jpg assets/reader_ui.jpg assets/tesseract_demo_rus1.jpg assets/tesseract_demo_rus2.jpg

运行环境

  • Windows
  • Python3

附:本人开发时的环境

  • Windows 10 21H2 19044 x64
  • Python3.9.1 x64

安装方法

  1. 加速安装Python包
    整个安装过程需要下载很多Python包。若在执行pip install 包名称时下载进度缓慢,可以使用国内的PyPi加速镜像。使用中科大镜像源加速的格式如下:
pip install 包名称 -i https://mirrors.ustc.edu.cn/pypi/web/simple
  1. 打开PowerShell,创建一个Python虚拟环境
    我们即将安装一系列的Python包,为了让这些包和外界环境隔离,建议使用虚拟环境。如下命令执行完毕后,会在Windows的C:\Users\用户名\目录下创建一个app_env文件夹,里面存放着一个独立的Python虚拟环境。
pip install virtualenv
virtualenv $HOME/app_env
cd ~/app_env
  1. 激活虚拟环境
    激活成功后命令行会出现(app_env)字样。接下来Python包都会被装进该环境,与外部环境隔离。
./Scripts/activate
  1. 克隆或下载该项目
    把本项目的代码克隆或下载到当前虚拟环境目录;进入项目目录。
git clone --depth 1 https://github.com/NewComer00/Dango-Translator-tesseract
cd Dango-Translator-tesseract
  1. 安装Python依赖包
    如果下载缓慢,记得按照第0步提示加速哟,在下述命令结尾加上-i 镜像源链接即可。
pip install -r ./requirements.txt
  1. 运行程序
    程序内有比较完整的新功能教程,如果出现问题欢迎提出Issue。
python ./app.py
  1. 退出虚拟环境
    如需退出虚拟环境,直接在命令行输入deactivate即可。关闭PowerShell时也会自动退出虚拟环境。

再次运行

首次安装完成后,如需再次运行,请打开PowerShell输入以下命令:

cd ~/app_env; ./Scripts/activate; cd ./Dango-Translator-tesseract; python ./app.py

About

加入Tesseract OCR与自动朗读功能的团子翻译器,可以识别并翻译小语种

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%