Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Edición de archivos hocr #118

Open
iamdeit opened this issue Feb 16, 2016 · 2 comments
Open

Edición de archivos hocr #118

iamdeit opened this issue Feb 16, 2016 · 2 comments
Labels

Comments

@iamdeit
Copy link
Contributor

iamdeit commented Feb 16, 2016

Buscar formas de editar los HOCR generados por el Tesseract para la depuración de errores en el reconocimiento de caracteres.

Nota: Es posible generar txt en tesseract, pero el PDFBeads no los reconoce aunque tengan el mismo nombre que los tiff, a diferencia de la extensión hocr.

@iamdeit iamdeit added the Mejora label Feb 16, 2016
@Sufrostico
Copy link
Member

Yock, Julio y jose estan trabajando en esto.

@jyock97
Copy link
Contributor

jyock97 commented Nov 1, 2017

Hemos estado trabajando en una biblioteca para poder editar el archivo hOCR.
El proceso inicia simplificado el archivo hOCR para manejarlo mejor.
La edición se realiza a nivel de linea, se remplaza toda una linea por la ingresada.
Ademas ya esta integrado en Jabiru.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
Development

No branches or pull requests

3 participants