Přepis ozdobných nápisů

Baseline

knn.ipynb - Načtení a otestování přesnosti ParSEQ modelu.

Natrénované modely

Na tomto odkazu naleznete dotrénovaný model na datovou sadu Wordart a natrénovaný model na český jazyk a mezery.
Výsledky modelu v porovnání s jinými můžete vidět v tabulce níže.

Použité datové sady

datové sady použité taktéž při trénování PARSeq, jsou dostupné zde.
ostatní datové sady, jedná se o Wordart, naši syntetickou datovou sadu pro trénování na češtinu a mezery a sadu historických dokumentů.

Analýza datové sady

utils/dataStat.py - Analýza délky slov a výskytu znaků podle labels.
utils/imageRes.py - Analýza velikosti obrázků dle obrázků.

Výsledky

Soubor docs/report.pdf obsahuje zprávu o provedené práci v rámci tohoto projektu.
Soubory docs/plakát.pdf a docs/plakát.png obsahují plakát vhodný pro rychlé seznámení s naší prací.

Generování syntetické datové sady

Textové soubory využitelné pro generování syntetických obrázků:

czech.txt - Kolekce cca 500 000 českých slov.

Scripty pro generování syntetických obrázků

utils/pairs_gen.py - Generátor dvojic slov ze seznamu slov.
utils/image_gen.py - Generátor obrázků z textového dokumentu slov. Využívá trdg.

Tvorba datové sady

utils/filtr_labels.py - Pomocný program pro odstranění neanotovaných řádků z labelů a změna cest.
utils/filtr_images.py - Pomocný program pro vytvoření složky obrázků, obsahujících pouze anotované vzorky.

Použité nástroje

Submodul	Cesta	Licence	Licenční soubor
PARSeq	external/parseq	Apache 2.0	LICENSE
TextRecognitionDataGenerator	external/TextRecognitionDataGenerator	MIT	LICENSE

Name		Name	Last commit message	Last commit date
Latest commit History 32 Commits
Figures		Figures
checkpoint		checkpoint
docs		docs
external		external
utils		utils
LICENSE		LICENSE
README.md		README.md
czech.txt		czech.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Přepis ozdobných nápisů

Baseline

Natrénované modely

Použité datové sady

Analýza datové sady

Výsledky

Generování syntetické datové sady

Textové soubory využitelné pro generování syntetických obrázků:

Scripty pro generování syntetických obrázků

Tvorba datové sady

Použité nástroje

About

Uh oh!

Releases

Packages

Uh oh!

Contributors 2

Uh oh!

Languages

License

ArgonOutPlay/KNN

Folders and files

Latest commit

History

Repository files navigation

Přepis ozdobných nápisů

Baseline

Natrénované modely

Použité datové sady

Analýza datové sady

Výsledky

Generování syntetické datové sady

Textové soubory využitelné pro generování syntetických obrázků:

Scripty pro generování syntetických obrázků

Tvorba datové sady

Použité nástroje

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors 2

Uh oh!

Languages

Packages