tessdata

These language data files only work with Tesseract 4.0.0 and newer versions. They are based on the sources in tesseract-ocr/langdata on GitHub. (still to be updated for 4.0.0 - 20180322)

These have models for legacy tesseract engine (--oem 0) as well as the new LSTM neural net based engine (--oem 1).

The LSTM models (--oem 1) in these files have been updated to the integerized versions of tessdata_best on GitHub. So, they should be faster but probably a little less accurate than tessdata_best.

tessdata_fast on GitHub provides an alternate set of integerized LSTM models which have been built with a smaller network. tessdata_fast files are the ones packaged for Debian and Ubuntu.

The legacy tesseract models (--oem 0) have been removed for Indic and Arabic script language files.

tessdata for 3.04 or 3.05

Get language data files for Tesseract 3.04 or 3.05 from the 3.04 tree.

More information and a complete list of all languages is available in the Tesseract wiki.

All data in the repository are licensed under the Apache-2.0 License, see file LICENSE.

Name		Name	Last commit message	Last commit date
Latest commit History 44 Commits
script		script
tessconfigs @ 3decf1c		tessconfigs @ 3decf1c
.gitmodules		.gitmodules
LICENSE		LICENSE
README.md		README.md
afr.traineddata		afr.traineddata
amh.traineddata		amh.traineddata
ara.traineddata		ara.traineddata
asm.traineddata		asm.traineddata
aze.traineddata		aze.traineddata
aze_cyrl.traineddata		aze_cyrl.traineddata
bel.traineddata		bel.traineddata
ben.traineddata		ben.traineddata
bod.traineddata		bod.traineddata
bos.traineddata		bos.traineddata
bre.traineddata		bre.traineddata
bul.traineddata		bul.traineddata
cat.traineddata		cat.traineddata
ceb.traineddata		ceb.traineddata
ces.traineddata		ces.traineddata
chi_sim.traineddata		chi_sim.traineddata
chi_sim_vert.traineddata		chi_sim_vert.traineddata
chi_tra.traineddata		chi_tra.traineddata
chi_tra_vert.traineddata		chi_tra_vert.traineddata
chr.traineddata		chr.traineddata
configs		configs
cos.traineddata		cos.traineddata
cym.traineddata		cym.traineddata
dan.traineddata		dan.traineddata
dan_frak.traineddata		dan_frak.traineddata
deu.traineddata		deu.traineddata
deu_frak.traineddata		deu_frak.traineddata
div.traineddata		div.traineddata
dzo.traineddata		dzo.traineddata
ell.traineddata		ell.traineddata
eng.traineddata		eng.traineddata
enm.traineddata		enm.traineddata
epo.traineddata		epo.traineddata
equ.traineddata		equ.traineddata
est.traineddata		est.traineddata
eus.traineddata		eus.traineddata
fao.traineddata		fao.traineddata
fas.traineddata		fas.traineddata
fil.traineddata		fil.traineddata
fin.traineddata		fin.traineddata
fra.traineddata		fra.traineddata
frk.traineddata		frk.traineddata
frm.traineddata		frm.traineddata
fry.traineddata		fry.traineddata
gla.traineddata		gla.traineddata
gle.traineddata		gle.traineddata
glg.traineddata		glg.traineddata
grc.traineddata		grc.traineddata
guj.traineddata		guj.traineddata
hat.traineddata		hat.traineddata
heb.traineddata		heb.traineddata
hin.traineddata		hin.traineddata
hrv.traineddata		hrv.traineddata
hun.traineddata		hun.traineddata
hye.traineddata		hye.traineddata
iku.traineddata		iku.traineddata
ind.traineddata		ind.traineddata
isl.traineddata		isl.traineddata
ita.traineddata		ita.traineddata
ita_old.traineddata		ita_old.traineddata
jav.traineddata		jav.traineddata
jpn.traineddata		jpn.traineddata
jpn_vert.traineddata		jpn_vert.traineddata
kan.traineddata		kan.traineddata
kat.traineddata		kat.traineddata
kat_old.traineddata		kat_old.traineddata
kaz.traineddata		kaz.traineddata
khm.traineddata		khm.traineddata
kir.traineddata		kir.traineddata
kmr.traineddata		kmr.traineddata
kor.traineddata		kor.traineddata
kor_vert.traineddata		kor_vert.traineddata
lao.traineddata		lao.traineddata
lat.traineddata		lat.traineddata
lav.traineddata		lav.traineddata
lit.traineddata		lit.traineddata
ltz.traineddata		ltz.traineddata
mal.traineddata		mal.traineddata
mar.traineddata		mar.traineddata
mkd.traineddata		mkd.traineddata
mlt.traineddata		mlt.traineddata
mon.traineddata		mon.traineddata
mri.traineddata		mri.traineddata
msa.traineddata		msa.traineddata
mya.traineddata		mya.traineddata
nep.traineddata		nep.traineddata
nld.traineddata		nld.traineddata
nor.traineddata		nor.traineddata
oci.traineddata		oci.traineddata
ori.traineddata		ori.traineddata
osd.traineddata		osd.traineddata
pan.traineddata		pan.traineddata
pdf.ttf		pdf.ttf
pol.traineddata		pol.traineddata
por.traineddata		por.traineddata

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

tessdata

tessdata for 3.04 or 3.05

About

Releases

Packages

License

panlei-coder/tessdata

Folders and files

Latest commit

History

Repository files navigation

tessdata

tessdata for 3.04 or 3.05

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Packages