language-detection

This is a language detection library implemented in plain Java (aliases: language identification, language guessing). Forked from https://github.com/kirasystems/language-detection which in turn is a fork from https://github.com/shuyo/language-detection

This version uses a Maven POM to build and contains some speed and coding styleguide improvements.

New CLI options (January 2017)

-u <text> will cause the profile being learned to be added to an existing profile (should one exist). Useful for incrementally building language profiles without requiring a giant text file.

--trim-profile <profile> used to provide trim existing profile (filename provided) to remove any extraneous low frequency terms from the language model to improve accuracy and reduce model size.

Name		Name	Last commit message	Last commit date
Latest commit History 91 Commits
.settings		.settings
docs		docs
langid-java-experiments		langid-java-experiments
nutch-plugin		nutch-plugin
profiles.sm		profiles.sm
profiles		profiles
src		src
.classpath		.classpath
.gitignore		.gitignore
.project		.project
.travis.yml		.travis.yml
CODE_OF_CONDUCT.md		CODE_OF_CONDUCT.md
README.md		README.md
pom.xml		pom.xml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

language-detection

New CLI options (January 2017)

About

Releases

Packages

Languages

Obsidian-StudiosInc/language-detection

Folders and files

Latest commit

History

Repository files navigation

language-detection

New CLI options (January 2017)

About

Resources

Code of conduct

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages