rasa_chinese

rasa_chinese 是专门针对中文语言的 rasa 组件扩展包。提供了一些针对中文语言的组件。

本软件包得到了 Rasa 官方的认可，官方博客中推荐中文 Rasa 用户使用： https://rasa.com/blog/non-english-tools-for-rasa/

安装

pip install rasa_chinese

当前包含的组件

LanguageModelTokenizer

基于 HuggingFace's transformers 的分词组件。

pipeline 使用：

pipeline:
  - name: "rasa_chinese.nlu.tokenizers.lm_tokenizer.LanguageModelTokenizer"

LanguageModelTokenizer 的分词方法必须和 LanguageModelFeaturizer 保持一致。

如果用户在 pipeline 中指定了 LanguageModelFeaturizer 的参数，那么也需要为 LanguageModelFeaturizer 设置相同的参数。如下所示:

pipeline:
  - name: "rasa_chinese.nlu.tokenizers.lm_tokenizer.LanguageModelTokenizer"
    # 以下的参数必须和 LanguageModelFeaturizer 的参数保持完全一致
    model_name: "roberta"
    model_weights: "roberta-base"
  - name: LanguageModelFeaturizer
    model_name: "roberta"
    model_weights: "roberta-base"

Name		Name	Last commit message	Last commit date
Latest commit History 23 Commits
.media		.media
integration_tests		integration_tests
paddle_integrite_test		paddle_integrite_test
playground		playground
rasa_chinese		rasa_chinese
tests		tests
tf_integrite_test		tf_integrite_test
.gitignore		.gitignore
LICENSE		LICENSE
Makefile		Makefile
README.md		README.md
dev_requirements.txt		dev_requirements.txt
download.bash		download.bash
requirements.txt		requirements.txt
requirements_full.txt		requirements_full.txt
setup.cfg		setup.cfg
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

rasa_chinese

安装

当前包含的组件

LanguageModelTokenizer

About

Releases

Packages

Languages

License

howl-anderson/rasa_chinese

Folders and files

Latest commit

History

Repository files navigation

rasa_chinese

安装

当前包含的组件

LanguageModelTokenizer

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages