很多同学给我发邮件咨询QA_demo1的语料集,这个语料集我暂时无权公开,希望大家见谅!
QA_demo1的语料集的格式为: Q-Q, Q-A,其实主要还是在于Q-Q的数据集,因为做的是问题和问题之间的相似度,工业上都这么干,Q-A只是用来展示模型相应的效果而已,去任何一个有FAQ说明的网站都可以把QA对给爬下来。
这里提供2个中文数据集供大家参考,希望能够帮到大家:
一、 基于tf-idf等特征的问答机器人
二、 基于语义模型,如cnn,rnn等深度学习模型的问答机器人
三、 基于ELMO的问答机器人
四、 基于BERT的问答机器人
项目名称 | 数据类型 | 技术类型 | 可视化 | 完成时间 |
---|---|---|---|---|
基于tf-idf的问答机器人 | 中文 | tf-idf,特征匹配 | 否 | 2019/4/4 |
基于recall+rerank的问答机器人 | 中文 | tf-idf,cnn | 否 | 2019/7/22 |
聊天机器人小天1.0 | 中文 | route转换机制,支持闲聊和FAQ任务问答 | 否 | 2019/7/25 |
基于BERT的问答机器人 | 中文 | / | 否 | 敬请期待 |
如果觉得我的工作对您有帮助,请不要吝啬右上角的小星星哦!欢迎Fork和Star!也欢迎一起建设这个项目!
有时间就会更新问答相关项目,有兴趣的同学可以follow一下
留言请在Issues或者email xiezhengwen2013@163.com
Cite
如果你在研究中使用了QAmodel-for-Retrievalchatbot,请按如下格式引用:
@software{QR-Chatbot,
author = {ZhengWen Xie},
title = {QR-Chatbot: QAmodel for Retrievalchatbot},
year = {2019},
url = {https://github.com/WenRichard/QAmodel-for-Retrievalchatbot},
}