SleepingMonster / Keras_BiLSTM_Language-Model Public

Notifications You must be signed in to change notification settings
Fork 0
Star 3

中山大学自然语言处理项目：中文语言模型。Keras实现，BiLSTM框架。

3 stars 0 forks Branches Tags Activity

Notifications

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
code		code
data		data
report_picture		report_picture
README.md		README.md
report.pdf		report.pdf
期中作业.pdf		期中作业.pdf
语言模型实验报告.md		语言模型实验报告.md

Repository files navigation

Keras_BiLSTM_Language-Model

中山大学自然语言处理项目：中文语言模型。

Keras实现，BiLSTM框架。

Readme

实验环境

keras 2.3.1版本和tensorflow 2.2版本（或者其他相匹配的keras和tensorflow版本）
keras_contrib库、gensim库、pickle库、tqdm库

实验工具

jupyter notebook

文件组织

词向量：sgns.wiki.word 文件
- 来自于 https://github.com/Embedding/Chinese-Word-Vectors 中“Various Domains”中的“Word”的"Wikipedia_zh 中文维基百科"。
代码code文件夹：
- task2.ipynb（jupyter notebook格式）和task2.py，建议执行task2.ipynb。
- 逐块执行即可得到训练EPOCH次数之后的测试集的预测结果，并会输出预测结果。
  - EPOCH的取值可在train函数的参数中进行调整。
- 结果：训练集迭代运行25次之后的结果保存为result.txt文件。
数据集data文件夹：
- SIGHAN Microsoft Research数据集的数据。
- 包含msr_train 和 msr_test_gold文件。
  - 两种格式：.txt和.utf8，前者是方便阅读创建的，后者才是真正程序使用的。
- result.txt文件为预测结果文件。
实验报告：
- report.pdf 和 语言模型实验报告.md
项目要求：期中作业.pdf

About

中山大学自然语言处理项目：中文语言模型。Keras实现，BiLSTM框架。

nlp keras bilstm chinese-language-model

Report repository

Releases

No releases published

Packages

No packages published

Languages