Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

关于使用另一个中文数据集 #15

Open
zzlf opened this issue May 18, 2023 · 7 comments
Open

关于使用另一个中文数据集 #15

zzlf opened this issue May 18, 2023 · 7 comments

Comments

@zzlf
Copy link

zzlf commented May 18, 2023

请问如果使用另一个中文数据集,除了rel_num还需要修改别的参数吗?如果有,具体有哪些呢?谢谢

@taishan1994
Copy link
Owner

请问如果使用另一个中文数据集,除了rel_num还需要修改别的参数吗?如果有,具体有哪些呢?谢谢

基本上按照说明里面的来就好了。

@zzlf
Copy link
Author

zzlf commented May 19, 2023

我更改了rel_num和batch_triple_matrix,训练另一个中文数据集,训练集loss在下降但准确率和f1都是0,为什么会这样?

@taishan1994
Copy link
Owner

我更改了rel_num和batch_triple_matrix,训练另一个中文数据集,训练集loss在下降但准确率和f1都是0,为什么会这样?

数据量多大,训练了多久。

@zzlf
Copy link
Author

zzlf commented May 19, 2023

数据5.3M,训练了3个epoch,loss到0.005不再下降,每个epoch结束测试时准确率,f1,recall都为0

@taishan1994
Copy link
Owner

数据5.3M,训练了3个epoch,loss到0.005不再下降,每个epoch结束测试时准确率,f1,recall都为0

可以训练完最后直接保存模型,然后预测一些样本看看结果。

@1357810la
Copy link

数据5.3M,训练了3个epoch,loss到0.005不再下降,每个epoch结束测试时准确率,f1,recall都为0

可以训练完最后直接保存模型,然后预测一些样本看看结果。

请问如果使用另一个中文数据集,除了rel_num还需要修改别的参数吗?如果有,具体有哪些呢?谢谢

基本上按照说明里面的来就好了。

你好,如果使用自己的数据集,句子长度超过100可以吗,改了train.py里面的max_len和bert_max_len还是会报错,需要改其他的吗

@258508
Copy link

258508 commented Sep 2, 2023

请问修改句子长度这个问题你解决了吗

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

4 participants