Skip to content

Commit 0428087

Browse files
authored
Update Note.md
1 parent e4cea91 commit 0428087

File tree

1 file changed

+2
-2
lines changed

1 file changed

+2
-2
lines changed

Note.md

Lines changed: 2 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -45,9 +45,9 @@
4545

4646
新的扩展数据来源于基于莱文斯坦距离的模糊匹配。匹配出来新的节点范围后,对回答节点和下一跳节点的起点和终点采用交叉熵损失进行训练。
4747

48-
实验非常耗时。由于单卡训练,所以降低了学习率,降低了batchsize,提高了accumulate-gradient,第一次运行的在dev数据集合上的是结果是
48+
实验非常耗时。由于单卡训练,所以降低了学习率,降低了batchsize,提高了accumulate-gradient,即使是这样,显存依然不够,因此训练失败,最后的model第一次运行的在dev数据集合上的是结果是
4949

5050
{'em': 0.07792032410533424, 'f1': 0.11589995731587953, 'prec': 0.12096540304170288, 'recall': 0.11914047476048512, 'sp_em': 0.017555705604321403, 'sp_f1': 0.17510096211867643, 'sp_prec': 0.20333782336652031, 'sp_recall': 0.20638227066653758, 'joint_em': 0.00675219446320054, 'joint_f1': 0.05201124642132065, 'joint_prec': 0.057943727484409326, 'joint_recall': 0.06562598799059655}
5151

52-
这个结果很低,远低于文章中的结果。下面尝试在aws服务器上运行
52+
这个结果很低,远低于文章中的结果。下面尝试1.在aws服务器上运行2.改一下代码,把部分负载放到cpu上
5353

0 commit comments

Comments
 (0)