-
Notifications
You must be signed in to change notification settings - Fork 6
/
Copy pathevaluate-silver.sh
69 lines (64 loc) · 1.69 KB
/
evaluate-silver.sh
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
#!/bin/bash
seed=${1:-42}
# or xlm-roberta-large
encoder=${2:-"bert-base-multilingual-cased"}
task=${3:-"ner-wiki"}
system=${4:-"helsinki_opus.mbert_l8"}
lng=${5:-"ar"}
root_dir="${ROOT_DIR:-/bigdata}"
save_path="$root_dir"/checkpoints/clnlp/en-$lng.silver.$system
encoder_name=$(echo "$encoder" | cut -d/ -f2)
case "$task" in
"ner-wiki")
case "$lng" in
"zh") lng_name="zh-word" ;;
*) lng_name="$lng" ;;
esac
src=("$lng.from_en.$system" en)
tgt=("$lng_name" en)
data_path="$root_dir"/data/"$task"
;;
"udpos" | "parsing")
case "$lng" in
"ar") lng_name="Arabic-PADT" ;;
"de") lng_name="German-GSD" ;;
"en") lng_name="English-EWT" ;;
"es") lng_name="Spanish-GSD" ;;
"fr") lng_name="French-GSD" ;;
"hi") lng_name="Hindi-HDTB" ;;
"ru") lng_name="Russian-GSD" ;;
"vi") lng_name="Vietnamese-VTB" ;;
"zh") lng_name="Chinese-GSD" ;;
*) lng_name="$lng" ;;
esac
src=("$lng.from_en.$system" English-EWT)
tgt=("$lng_name" English-EWT)
data_path="$root_dir"/data/universaldependencies/ud-treebanks-v2.7
;;
*)
echo Unsupported task "$task"
exit 1
;;
esac
ep=5
bs=32
lr=2e-5
val_check_interval=0.25
python src/train.py \
--seed "$seed" \
--task "$task" \
--data_dir "$data_path" \
--trn_langs "${src[@]}" \
--val_langs "${src[@]}" \
--tst_langs "${tgt[@]}" \
--pretrain "$encoder" \
--batch_size $bs \
--eval_batch_size 16 \
--learning_rate $lr \
--max_epochs $ep \
--warmup_portion 0.1 \
--val_check_interval $val_check_interval \
--gpus 1 \
--precision 16 \
--default_save_path "$save_path/$task/$encoder_name" \
--exp_name "bs$bs-lr$lr-ep$ep-fp16/seed-$seed"