【开源实习】albert模型微调 #1981

outbreak-sen · 2025-03-10T04:11:15Z

实现了"albert/albert-base-v1"模型在"SetFit/20_newsgroups"数据集上的微调实验。
任务链接在https://gitee.com/mindspore/community/issues/IAUONP
transformers+pytorch+4060的benchmark是自己编写的，仓库位于https://github.com/outbreak-sen/albert_finetuned
更改代码位于llm/finetune/albert，只包含mindnlp+mindspore的
实验结果如下

Albert的20Newspaper微调

资源规格：NPU: 1*Ascend-D910B(显存: 64GB), CPU: 24, 内存: 192GB

智算中心：武汉智算中心

镜像：mindspore_2_5_py311_cann8

torch训练硬件资源规格：Nvidia 3090

模型："albert/albert-base-v1"

数据集："SetFit/20_newsgroups"

由于训练的损失过长，只取最后十五个loss展示

outbreak-sen added 5 commits March 4, 2025 10:02

update

0a94050

change to autotokenizer

5cbd346

添加blenderbot的微调库

ba0935b

添加albert的微调库

dcb25f7

改一下文档

93c49bf