PAI-Megatron-Patch里的example中的所有预训练模型,拉最新main分支的代码或者是最新的版本的代码,只有30%左右的模型可以跑起来,其余模型均跑不起。
我把example里面的预训练模型都跑了一遍,基本总结就是在大多数的模型中,有readme的基本能跑起来,没有readme的基本上跑不起来。
其他模型各自报错,多数是类型于下面下面这样的报错。
from megatron import get_args
ImportError: cannot import name 'get_args' from 'megatron' (unknown location)
不是这个模块没有就是那个模块没有,也不知道用那个版本对应那个版本。
我当前跑的Pai-Megatron-Patch版本是
commit a098ca5 (HEAD -> main, origin/main, origin/HEAD)
如果官方对某些模型不在进行维护,能否在更新的版本中删除相关的模型。