Skip to content

PAI-Megatron-Patch里的example中的所有模型,拉最新main分支的代码或者是最新的版本的代码,只有30%左右的模型可以跑起来,其余模型均跑不起来 #714

@suiyan538

Description

@suiyan538

PAI-Megatron-Patch里的example中的所有预训练模型,拉最新main分支的代码或者是最新的版本的代码,只有30%左右的模型可以跑起来,其余模型均跑不起。
我把example里面的预训练模型都跑了一遍,基本总结就是在大多数的模型中,有readme的基本能跑起来,没有readme的基本上跑不起来。
其他模型各自报错,多数是类型于下面下面这样的报错。

from megatron import get_args
ImportError: cannot import name 'get_args' from 'megatron' (unknown location)

不是这个模块没有就是那个模块没有,也不知道用那个版本对应那个版本。

我当前跑的Pai-Megatron-Patch版本是
commit a098ca5 (HEAD -> main, origin/main, origin/HEAD)

如果官方对某些模型不在进行维护,能否在更新的版本中删除相关的模型。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions