Name		Name	Last commit message	Last commit date
parent directory ..
README.md		README.md
__init__.py		__init__.py
configuration_mixtral.py		configuration_mixtral.py
internevo.patch		internevo.patch
modeling_mixtral.py		modeling_mixtral.py

README.md

Info

model:

https://github.com/huggingface/transformers/blob/main/src/transformers/models/mixtral/modeling_mixtral.py

config:

https://github.com/huggingface/transformers/blob/main/src/transformers/models/mixtral/configuration_mixtral.py

commit id:

5af7d41e49bbfc8319f462eb45253dcb3863dfb7

Usage

How to apply InternEvo patch to support Variable-Length and Intern Sequence Parallel training?

patch modeling_mixtral.py internevo.patch