Implementing Transformer Models from Scratch

Transformer系モデルをスクラッチ実装し、理解を深める。

実装

Vanilla Transformer¹: models/vanilla_transformer.py
GPT-2²: models/gpt2.py
Vision Transformer³: models/vision_transformer.py
CLIP⁴: models/clip.py
学習コード（言語モデル学習のみ）: train.py

プログラム実行

uv sync

トークナイザー学習

学習済みのTokenizerは置いてあるのでやらなくてもいい。

uv run python train_tokenizer.py

学習

config/にモデルの設定をtoml形式で記述し、ファイル名を指定する。

uv run torchrun --nproc_per_node=1 train.py -c gpt2

デモ

学習したモデルを使って実際に文章生成を試す。

playground.ipynb

学習済みモデル

本プログラムで学習したモデルはHugging Faceにアップロード済み。

Name		Name	Last commit message	Last commit date
Latest commit History 198 Commits
config		config
models		models
trained		trained
utils		utils
.python-version		.python-version
LICENSE		LICENSE
README.md		README.md
playground.ipynb		playground.ipynb
pyproject.toml		pyproject.toml
train.py		train.py
train_tokenizer.py		train_tokenizer.py
uv.lock		uv.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Implementing Transformer Models from Scratch

実装

プログラム実行

トークナイザー学習

学習

デモ

学習済みモデル

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Implementing Transformer Models from Scratch

実装

プログラム実行

トークナイザー学習

学習

デモ

学習済みモデル

Footnotes

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages