Selective-Projection-Decay

This repo implements the AdamSPD optimizer in the paper Rethinking Weight Decay for Robust Fine-Tuning of Foundation Models.

Use AdamSPD in Your Project

AdamSPD is the AdamW variant with built-in Selective Projection Decay for fine-tuning. It can be easily intergrated into you project for robust fine-tuning of a pre-trained model. Copy the adamSPD.py file into your optimizer folder. Here is an example how you would incoroprate the AdamSPD optimizer into your project.

from adamSPD import AdamSPD
optimizer_params = {
            "lr": args.lr,
            "weight_decay": args.weight_decay,
} # Initalize optimizer parameters
params_to_opt = [x[1] for x in model.named_parameters() if x[1].requires_grad]
params_anchor = copy.deepcopy(params_to_opt) # Cache pre-trained model weights 
param_group = [{'params':params_to_opt,
                'pre': params_anchor}]
optimizer = AdamSPD(param_group,**optimizer_params)

Working with Parameter-Efficient-Fine-Tuning (PEFT) methods such as LORA, AdamSPD does not require storing the pre-trained weights.

from adamSPD import AdamSPD
optimizer_params = {
            "lr": args.lr,
            "weight_decay": args.weight_decay,
} # Initalize optimizer parameters
params_to_opt = [x[1] for x in model.named_parameters() if x[1].requires_grad]
param_group = [{'params':params_to_opt,
                'pre': None}]
optimizer = AdamSPD(param_group,**optimizer_params)

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
README.md		README.md
adamSPD.py		adamSPD.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Selective-Projection-Decay

Use AdamSPD in Your Project

About

Releases

Packages

Languages

GT-RIPL/Selective-Projection-Decay

Folders and files

Latest commit

History

Repository files navigation

Selective-Projection-Decay

Use AdamSPD in Your Project

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages