TFM for Medical Prognostic Task

Survival analysis framework based on NeuralFineGray models, Survival Stacking, and foundation model embeddings (TabICL, TabPFN, TARTE).

Environment Setup

Two environments are available depending on the embedding method:

TabICL/TabPFN Environment

# Create environment
conda create -n tab_env python=3.11
conda activate tab_env

# setup environment
cd NeuralFineGray
python -m setup_tabpfn_tabicl --install-deps

TARTE Environment

# Create environment
conda create -n tarte_env python=3.11
conda activate tarte_env

# setup environment
cd NeuralFineGray
python -m setup_tarte --install-deps

HuggingFace Token (for TabPFN)

export HF_TOKEN="your_token_here"
# Or create .env file with: HF_TOKEN=your_token_here

Note

make sure to run

cd NeuralFineGray
python -m setup_tarte

before running TARTE experiments and

cd NeuralFineGray
python -m setup_tabpfn_tabicl

otherwise.

Core Concepts

This framework provides four main experimental pipelines:

Baseline Experiments - Individual survival models (CoxPH, DeepSurv, RSF, XGBoost, NFG) with hyperparameter tuning
Tabular Foundation Model Embeddings - Enhance survival models with TabICL, TabPFN, or TARTE embeddings
Survival Stacking - Ensemble methods combining multiple base learners with optional embeddings
Competing Risks Analysis - Multi-event survival models using discrete-time approaches

Available Datasets

Dataset	Type	Description
METABRIC	Binary survival	Breast cancer, ~2000 samples
SUPPORT	Binary survival	ICU mortality, ~9000 samples
PBC	Binary survival	Primary biliary cirrhosis, ~418 samples
SYNTHETIC_COMPETING	Competing risks	Synthetic data with 2 event types
SEER_competing_risk	Competing risks	Cancer registry (requires local file)

Experiment Guides

Each pipeline has detailed step-by-step instructions in its own README:

1. Baseline Experiments

📖 See experiments/README.md for detailed instructions on:

Running individual models (CoxPH, DeepSurv, RSF, XGBoost, NFG)
Hyperparameter search configuration
Using raw features or TabPFN embeddings
SLURM batch job submission

2. Tabular Foundation Model Embeddings

📖 See tfm/README.md for detailed instructions on:

Generating TabICL, TabPFN, or TARTE embeddings
Running cross-validation experiments
Comparing raw vs deep vs deep+raw feature modes
Environment-specific requirements

3. Survival Stacking

📖 See survivalStacking/README.md for detailed instructions on:

Running ensemble stacking benchmarks
Combining base learners with embeddings
Statistical significance testing
Visualization of results

4. Competing Risks Analysis

📖 See CompetingRisks/README.md for detailed instructions on:

Discrete-time multiclass approaches
Hybrid NFG models
Benchmarking on synthetic and real datasets

Quick Examples

# Baseline experiment
python -m experiments.run_experiment --dataset METABRIC --model coxph --mode raw

# Survival stacking
python -m survivalStacking.run_full_benchmark --dataset METABRIC --cv 5

# Competing risks
python -m CompetingRisks.run_benchmark --datasets SYNTHETIC_COMPETING

Results

All experiments save results to results/ with organized subdirectories:

results/experiments/ - Baseline model results
results/tabicl/, results/tabpfn/, results/tarte/ - Embedding experiments
results/survival_stacking/ - Stacking ensemble results
results/competing_risks/ - Competing risks benchmarks

Plots are saved in plots/ subdirectories within each results folder https://github.com/SajbenDani

Credits

This project is based on NeuralFineGray Copyright (c) 2021 Vincent Jeanselme, developed at TUM (Lab for AI in Medicine) by Dániel Sajben, Amelie Trautwein and Mohamed Amine Frouja and supervised by Dmitrii Seletkov.

Name		Name	Last commit message	Last commit date
Latest commit History 251 Commits
.idea		.idea
CompetingRisks		CompetingRisks
DeepSurvivalMachines		DeepSurvivalMachines
core		core
coxph		coxph
datasets		datasets
deephit		deephit
deepsurv		deepsurv
desurv		desurv
examples		examples
experiments		experiments
images		images
metrics		metrics
nfg		nfg
requirements		requirements
results		results
rsf		rsf
survivalStacking		survivalStacking
tfm		tfm
xgb_survival		xgb_survival
xgboost_baseline		xgboost_baseline
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
pandas_patch.py		pandas_patch.py
setup_tabpfn_tabicl.py		setup_tabpfn_tabicl.py
setup_tarte.py		setup_tarte.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

TFM for Medical Prognostic Task

Environment Setup

TabICL/TabPFN Environment

TARTE Environment

HuggingFace Token (for TabPFN)

Note

Core Concepts

Available Datasets

Experiment Guides

1. Baseline Experiments

2. Tabular Foundation Model Embeddings

3. Survival Stacking

4. Competing Risks Analysis

Quick Examples

Results

Credits

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

TFM for Medical Prognostic Task

Environment Setup

TabICL/TabPFN Environment

TARTE Environment

HuggingFace Token (for TabPFN)

Note

Core Concepts

Available Datasets

Experiment Guides

1. Baseline Experiments

2. Tabular Foundation Model Embeddings

3. Survival Stacking

4. Competing Risks Analysis

Quick Examples

Results

Credits

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages