汎用的なデータサイエンスプロジェクト用のDocker開発環境です。DevContainer、uv、最新のPythonツールチェーンを使用した効率的な開発をサポートします。
- 🐳 Docker & DevContainer: 完全にコンテナ化された開発環境
- 📦 uv パッケージマネージャー: 高速で信頼性の高いPythonパッケージ管理
- 🐍 Python 3.11: 最新の安定版Python
- ⚡ 軽量設計: 必要最小限のパッケージで高速起動
- 📊 基本データサイエンスツール: NumPy, Pandas, Polars, Pandera
- 🎨 可視化ツール: Matplotlib, Seaborn, Plotly
- 📝 Jupyter Lab: インタラクティブな開発環境
- 🚀 Streamlit: 素早いWebアプリ作成
.
├── .devcontainer/ # DevContainer設定
│ └── devcontainer.json
├── .github/ # GitHub関連テンプレート
│ ├── ISSUE_TEMPLATE/
│ └── PULL_REQUEST_TEMPLATE.md
├── .streamlit/ # Streamlit設定
├── app/ # アプリケーションコード
├── data/ # データセット
├── docs/ # ドキュメント
│ └── setup.md # セットアップガイド
├── model/ # 学習済みモデル
├── notebook/ # Jupyterノートブック
├── outputs/ # 出力ファイル
├── src/ # ソースコード
│ └── taxi_prediction/ # サンプルプロジェクト
├── scripts/ # ユーティリティスクリプト
├── tests/ # テストコード
├── .env.example # 環境変数テンプレート
├── .gitignore
├── Dockerfile
├── LICENSE
├── README.md
├── compose.yml
├── uv.lock
└── pyproject.toml # プロジェクト設定とパッケージ依存関係
- Docker Desktop
- リポジトリをクローン:
git clone <repository-url>
cd DataScience_Starter_Docker- 環境を起動:
make upこれだけ!🎉
# コンテナに入る
make shell
# Jupyter Labを起動
make jupyter
# 環境を停止
make down
# 環境の状態確認
make status
# ヘルプを表示
make help- VSCodeでプロジェクトを開く
Cmd/Ctrl + Shift + P→ "Dev Containers: Attach to Running Container"を選択data-science-lightコンテナを選択
uv add pandas numpy scikit-learnuv add --dev pytest black ruffuv syncpyproject.tomlには以下のオプショナルな依存関係が定義されています:
nlp: 自然言語処理用パッケージcv: コンピュータビジョン用パッケージ
インストール例:
uv sync --extra nlp
uv sync --extra cv詳細なセットアップ手順とトラブルシューティングについては、docs/setup.mdを参照してください。
このプロジェクトはMITライセンスの下で公開されています。詳細はLICENSEファイルを参照してください。
プルリクエストを歓迎します。大きな変更の場合は、まずissueを開いて変更内容について議論してください。