msitarzewski
diff --git a/‎README.md‎
Lines changed: 34 additions & 9 deletions b/‎README.md‎
Lines changed: 34 additions & 9 deletions
diff --git a/‎alembic/versions/001_v01_baseline.py‎
Lines changed: 134 additions & 0 deletions b/‎alembic/versions/001_v01_baseline.py‎
Lines changed: 134 additions & 0 deletions
diff --git a/‎alembic/versions/002_v02_schema.py‎
Lines changed: 90 additions & 0 deletions b/‎alembic/versions/002_v02_schema.py‎
Lines changed: 90 additions & 0 deletions
diff --git a/‎alembic/versions/003_v02_votes.py‎
Lines changed: 37 additions & 0 deletions b/‎alembic/versions/003_v02_votes.py‎
Lines changed: 37 additions & 0 deletions
@@ -22,21 +22,30 @@ duh ask "What database should I use for a new SaaS product?"
 ## Features
 
 - **Multi-model consensus** -- Claude and GPT debate. Sycophantic challenges are detected and flagged.
-- **Persistent memory** -- Every thread, contribution, and decision stored in SQLite. Search with `duh recall`.
+- **Voting protocol** -- Fan out to all models in parallel, aggregate answers via majority or weighted synthesis.
+- **Query decomposition** -- Break complex questions into subtask DAGs, solve in parallel, synthesize results.
+- **Decision taxonomy** -- Auto-classify decisions by intent, category, and genus for structured recall.
+- **Outcome tracking** -- Record success/failure/partial feedback on past decisions.
+- **Tool-augmented reasoning** -- Models can call web search, read files, and execute code during consensus.
+- **Persistent memory** -- Every thread, contribution, decision, vote, and subtask stored in SQLite. Search with `duh recall`.
 - **Cost tracking** -- Per-model token costs in real-time. Configurable warn threshold and hard limit.
 - **Local models** -- Ollama and LM Studio via the OpenAI-compatible API. Mix cloud + local.
-- **Docker** -- Run in a container with persistent volume storage.
 - **Rich CLI** -- Styled panels, spinners, and formatted output.
 
 ## Commands
 
 ```bash
-duh ask "question"        # Run consensus query
-duh recall "keyword"      # Search past decisions
-duh threads               # List past threads
-duh show <thread-id>      # Inspect full debate history
-duh models                # List available models
-duh cost                  # Show cumulative costs
+duh ask "question"                      # Run consensus query
+duh ask "question" --decompose          # Decompose into subtasks first
+duh ask "question" --protocol voting    # Use voting protocol instead
+duh ask "question" --protocol auto      # Auto-select protocol by question type
+duh ask "question" --tools              # Enable tool use (web search, file read, code exec)
+duh feedback <thread-id> --result success   # Record outcome for a decision
+duh recall "keyword"                    # Search past decisions
+duh threads                             # List past threads
+duh show <thread-id>                    # Inspect full debate history
+duh models                              # List available models
+duh cost                                # Show cumulative costs
 ```
 
 ## How consensus works
@@ -46,12 +55,28 @@ PROPOSE  -->  CHALLENGE  -->  REVISE  -->  COMMIT
 ```
 
 1. Strongest model proposes an answer
-2. Other models challenge with forced disagreement
+2. Other models challenge with forced disagreement (4 framing types: flaw, alternative, risk, devil's advocate)
 3. Proposer revises, addressing each valid challenge
 4. Decision extracted with confidence score and preserved dissent
 
 Convergence detection (Jaccard similarity >= 0.7) stops early when challenges repeat.
 
+### Voting protocol
+
+```
+FAN-OUT (all models)  -->  AGGREGATE (majority / weighted)
+```
+
+All models answer independently in parallel. A meta-judge (strongest model) picks the best answer (majority) or synthesizes all answers weighted by capability (weighted).
+
+### Decomposition
+
+```
+DECOMPOSE  -->  SCHEDULE (topological sort)  -->  SYNTHESIZE
+```
+
+Complex questions are broken into a subtask DAG. Independent subtasks run in parallel. Results are synthesized into a final answer by the strongest model.
+
 ## Phase 0 benchmark
 
 Before building duh, we validated the thesis: 50 questions, 4 methods, blind LLM-as-judge evaluation. Consensus consistently outperformed direct answers, self-debate, and ensemble approaches -- especially on questions requiring nuanced judgment and multi-perspective analysis. See [full benchmark results](docs/reference/benchmarks.md).
 
@@ -0,0 +1,134 @@
+"""v0.1 baseline schema.
+
+Revision ID: 001
+Revises:
+Create Date: 2026-02-16
+"""
+
+from __future__ import annotations
+
+import sqlalchemy as sa
+from alembic import op
+
+revision: str = "001"
+down_revision: str | None = None
+branch_labels: tuple[str, ...] | None = None
+depends_on: str | None = None
+
+
+def upgrade() -> None:
+    op.create_table(
+        "threads",
+        sa.Column("id", sa.String(36), primary_key=True),
+        sa.Column("question", sa.Text(), nullable=False),
+        sa.Column("status", sa.String(20), nullable=False, server_default="active"),
+        sa.Column("created_at", sa.DateTime(), nullable=False),
+        sa.Column("updated_at", sa.DateTime(), nullable=False),
+    )
+    op.create_index("ix_threads_status", "threads", ["status"])
+    op.create_index("ix_threads_created_at", "threads", ["created_at"])
+
+    op.create_table(
+        "turns",
+        sa.Column("id", sa.String(36), primary_key=True),
+        sa.Column(
+            "thread_id",
+            sa.String(36),
+            sa.ForeignKey("threads.id"),
+            nullable=False,
+        ),
+        sa.Column("round_number", sa.Integer(), nullable=False),
+        sa.Column("state", sa.String(20), nullable=False),
+        sa.Column("created_at", sa.DateTime(), nullable=False),
+        sa.Column("completed_at", sa.DateTime(), nullable=True),
+    )
+    op.create_index("ix_turns_thread_id", "turns", ["thread_id"])
+    op.create_index(
+        "ix_turns_thread_round",
+        "turns",
+        ["thread_id", "round_number"],
+        unique=True,
+    )
+
+    op.create_table(
+        "contributions",
+        sa.Column("id", sa.String(36), primary_key=True),
+        sa.Column(
+            "turn_id",
+            sa.String(36),
+            sa.ForeignKey("turns.id"),
+            nullable=False,
+        ),
+        sa.Column("model_ref", sa.String(100), nullable=False),
+        sa.Column("role", sa.String(20), nullable=False),
+        sa.Column("content", sa.Text(), nullable=False),
+        sa.Column("input_tokens", sa.Integer(), nullable=False, server_default="0"),
+        sa.Column("output_tokens", sa.Integer(), nullable=False, server_default="0"),
+        sa.Column("cost_usd", sa.Float(), nullable=False, server_default="0.0"),
+        sa.Column("latency_ms", sa.Float(), nullable=False, server_default="0.0"),
+        sa.Column("created_at", sa.DateTime(), nullable=False),
+    )
+    op.create_index("ix_contributions_turn_id", "contributions", ["turn_id"])
+    op.create_index("ix_contributions_model_ref", "contributions", ["model_ref"])
+
+    op.create_table(
+        "turn_summaries",
+        sa.Column("id", sa.String(36), primary_key=True),
+        sa.Column(
+            "turn_id",
+            sa.String(36),
+            sa.ForeignKey("turns.id"),
+            unique=True,
+            nullable=False,
+        ),
+        sa.Column("summary", sa.Text(), nullable=False),
+        sa.Column("model_ref", sa.String(100), nullable=False),
+        sa.Column("created_at", sa.DateTime(), nullable=False),
+    )
+
+    op.create_table(
+        "thread_summaries",
+        sa.Column("id", sa.String(36), primary_key=True),
+        sa.Column(
+            "thread_id",
+            sa.String(36),
+            sa.ForeignKey("threads.id"),
+            unique=True,
+            nullable=False,
+        ),
+        sa.Column("summary", sa.Text(), nullable=False),
+        sa.Column("model_ref", sa.String(100), nullable=False),
+        sa.Column("created_at", sa.DateTime(), nullable=False),
+    )
+
+    op.create_table(
+        "decisions",
+        sa.Column("id", sa.String(36), primary_key=True),
+        sa.Column(
+            "turn_id",
+            sa.String(36),
+            sa.ForeignKey("turns.id"),
+            unique=True,
+            nullable=False,
+        ),
+        sa.Column(
+            "thread_id",
+            sa.String(36),
+            sa.ForeignKey("threads.id"),
+            nullable=False,
+        ),
+        sa.Column("content", sa.Text(), nullable=False),
+        sa.Column("confidence", sa.Float(), nullable=False, server_default="0.0"),
+        sa.Column("dissent", sa.Text(), nullable=True),
+        sa.Column("created_at", sa.DateTime(), nullable=False),
+    )
+    op.create_index("ix_decisions_thread_id", "decisions", ["thread_id"])
+
+
+def downgrade() -> None:
+    op.drop_table("decisions")
+    op.drop_table("thread_summaries")
+    op.drop_table("turn_summaries")
+    op.drop_table("contributions")
+    op.drop_table("turns")
+    op.drop_table("threads")
@@ -0,0 +1,90 @@
+"""v0.2 schema — taxonomy, outcomes, subtasks.
+
+Revision ID: 002
+Revises: 001
+Create Date: 2026-02-16
+"""
+
+from __future__ import annotations
+
+import sqlalchemy as sa
+from alembic import op
+
+revision: str = "002"
+down_revision: str = "001"
+branch_labels: tuple[str, ...] | None = None
+depends_on: str | None = None
+
+
+def upgrade() -> None:
+    # Add taxonomy columns to decisions
+    with op.batch_alter_table("decisions") as batch_op:
+        batch_op.add_column(sa.Column("intent", sa.String(50), nullable=True))
+        batch_op.add_column(sa.Column("category", sa.String(50), nullable=True))
+        batch_op.add_column(sa.Column("genus", sa.String(50), nullable=True))
+
+    # Outcomes table
+    op.create_table(
+        "outcomes",
+        sa.Column("id", sa.String(36), primary_key=True),
+        sa.Column(
+            "decision_id",
+            sa.String(36),
+            sa.ForeignKey("decisions.id"),
+            unique=True,
+            nullable=False,
+        ),
+        sa.Column(
+            "thread_id",
+            sa.String(36),
+            sa.ForeignKey("threads.id"),
+            nullable=False,
+        ),
+        sa.Column("result", sa.String(20), nullable=False),
+        sa.Column("notes", sa.Text(), nullable=True),
+        sa.Column("created_at", sa.DateTime(), nullable=False),
+        sa.Column("updated_at", sa.DateTime(), nullable=False),
+    )
+    op.create_index("ix_outcomes_thread_id", "outcomes", ["thread_id"])
+
+    # Subtasks table
+    op.create_table(
+        "subtasks",
+        sa.Column("id", sa.String(36), primary_key=True),
+        sa.Column(
+            "parent_thread_id",
+            sa.String(36),
+            sa.ForeignKey("threads.id"),
+            nullable=False,
+        ),
+        sa.Column(
+            "child_thread_id",
+            sa.String(36),
+            sa.ForeignKey("threads.id"),
+            nullable=True,
+        ),
+        sa.Column("label", sa.String(200), nullable=False),
+        sa.Column("description", sa.Text(), nullable=False),
+        sa.Column("dependencies", sa.Text(), nullable=False, server_default="[]"),
+        sa.Column(
+            "status",
+            sa.String(20),
+            nullable=False,
+            server_default="pending",
+        ),
+        sa.Column("sequence_order", sa.Integer(), nullable=False, server_default="0"),
+        sa.Column("created_at", sa.DateTime(), nullable=False),
+        sa.Column("updated_at", sa.DateTime(), nullable=False),
+    )
+    op.create_index(
+        "ix_subtasks_parent_thread_id", "subtasks", ["parent_thread_id"]
+    )
+
+
+def downgrade() -> None:
+    op.drop_table("subtasks")
+    op.drop_table("outcomes")
+    with op.batch_alter_table("decisions") as batch_op:
+        batch_op.drop_column("genus")
+        batch_op.drop_column("category")
+        batch_op.drop_column("intent")
@@ -0,0 +1,37 @@
+"""v0.2 schema -- votes table for voting protocol.
+
+Revision ID: 003
+Revises: 002
+Create Date: 2026-02-16
+"""
+
+from __future__ import annotations
+
+import sqlalchemy as sa
+from alembic import op
+
+revision: str = "003"
+down_revision: str = "002"
+branch_labels: tuple[str, ...] | None = None
+depends_on: str | None = None
+
+
+def upgrade() -> None:
+    op.create_table(
+        "votes",
+        sa.Column("id", sa.String(36), primary_key=True),
+        sa.Column(
+            "thread_id",
+            sa.String(36),
+            sa.ForeignKey("threads.id"),
+            nullable=False,
+        ),
+        sa.Column("model_ref", sa.String(100), nullable=False),
+        sa.Column("content", sa.Text(), nullable=False),
+        sa.Column("created_at", sa.DateTime(), nullable=False),
+    )
+    op.create_index("ix_votes_thread_id", "votes", ["thread_id"])
+
+
+def downgrade() -> None:
+    op.drop_table("votes")