Problem / Opportunity
Riskante aanname _We geloven dat…_
…EduPlan LLM-agnostisch is te maken en we nog steeds dezelfde accurate toelichting krijgen op de uitvalprognose van de desbetreffende (Leven-lang-)lerenden.
Weerlegbare hypothese We verwachten dat…
…we een net zo goed ‘EduPlan’ te kunnen generen met een GPT-NL, OpenEuroLLM of andere LLM, via de AI-hub, als met de huidige gpt-4o-mini, via de Responses API.
Appetite (timebox)
Large (5-6 dagen)
Solution
Experiment Om dit te verifiëren zullen we…
…een prototype bouwen dat een ‘EduPlan’ genereert met een andere LLM via de AI-hub.
Metric En meten we...
…dat zo’n ‘EduPlan’ dezelfde relevante toelichtingen geeft als via het huidige gpt-4o-mini model.
Succes criteria W_e hebben gelijk als…_
…minimaal 8 SLB'ers, mentoren en docenten in het mbo, het ‘EduPlan’ gemiddeld hoger of gelijk beoordelen als het ‘EduPlan’ gegenereerd middels het gpt-4o-mini model.
Risks / Rabbit holes
No response
No-Gos
No response
Gevalideerd met
@EdF2021
Sparring partner
@EdF2021
Problem / Opportunity
Riskante aanname _We geloven dat…_
…EduPlan LLM-agnostisch is te maken en we nog steeds dezelfde accurate toelichting krijgen op de uitvalprognose van de desbetreffende (Leven-lang-)lerenden.
Weerlegbare hypothese We verwachten dat…
…we een net zo goed ‘EduPlan’ te kunnen generen met een GPT-NL, OpenEuroLLM of andere LLM, via de AI-hub, als met de huidige gpt-4o-mini, via de Responses API.
Appetite (timebox)
Large (5-6 dagen)
Solution
Experiment Om dit te verifiëren zullen we…
…een prototype bouwen dat een ‘EduPlan’ genereert met een andere LLM via de AI-hub.
Metric En meten we...
…dat zo’n ‘EduPlan’ dezelfde relevante toelichtingen geeft als via het huidige gpt-4o-mini model.
Succes criteria W_e hebben gelijk als…_
…minimaal 8 SLB'ers, mentoren en docenten in het mbo, het ‘EduPlan’ gemiddeld hoger of gelijk beoordelen als het ‘EduPlan’ gegenereerd middels het gpt-4o-mini model.
Risks / Rabbit holes
No response
No-Gos
No response
Gevalideerd met
@EdF2021
Sparring partner
@EdF2021