Claude is niet een model, het is een familie van modellen. En welk model je kiest maakt nogal wat uit voor zowel de kwaliteit als de prijs van wat je terugkrijgt. Hier leg ik uit wat de verschillen zijn en wanneer je welk model pakt.
Haiku 4.5: snel en goedkoop
Haiku kost $1 per miljoen input tokens en $5 per miljoen output tokens. Het is veruit het goedkoopste model en ook het snelste. Ideaal voor taken waar je hoge volumes verwerkt en waar snelheid belangrijker is dan nuance. Denk aan classificatie, simpele samenvattingen, of het beantwoorden van veelgestelde vragen.
Waar Haiku minder geschikt voor is: complexe analyses, creatief schrijven met veel nuance, of taken waar je echt diep redeneren nodig hebt.
Sonnet 4.6: het werkpaard
Sonnet kost $3 per miljoen input tokens en $15 per miljoen output tokens. Dit is voor de meeste mensen het model dat ze het vaakst zullen gebruiken. De kwaliteit zit dicht bij Opus, maar je betaalt maar een vijfde van de prijs.
Sonnet is de beste balans tussen kwaliteit en kosten. Het kan prima overweg met complexere taken, schrijft goed, en is snel genoeg voor de meeste toepassingen. Er is inmiddels ook een Sonnet 5 ("Fennec") aangekondigd die de lat voor codering nog hoger legt.
Een detail om te weten: bij extended context, als je meer dan 200.000 tokens in een conversatie stopt, verdubbelt de prijs naar $6 input en $22,50 output. Maar met Prompt Caching kun je de effectieve input-prijs terugbrengen naar $0,30 per miljoen tokens, wat het weer heel betaalbaar maakt.
Opus 4.6: het vlaggenschip
Opus kost $15 per miljoen input tokens en $75 per miljoen output tokens. Dit is het duurste model, maar ook het krachtigste. Met een context window van 1 miljoen tokens en de beste prestaties op complex redeneren en agentische taken is dit het model voor als je het beste van het beste nodig hebt.
Gebruik Opus voor diepe analytische vragen, architecturale beslissingen, of situaties waar je Claude langdurig zelfstandig laat werken. Het verschil met Sonnet merk je vooral bij taken die meerdere stappen redeneren vereisen.
En dan is er nog Mythos
Er wordt gesproken over een model genaamd Claude Mythos, dat boven Opus zou zitten. Het zou bijzonder sterk zijn in cybersecurity en complex redeneren. Officieel is er weinig over bekend, maar het geeft aan dat Anthropic blijft doorontwikkelen aan de bovenkant van het spectrum.
Fast Mode
Voor elk model bestaat er een Fast Mode die sneller output levert, maar tegen een hogere prijs. Bij Opus betekent dat $30 input en $150 output per miljoen tokens, dus 6x de standaardprijs. Dat is flink, maar voor real-time toepassingen waar elke milliseconde telt kan het de moeite waard zijn.
Welk model kies jij?
De vuistregel is simpel. Start met Sonnet. Als het niet goed genoeg is, stap over naar Opus. Als het sneller en goedkoper moet, probeer Haiku. De meeste gebruikers komen prima uit met Sonnet voor 90% van hun werk.
Wil je meer weten over wat Claude precies is? Begin dan bij de introductie voor ondernemers. Benieuwd welk abonnement bij je past? Of wil je weten hoe je met slimme technieken de kosten verder drukt? Die artikelen helpen je verder.
En als je de modellen wilt vergelijken met ChatGPT en Gemini, hebben we daar ook een artikel over.