DeepSeek heeft V3.2-Exp gepresenteerd, een AI-model dat voor het eerst werkt met DeepSeek Sparse Attention. Daardoor moet het AI-model efficiënter lange stukken tekst kunnen verwerken dan voorgaande versies.
V3.2-Exp is een tussenstap naar een volledige V3.2, zegt DeepSeek. De experimentele versie scoort hetzelfde op benchmarks als V3.1, maar tegen aanzienlijk lagere kosten, claimt het bedrijf. Dat is vooral goedkoper voor gebruiksscenario’s waarbij klanten lange teksten in het AI-model gooien.
Sparse Attention werkt met een combinatie van technieken, waarbij het model groepen woorden samenvat en vervolgens de belangrijkste woorden en woordgroepen kiest om te verwerken, in plaats van de hele tekst. Huawei gaat de nieuwste versie ondersteunen op zijn hardware.
Source: Tweakers.net