Google DeepMind lanserar DiffusionGemma för lokal inferens
Google DeepMind har lanserat DiffusionGemma, en experimentell modell på 26 miljarder parametrar. Denna modell ersätter traditionell token-för-token-generering med diskret textdiffusion för effektivare lokal inferens.

Vad har hänt
Google DeepMind har offentliggjort DiffusionGemma, en experimentell modell om 26 miljarder parametrar. Modellen, baserad på Gemma 4, ändrar textgenerering från sekventiell till diskret textdiffusion. Detta sker genom parallell generering och förfining av text i block, vilket syftar till att kringgå flaskhalsar relaterade till minnesbandbredd vid lokal inferens.
Snabbfakta
| Modell | DiffusionGemma |
|---|---|
| Parametrar (totalt) | 26 miljarder |
| Parametrar (aktiva) | 3,8 miljarder |
| Kontextfönster | 256K tokens |
| Genereringsmetod | Diskret textdiffusion |
”DiffusionGemma Shifts 26B Local Inference to Parallel Decoding”
”Built on the Gemma 4 backbone, the open-weight release drafts and refines text in parallel blocks to bypass the memory bandwidth bottlenecks that typically constrain local throughput.”
Varför det spelar roll
DiffusionGemmas arkitektur, med en Mixture-of-Experts (MoE) design som har 3,8 miljarder aktiva parametrar under exekvering, skiljer sig från autoregressiva modeller. Den använder Uniform State Diffusion för att fylla en textyta på 256 tokens samtidigt över flera denoisingssteg. Detta möjliggör en mer effektiv lokal inferens.
Vem påverkas
Denna modell är primärt relevant för utvecklare och forskare som arbetar med storskaliga språkmodeller och lokal inferens. Användare av applikationer som bygger på denna typ av teknik kan dra nytta av snabbare textgenerering på lokala enheter. Företag som utvecklar AI-lösningar för lokala miljöer påverkas direkt av de nya möjligheterna till prestandaförbättringar.
EU-status
Ej relevant för EU-status.
Mer att veta
Modellen har en kontextfönster på 256K tokens och stöder text, bilder och video som indata. Ljudbehandling ingår inte i den nuvarande versionen. Den är optimerad för enskilda användares lokala inferensarbetsbelastningar.
Snabba svar om den här nyheten
Vad har hänt?
När hände det?
Varför spelar det roll?
Länken öppnar i nytt fönster och leder till utgivarens egen sida.
Källan har spårats automatiskt från utgivaren via Fronts signalkedja.