Google· LanseringTillgängligt

Google DeepMind lanserar DiffusionGemma för lokal inferens

Google DeepMind har lanserat DiffusionGemma, en experimentell modell på 26 miljarder parametrar. Denna modell ersätter traditionell token-för-token-generering med diskret textdiffusion för effektivare lokal inferens.

Av Front-redaktionen·29 juni 2026·2 min läsning·Källa: Entity-watch: Google DeepMindVerifierad signalAI-genererad

Av Viktor Lind · Verktygs- & infrastrukturreporter

29 juni 2026

Vad har hänt

Google DeepMind har offentliggjort DiffusionGemma, en experimentell modell om 26 miljarder parametrar. Modellen, baserad på Gemma 4, ändrar textgenerering från sekventiell till diskret textdiffusion. Detta sker genom parallell generering och förfining av text i block, vilket syftar till att kringgå flaskhalsar relaterade till minnesbandbredd vid lokal inferens.

Snabbfakta

Modell	DiffusionGemma
Parametrar (totalt)	26 miljarder
Parametrar (aktiva)	3,8 miljarder
Kontextfönster	256K tokens
Genereringsmetod	Diskret textdiffusion

”DiffusionGemma Shifts 26B Local Inference to Parallel Decoding”

— Google DeepMind, Utvecklare · getaibook.com

”Built on the Gemma 4 backbone, the open-weight release drafts and refines text in parallel blocks to bypass the memory bandwidth bottlenecks that typically constrain local throughput.”

— Google DeepMind, Utvecklare · getaibook.com

Varför det spelar roll

DiffusionGemmas arkitektur, med en Mixture-of-Experts (MoE) design som har 3,8 miljarder aktiva parametrar under exekvering, skiljer sig från autoregressiva modeller. Den använder Uniform State Diffusion för att fylla en textyta på 256 tokens samtidigt över flera denoisingssteg. Detta möjliggör en mer effektiv lokal inferens.

Vem påverkas

Denna modell är primärt relevant för utvecklare och forskare som arbetar med storskaliga språkmodeller och lokal inferens. Användare av applikationer som bygger på denna typ av teknik kan dra nytta av snabbare textgenerering på lokala enheter. Företag som utvecklar AI-lösningar för lokala miljöer påverkas direkt av de nya möjligheterna till prestandaförbättringar.

EU-status

Ej relevant för EU-status.

Mer att veta

Modellen har en kontextfönster på 256K tokens och stöder text, bilder och video som indata. Ljudbehandling ingår inte i den nuvarande versionen. Den är optimerad för enskilda användares lokala inferensarbetsbelastningar.

Vanliga frågor

Snabba svar om den här nyheten

Vad har hänt?

Google DeepMind har lanserat DiffusionGemma, en experimentell AI-modell på 26 miljarder parametrar. Den används för lokal inferens och genererar text genom diskret textdiffusion istället för den traditionella token-för-token-metoden.

När hände det?

Enligt källan har Google DeepMind "släppt" och "offentliggjort" modellen, vilket indikerar en nylig lansering, men inget exakt datum anges i utdraget från källan.

Varför spelar det roll?

DiffusionGemma adresserar en vanlig begränsning i lokala AI-system – minnesbandbredd. Genom att processa text i parallella block kan modellen potentiellt uppnå snabbare och effektivare inferens på användarens egna enheter, vilket är viktigt för applikationsutvecklare och användare.

Google DeepMind DiffusionGemma Gemma 4 Uniform State Diffusion Mixture-of-Experts

Originalkälla

Entity-watch: Google DeepMind·getaibook.com

Länken öppnar i nytt fönster och leder till utgivarens egen sida.

Verifierad signal

Källan har spårats automatiskt från utgivaren via Fronts signalkedja.

AI-verktyg i artikeln

Ämnen

#Models#Vision

[ FÖLJ UTVECKLINGEN ]

Google DeepMind lanserar DiffusionGemma för lokal inferens

Vad har hänt

Snabbfakta

Varför det spelar roll

Vem påverkas

EU-status

Mer att veta

Snabba svar om den här nyheten

AI-verktyg i artikeln

Ämnen

Få liknande nyheter direkt i mejlen