Ny Transformer-arkitektur introducerar kontextualisering
Forskare har presenterat en ny Transformer-arkitektur, "Context-Ready Transformer", som behandlar tokens med föregående kontext innan de bearbetas vidare, vilket omformar modellen till ett rekurrent neuralt nätverk vid inferens.

Vad har hänt
En ny arkitektur, "Context-Ready Transformer", har introducerats. Denna arkitektur skiljer sig från standard Transformers genom att pre-kontextualisera varje token via ett korrigeringsnätverk. Korrigeringsnätverket kombinerar den tidigare positionens utdata – en summering av tidigare kontext – med den nuvarande token-inbäddningen. Detta innebär att varje token kommer in i Transformer-blocket redan kontextualiserad istället för som en rå inbäddning.
Snabbfakta
| Publikationsdatum | 26 juni 2026 |
|---|---|
| Arkitektur | Context-Ready Transformer |
| Huvudsaklig mekanism | Pre-kontextualisering av tokens |
| Klassifikation | cs.CL (Computational Linguistics) |
”We introduce the context-ready transformer, a new recurrent neural network architecture built from a D-layer transformer block that pre-contextualizes each token before it enters the block.”
Varför det spelar roll
Denna arkitektur omvandlar Transformer-modellen till ett rekurrent neuralt nätverk vid sekventiell inferens genom korrigeringskedjan. Under träning kan korrigeringsprocessen rullas ut flera gånger över hela sekvensen, vilket möjliggör parallell bearbetning av alla positioner vid varje steg. Befintliga Transformer-modeller kan även konverteras till denna nya arkitektur genom att lägga till ett nollställt korrigerings-FFN och sedan finjusteras.
Vem påverkas
Forskare och utvecklare inom naturlig språkbehandling (NLP) som arbetar med Transformer-modeller och rekurrenta neurala nätverk påverkas. Specifikt kan de som sysslar med effektivare inferens och anpassning av existerande modeller finna denna forskning relevant.
EU-status
Ej relevant för EU-status.
Mer att veta
Den presenterade arkitekturen har utvärderats avseende bredd, djup, blockstorlekar samt på två datamängder, med jämförelser mot standard Transformers och varianter. Forskningen fokuserar på den teoretiska och experimentella grunden för arkitekturen.
Snabba svar om den här nyheten
Vad har hänt?
När hände det?
Varför spelar det roll?
Vem påverkas av detta?
Länken öppnar i nytt fönster och leder till utgivarens egen sida.
Källan har spårats automatiskt från utgivaren via Fronts signalkedja.