Google lanserar Gemini 2.5 Flash-Lite för storskalig användning
Google DeepMind lanserar nu Gemini 2.5 Flash-Lite för stabil produktion, en kostnadseffektiv modell med ett kontextfönster på en miljon tokens.

Vad har hänt
Google DeepMind har meddelat att Gemini 2.5 Flash-Lite nu lämnar förhandsversionen och är redo för skalad produktion. Modellen är en kostnadseffektiv variant som stödjer multimodalitet och har ett kontextfönster på upp till en miljon tokens. Den är optimerad för hög prestanda i ett kompakt format.
Snabbfakta
| Modellnamn | Gemini 2.5 Flash-Lite |
|---|---|
| Utvecklare | Google DeepMind |
| Kontextfönster | En miljon tokens |
| Tillgänglighet | Globalt via Google AI Studio och Vertex AI |
Varför det spelar roll
Lanseringen markerar ett viktigt steg i tävlingen om att erbjuda kraftfull AI till lägsta möjliga pris. Genom att erbjuda ett stort kontextfönster i en lättviktsmodell kan företag hantera omfattande datamängder utan att drabbas av de höga kostnader som vanligtvis förknippas med större modeller.
Vem påverkas
Nyheten berör främst utvecklare och företag som bygger AI-drivna applikationer där låg latens och driftskostnad är kritiska faktorer. Slutanvändare märker av förändringen genom snabbare och mer responsiva AI-funktioner i appar och tjänster.
EU-status
Modellen finns tillgänglig globalt via Google AI Studio och Vertex AI, vilket inkluderar utvecklare inom EU, under förutsättning att användningen följer GDPR och lokala regleringar.
Mer att veta
Google positionerar Flash-Lite som en direkt konkurrent till andra 'små' modeller på marknaden, såsom GPT-4o-mini, med fokus på lägre kostnad per miljon tokens.
Snabba svar om den här nyheten
Vad är Gemini 2.5 Flash-Lite?
Vem är Gemini 2.5 Flash-Lite avsedd för?
Var kan man få tillgång till Gemini 2.5 Flash-Lite?
Länken öppnar i nytt fönster och leder till utgivarens egen sida.
Källan har spårats automatiskt från utgivaren via Fronts signalkedja.