Gemini 3.5 Flash får direkt kontroll över datorfunktioner
Google har integrerat datoranvändningsfunktioner direkt i sin Gemini 3.5 Flash-modell, vilket möjliggör för utvecklare att skapa automationsagenter för desktop och webbläsare till en lägre kostnad.

Vad har hänt
Google har integrerat förmågan att styra datorer direkt i Gemini 3.5 Flash, sin snabba och kostnadseffektiva multimodala AI-modell. Denna förmåga, som tidigare var en separat modell (Gemini 2.5 för datoranvändning), är nu inbyggd i Flash-versionen. Modellen kan nu tolka skärmbilder och utföra åtgärder som klick, scrollning och tangenttryckningar i webbläsar-, mobil- och skrivbordsmiljöer.
Snabbfakta
”Google has merged computer-use capability directly into Gemini 3.5 Flash, its fast, lower-cost multimodal model, giving developers a way to build desktop and browser agents without routing tasks through a heavier, more expensive model.”
”The announcement, published on Google’s blog on June 24, marks a structural change in how the company packages agentic capabilities: what was previously a standalone Gemini 2.5 computer-use model is now a built-in tool inside the main Flash release.”
”The model processes a continuous stream of screen images and translates its reasoning into clicks, scrolls, and keystrokes across browser, mobile, and desktop environments.”
Varför det spelar roll
Denna strukturella förändring gör det mer prisvärt och skalbart att utveckla AI-agenter som kan interagera med datorer. Genom att inkorporera funktionaliteten direkt i en billigare modell blir långsiktig automation, som kontinuerlig mjukvarutestning, kunskapsarbete och plattformsoberoende uppgifter, mer tillgänglig för utvecklare. Detta breddar tillämpningsområdet för AI-styrd automatisering avsevärt.
Vem påverkas
Utvecklare som använder Gemini API och Gemini Enterprise Agent Platform påverkas direkt, då de nu kan bygga mer kapabla och kostnadseffektiva automationslösningar. Företag som önskar automatisera komplexa digitala arbetsflöden drar också nytta av detta. Individer kan indirekt påverkas via förbättrade eller nya AI-drivna tjänster och applikationer.
EU-status
Ej relevant för EU-status.
Mer att veta
Funktionaliteten med datoranvändning bygger på att modellen bearbetar en kontinuerlig ström av skärmbilder för att översätta sitt resonemang till konkreta interaktioner.
Snabba svar om den här nyheten
Vad har hänt?
När hände det?
Varför spelar det roll?
Vilka bolag berörs?
Länken öppnar i nytt fönster och leder till utgivarens egen sida.
Källan har spårats automatiskt från utgivaren via Fronts signalkedja.