Hoppa till innehåll
Dagens utgåva 
Automation & Agenter· LanseringTillgängligt

Gemini 3.5 Flash får förmåga att använda datorer

Google har uppdaterat sin AI-modell Gemini 3.5 Flash med förmågan att se och interagera med datorgränssnitt, med syfte att automatisera komplexa arbetsflöden.

Av Front-redaktionen·26 juni 2026·2 min läsning·Källa: Entity-watch: Google DeepMindVerifierad signalAI-genererad
Gemini 3.5 Flash får förmåga att använda datorer
Gemini 3.5 Flash får förmåga att använda datorer
Gemini 3.5 Flash får förmåga att använda datorer
Av · Verktygs- & infrastrukturreporter

Vad har hänt

Google har lanserat en uppdatering för sin AI-modell Gemini 3.5 Flash som möjliggör för modellen att interagera med datorer. Denna nya funktion, kallad "computer use", tillåter AI-agenter att läsa av en datorskärm och styra programvara. Uppdateringen presenterades ursprungligen vid Google I/O i maj 2024.

Snabbfakta

Lanseringsdatum för uppdatering (offentliggörande)18 juni 2024
AI-modellGemini 3.5 Flash
UtvecklareGoogle

With built-in computer use, developers can "build custom agents that can see, reason and take action across browser, mobile and desktop environments"

Google, talesperson · Yahoo Finance

Varför det spelar roll

Denna utökade kapacitet innebär att AI-modellen kan utföra uppgifter som kräver interaktion med ett grafiskt användargränssnitt, bortom enbart textbaserade svar. Utvecklare kan nu skapa anpassade AI-agenter som kan se, resonera och agera i webbläsare, mobil- och skrivbordsmiljöer. Detta öppnar för automatisering av mer komplexa och "long horizon"-uppgifter, exempelvis kontinuerlig mjukvarutestning.

Vem påverkas

Främst påverkas utvecklare som nu får nya verktyg för att bygga mer autonoma AI-applikationer. Även företag som kan implementera dessa agenter för att automatisera rutinuppgifter berörs. Slutanvändare kan på sikt möta AI-tjänster med bredare funktionalitet, även om direkta användarapplikationer inte presenterats.

EU-status

Ej relevant för EU-status.

Mer att veta

Google har inkluderat säkerhetsfunktioner, genom "targeted adversarial training", för att hantera de potentiella riskerna med AI som interagerar i live-miljöer. Detta inkluderar möjligheten att kräva explicit mänsklig godkännande för känsliga åtgärder.

Vanliga frågor

Snabba svar om den här nyheten

Vad har hänt?
Google har uppdaterat sin AI-modell Gemini 3.5 Flash med en funktion som låter AI:n se och interagera med en datorskärm för att styra programvara.
När hände det?
Uppdateringen offentliggjordes den 18 juni 2024, efter att ha presenterats på Google I/O i maj 2024.
Varför spelar det roll?
Detta utökar AI-modellens förmåga bortom textbaserade svar till att kunna utföra komplexa, GUI-baserade uppgifter. Det möjliggör för utvecklare att automatisera bredare arbetsflöden.
Vilka bolag berörs?
Google är det centrala bolaget som berörs, men även företag som kan implementera dessa AI-agenter för automatisering av rutinuppgifter påverkas. Utvecklare som bygger framtida AI-applikationer berörs direkt.
Originalkälla
Entity-watch: Google DeepMind·tech.yahoo.com

Länken öppnar i nytt fönster och leder till utgivarens egen sida.

Verifierad signal

Källan har spårats automatiskt från utgivaren via Fronts signalkedja.

AI-verktyg i artikeln

Ämnen

#Agents#Models#Vision
[ FÖLJ UTVECKLINGEN ]

Få liknande nyheter direkt i mejlen

Inga affiliate-länkarAvsluta när som helstGDPR-vänlig
[ Frekvens ]
[ Vad vill du läsa om? ]

Du får utskick om 2 ämnen.