Hoppa till innehåll
Dagens utgåva 
Forskning· Analys

Studie: LLM:er har svårt att skriva snabba multi-GPU-kärnor

En ny analys från Together AI, ParallelKernelBench, visar att stora språkmodeller (LLM:er) har begränsad förmåga att generera effektiva CUDA-kärnor för multi-GPU-system. Endast ett fåtal av de genererade implementationerna utpresterade befintliga publika lösningar.

Av Front-redaktionen·23 juni 2026·2 min läsning·Källa: Together AI BlogVerifierad signalAI-genererad
Studie: LLM:er har svårt att skriva snabba multi-GPU-kärnor
Studie: LLM:er har svårt att skriva snabba multi-GPU-kärnor
Studie: LLM:er har svårt att skriva snabba multi-GPU-kärnor
Av · Policy- & EU-reporter

Vad har hänt

Together AI har publicerat resultaten från ParallelKernelBench, en benchmark utformad för att testa om LLM:er kan skriva snabba CUDA-kärnor för system med flera GPU:er. Testsviten inkluderade 87 olika arbetslaster. Resultaten visade att den bäst presterande modellen löste färre än en tredjedel av uppgifterna optimalt.

Snabbfakta

BenchmarknamnParallelKernelBench
Antal arbetslaster87
Bäst modellens lösningar< en tredjedel

ParallelKernelBench tests whether LLMs can write fast multi-GPU CUDA kernels across 87 real workloads. The best model solves under a third, but a few generated kernels beat any public implementation.

Together AI, Forskningsteam · Together AI Blog

Varför det spelar roll

Förmågan att effektivt skriva lågnivåkod som CUDA-kärnor är avgörande för att optimera prestandan i AI-beräkningar, särskilt på avancerade multi-GPU-system. Att LLM:er ännu inte klarar detta konsekvent pekar på en befintlig begränsning i deras kodgenereringskapacitet för specialiserad hårdvara. Detta indikerar att mänsklig expertis fortsatt är oumbärlig för att uppnå topprestanda inom detta område.

Vem påverkas

Studien påverkar primärt AI-forskare, utvecklare av högpresterande beräkningslösningar och företag som arbetar med optimering av maskininlärningsmodeller på GPU-kluster. Det belyser även utmaningar för de som förlitar sig på LLM:er för att automatisera komplex kodningsprocesser.

EU-status

Ej relevant för EU-status.

Mer att veta

Trots de övergripande begränsningarna noterade Together AI att ett mindre antal av de genererade kärnorna faktiskt överträffade publika implementationer, vilket indikerar potential för LLM:er att i framtiden bidra till optimering av prestandakritisk kod.

Vanliga frågor

Snabba svar om den här nyheten

Vad har hänt?
Together AI har publicerat resultaten från ParallelKernelBench, en benchmark som testar stora språkmodellers förmåga att skriva snabba CUDA-kärnor för multi-GPU-system. Studien visar på begränsningar i LLM:ers kapacitet att generera effektiv lågnivåkod.
När hände det?
Resultaten av ParallelKernelBench publicerades av Together AI på deras blogg.
Varför spelar det roll?
Det spelar roll eftersom effektiv kodgenerering för specialiserad hårdvara som GPU:er är avgörande för AI-prestanda. Att LLM:er ännu inte klarar detta konsekvent innebär att mänsklig expertis fortsatt är nödvändig för att optimera AI-system.
Vilka påverkas av detta?
AI-forskare, utvecklare av högpresterande beräkningar och företag som optimerar maskininlärningsmodeller på GPU-kluster påverkas direkt.
Originalkälla
Together AI Blog·together.ai

Länken öppnar i nytt fönster och leder till utgivarens egen sida.

Verifierad signal

Källan har spårats automatiskt från utgivaren via Fronts signalkedja.

AI-verktyg i artikeln

Ämnen

#Models
[ FÖLJ UTVECKLINGEN ]

Få liknande nyheter direkt i mejlen

Inga affiliate-länkarAvsluta när som helstGDPR-vänlig
[ Frekvens ]
[ Vad vill du läsa om? ]

Du får utskick om 2 ämnen.