Studie: LLM:er har svårt att skriva snabba multi-GPU-kärnor
En ny analys från Together AI, ParallelKernelBench, visar att stora språkmodeller (LLM:er) har begränsad förmåga att generera effektiva CUDA-kärnor för multi-GPU-system. Endast ett fåtal av de genererade implementationerna utpresterade befintliga publika lösningar.

Vad har hänt
Together AI har publicerat resultaten från ParallelKernelBench, en benchmark utformad för att testa om LLM:er kan skriva snabba CUDA-kärnor för system med flera GPU:er. Testsviten inkluderade 87 olika arbetslaster. Resultaten visade att den bäst presterande modellen löste färre än en tredjedel av uppgifterna optimalt.
Snabbfakta
| Benchmarknamn | ParallelKernelBench |
|---|---|
| Antal arbetslaster | 87 |
| Bäst modellens lösningar | < en tredjedel |
”ParallelKernelBench tests whether LLMs can write fast multi-GPU CUDA kernels across 87 real workloads. The best model solves under a third, but a few generated kernels beat any public implementation.”
Varför det spelar roll
Förmågan att effektivt skriva lågnivåkod som CUDA-kärnor är avgörande för att optimera prestandan i AI-beräkningar, särskilt på avancerade multi-GPU-system. Att LLM:er ännu inte klarar detta konsekvent pekar på en befintlig begränsning i deras kodgenereringskapacitet för specialiserad hårdvara. Detta indikerar att mänsklig expertis fortsatt är oumbärlig för att uppnå topprestanda inom detta område.
Vem påverkas
Studien påverkar primärt AI-forskare, utvecklare av högpresterande beräkningslösningar och företag som arbetar med optimering av maskininlärningsmodeller på GPU-kluster. Det belyser även utmaningar för de som förlitar sig på LLM:er för att automatisera komplex kodningsprocesser.
EU-status
Ej relevant för EU-status.
Mer att veta
Trots de övergripande begränsningarna noterade Together AI att ett mindre antal av de genererade kärnorna faktiskt överträffade publika implementationer, vilket indikerar potential för LLM:er att i framtiden bidra till optimering av prestandakritisk kod.
Snabba svar om den här nyheten
Vad har hänt?
När hände det?
Varför spelar det roll?
Vilka påverkas av detta?
Länken öppnar i nytt fönster och leder till utgivarens egen sida.
Källan har spårats automatiskt från utgivaren via Fronts signalkedja.