Forskning· Nyhet

CrowdMath-datasetet kartlägger matematisk forskningsdiskussion

Nytt dataset, CrowdMath, analyserar samarbetenas utveckling inom matematisk problemlösning från MIT PRIMES och Art of Problem Solving.

Av Front-redaktionen·28 juni 2026·3 min läsning·Källa: arXiv cs.AIVerifierad signalAI-genererad

Av Alma Berg · Policy- & EU-reporter

28 juni 2026

[ Sverige & EU · Front-redaktionen ]

Vad det betyder för Sverige

Denna utveckling är relevant för svenska AI-forskare vid universitet och innovationshubbar som arbetar med Language Models (LLM) och matematiskt resonerande AI. Genom att studera CrowdMath kan svenska forskargrupper bidra till utvecklingen av nya metoder för kollaborativ AI inom områden som teoretisk datavetenskap och finansiell modellering. Det kan också ge insikter för svenska EdTech-bolag som utvecklar verktyg för avancerad problemlösning.

EU-vinkel: Utvecklingen av dataset som CrowdMath kan bidra till att stärka Europas position inom AI-forskning, särskilt inom områden som kräver robusta och etiska AI-system för vetenskaplig upptäckt. Datasetet i sig är globalt tillgängligt via arXiv och påverkas inte direkt av EU:s specifika regelverk som AI Act, men dess användning och potentiella AI-applikationer faller under de bredare ramarna för dataskydd och etik som diskuteras och regleras inom EU.

Vad har hänt

Forskare har publicerat CrowdMath, ett dataset som innehåller 164 annoterade "progress chains" från den samarbetande forskningsinitiativet MIT PRIMES – Art of Problem Solving (AoPS) CrowdMath-program (2016-2025). Datasetet spårar forumdiskussioner från en öppen problemställning till ett fullständigt bevis, där varje inlägg är märkt efter dess funktionella roll i lösningsprocessen.

Snabbfakta

Antal 'progress chains'	164
CrowdMath-programmets tidsperiod	2016-2025
Källa för diskussioner	MIT PRIMES – Art of Problem Solving
Datasetets version	v1

”Large language models have made substantial progress on mathematical reasoning, but existing benchmarks typically evaluate well-specified problems with final answers, step-by-step solutions, or complete proofs. They do not capture collaborative open-problem solving.”

— null, Forskare · arXiv cs.AI6 juni 2026

”We introduce CrowdMath, a dataset of 164 expert-annotated progress chains from the MIT PRIMES--Art of Problem Solving (AoPS) CrowdMath program (2016-2025), a collaborative research initiative whose discussions have led to peer-reviewed publications.”

— null, Forskare · arXiv cs.AI6 juni 2026

Varför det spelar roll

Traditionella benchmarks för stora språkmodeller utvärderar oftast väldefinierade problem med färdiga svar eller bevis. CrowdMath adresserar bristen på dataset som speglar kollaborativ, öppen problemlösning – en process där deltagare föreslår partiella argument, identifierar fel och successivt bygger ett bevis. Detta dataset möjliggör forskning kring hur AI kan bistå i eller simulera denna typ av komplex mänsklig interaktion.

Vem påverkas

Datasetet är relevant för AI-forskare och utvecklare som arbetar med stora språkmodeller (LLM) och fokus ligger på matematiskt resonemang, samarbetsbaserad problemlösning samt naturlig språkbehandling. Matematiker och pedagoger kan också finna värde i insikterna om hur matematiska bevis utvecklas i grupp. Användare av AI-system som söker mer sofistikerad interaktion vid problemlösning kan indirekt påverkas om AI-modeller tränas på CrowdMath.

EU-status

Ej relevant för EU-status.

Mer att veta

Datasetet inkluderar diskussioner som har lett till publicerade, peer-reviewade artiklar, vilket understryker kvaliteten och djupet i de samarbeten som analyseras. Annotationerna beskriver funktionella roller, såsom "partial progress", "proof completion" och "erroneous reasoning".

Vanliga frågor

Snabba svar om den här nyheten

Vad har hänt?

Forskare har introducerat CrowdMath, ett dataset bestående av 164 annoterade 'progress chains' från det kollaborativa forskningsprogrammet MIT PRIMES – Art of Problem Solving (AoPS) CrowdMath, som sträcker sig från 2016 till 2025. Detta dataset kartlägger utvecklingen av matematiska bevis från initiala problemställningar.

När hände det?

Datasetet presenterades i en arXiv-publikation daterad den 6 juni 2026. De analyserade diskussionerna ägde rum mellan 2016 och 2025.

Varför spelar det roll?

CrowdMath är viktigt eftersom det fyller en lucka i befintliga benchmarks för stora språkmodeller (LLM). Det erbjuder en plattform för att utvärdera AI:s förmåga att hantera kollaborativ, öppen problemlösning, vilket är en mer realistisk modell av mänsklig forskning än statiska problem med givna svar.

Vilka bolag berörs?

Inga specifika kommersiella bolag berörs direkt av denna nyhet. Däremot påverkas AI-forskare och utvecklare inom akademin och industrin som arbetar med LLM och matematiska resonemang, särskilt de som är intresserade av att förbättra AI:s samarbetsförmåga. De akademiska institutionerna MIT PRIMES och Art of Problem Solving är direkt involverade i skapandet av datasetet.

CrowdMath MIT PRIMES Art of Problem Solving arXiv Stora språkmodeller AI

Originalkälla

arXiv cs.AI·arxiv.org

Länken öppnar i nytt fönster och leder till utgivarens egen sida.

Verifierad signal

Källan har spårats automatiskt från utgivaren via Fronts signalkedja.

AI-verktyg i artikeln

Ämnen

#Models

[ FÖLJ UTVECKLINGEN ]

CrowdMath-datasetet kartlägger matematisk forskningsdiskussion

Vad har hänt

Snabbfakta

Varför det spelar roll

Vem påverkas

EU-status

Mer att veta

Snabba svar om den här nyheten

AI-verktyg i artikeln

Ämnen

Få liknande nyheter direkt i mejlen