Hoppa till innehåll
Dagens utgåva 
Forskning· Nyhet

CrowdMath-datasetet kartlägger matematisk forskningsdiskussion

Nytt dataset, CrowdMath, analyserar samarbetenas utveckling inom matematisk problemlösning från MIT PRIMES och Art of Problem Solving.

Av Front-redaktionen·28 juni 2026·3 min läsning·Källa: arXiv cs.AIVerifierad signalAI-genererad
CrowdMath-datasetet kartlägger matematisk forskningsdiskussion
CrowdMath-datasetet kartlägger matematisk forskningsdiskussion
CrowdMath-datasetet kartlägger matematisk forskningsdiskussion
Av · Policy- & EU-reporter

Vad har hänt

Forskare har publicerat CrowdMath, ett dataset som innehåller 164 annoterade "progress chains" från den samarbetande forskningsinitiativet MIT PRIMES – Art of Problem Solving (AoPS) CrowdMath-program (2016-2025). Datasetet spårar forumdiskussioner från en öppen problemställning till ett fullständigt bevis, där varje inlägg är märkt efter dess funktionella roll i lösningsprocessen.

Snabbfakta

Antal 'progress chains'164
CrowdMath-programmets tidsperiod2016-2025
Källa för diskussionerMIT PRIMES – Art of Problem Solving
Datasetets versionv1

Large language models have made substantial progress on mathematical reasoning, but existing benchmarks typically evaluate well-specified problems with final answers, step-by-step solutions, or complete proofs. They do not capture collaborative open-problem solving.

null, Forskare · arXiv cs.AI

We introduce CrowdMath, a dataset of 164 expert-annotated progress chains from the MIT PRIMES--Art of Problem Solving (AoPS) CrowdMath program (2016-2025), a collaborative research initiative whose discussions have led to peer-reviewed publications.

null, Forskare · arXiv cs.AI

Varför det spelar roll

Traditionella benchmarks för stora språkmodeller utvärderar oftast väldefinierade problem med färdiga svar eller bevis. CrowdMath adresserar bristen på dataset som speglar kollaborativ, öppen problemlösning – en process där deltagare föreslår partiella argument, identifierar fel och successivt bygger ett bevis. Detta dataset möjliggör forskning kring hur AI kan bistå i eller simulera denna typ av komplex mänsklig interaktion.

Vem påverkas

Datasetet är relevant för AI-forskare och utvecklare som arbetar med stora språkmodeller (LLM) och fokus ligger på matematiskt resonemang, samarbetsbaserad problemlösning samt naturlig språkbehandling. Matematiker och pedagoger kan också finna värde i insikterna om hur matematiska bevis utvecklas i grupp. Användare av AI-system som söker mer sofistikerad interaktion vid problemlösning kan indirekt påverkas om AI-modeller tränas på CrowdMath.

EU-status

Ej relevant för EU-status.

Mer att veta

Datasetet inkluderar diskussioner som har lett till publicerade, peer-reviewade artiklar, vilket understryker kvaliteten och djupet i de samarbeten som analyseras. Annotationerna beskriver funktionella roller, såsom "partial progress", "proof completion" och "erroneous reasoning".

Vanliga frågor

Snabba svar om den här nyheten

Vad har hänt?
Forskare har introducerat CrowdMath, ett dataset bestående av 164 annoterade 'progress chains' från det kollaborativa forskningsprogrammet MIT PRIMES – Art of Problem Solving (AoPS) CrowdMath, som sträcker sig från 2016 till 2025. Detta dataset kartlägger utvecklingen av matematiska bevis från initiala problemställningar.
När hände det?
Datasetet presenterades i en arXiv-publikation daterad den 6 juni 2026. De analyserade diskussionerna ägde rum mellan 2016 och 2025.
Varför spelar det roll?
CrowdMath är viktigt eftersom det fyller en lucka i befintliga benchmarks för stora språkmodeller (LLM). Det erbjuder en plattform för att utvärdera AI:s förmåga att hantera kollaborativ, öppen problemlösning, vilket är en mer realistisk modell av mänsklig forskning än statiska problem med givna svar.
Vilka bolag berörs?
Inga specifika kommersiella bolag berörs direkt av denna nyhet. Däremot påverkas AI-forskare och utvecklare inom akademin och industrin som arbetar med LLM och matematiska resonemang, särskilt de som är intresserade av att förbättra AI:s samarbetsförmåga. De akademiska institutionerna MIT PRIMES och Art of Problem Solving är direkt involverade i skapandet av datasetet.
Originalkälla
arXiv cs.AI·arxiv.org

Länken öppnar i nytt fönster och leder till utgivarens egen sida.

Verifierad signal

Källan har spårats automatiskt från utgivaren via Fronts signalkedja.

AI-verktyg i artikeln

Ämnen

#Models
[ FÖLJ UTVECKLINGEN ]

Få liknande nyheter direkt i mejlen

Inga affiliate-länkarAvsluta när som helstGDPR-vänlig
[ Frekvens ]
[ Vad vill du läsa om? ]

Du får utskick om 2 ämnen.