Mistral AI lanserar OCR 4 för avancerad dokumentbearbetning
Mistral AI har lanserat OCR 4, en ny version av sin dokumentintelligensmodell. Modellen erbjuder strukturerad extraktion av information från dokument i 170 språk.

Vad har hänt
Den 25 juni 2026 lanserade Mistral AI sin fjärde generation av OCR-teknik, OCR 4. Denna modell går bortom enbart textutvinning och kan extrahera strukturerade representationer av hela dokument, inklusive avgränsningsrutor, klassificering av blocktyper och konfidenspoäng per ord. Mistral AI:s nya modell stödjer 170 språk över 10 språkgrupper och hanterar PDF-, DOC-, PPT- och OpenDocument-format.
Snabbfakta
| Lanseringsdatum | 25 juni 2026 |
|---|---|
| Antal språk som stöds | 170 |
| Filformat | PDF, DOC, PPT, OpenDocument |
| Distribueringsalternativ | Lokal container, Mistral API, Amazon SageMaker, Microsoft Foundry |
”Mistral OCR 4 extracts and structures content from a wide range of documents.”
”Where previous generations focused on converting a page into clean text and tables, OCR 4 returns a structured representation of the document.”
Varför det spelar roll
OCR 4 representerar en betydande förbättring inom dokumentbearbetning, då den kan förstå och strukturera innehåll på en djupare nivå än tidigare versioner. Detta är särskilt relevant för företag som hanterar stora volymer av komplexa dokument. Att modellen kan distribueras lokalt i en enda container möter behov hos företag i reglerade branscher som inte kan skicka känslig data via molntjänster baserade i USA.
Vem påverkas
Utvecklare, företag som hanterar stora volymer av dokument och organisationer inom reglerade sektorer påverkas. De kan nu bearbeta dokument mer effektivt och med större kontroll över datahanteringen. Användare av Mistral AI:s plattformar får tillgång till förbättrade funktioner för dokumentanalys.
EU-status
Modellen är tillgänglig via Mistral API, Document AI i Mistral Studio, Amazon SageMaker och Microsoft Foundry. För EU-baserade företag i reglerade branscher underlättar möjligheten till lokal distribution att uppfylla dataskyddskrav.
Mer att veta
Release av OCR 4 är den fjärde generationen av Mistrals OCR-teknik på cirka 15 månader, vilket indikerar en snabb utvecklingstakt inom området. Tidigare felaktiga uppgifter om tillgänglighet via Snowflake har korrigerats.
Snabba svar om den här nyheten
Vad har hänt?
När hände det?
Varför spelar det roll?
Påverkar det EU?
Länken öppnar i nytt fönster och leder till utgivarens egen sida.
Källan har spårats automatiskt från utgivaren via Fronts signalkedja.