Mistral AI lanserar OCR 4 för strukturerad dokumentbearbetning
Mistral AI har lanserat OCR 4, en dokumentintelligensmodell som omvandlar dokumentextraktion till en strukturerad process med bounding boxes, blockklassificering och konfidenspoäng.

Vad har hänt
Den 25 juni 2026 lanserade Mistral AI sin nya modell OCR 4. Denna modell syftar till att ge en strukturerad representation av dokument, till skillnad från traditionella system som enbart extraherar råtext. OCR 4 identifierar element som bounding boxes, klassificerar olika blocktyper, och anger konfidenspoäng för extraherad information. Modellen klarar av 170 språk och flera filformat, inklusive PDF, DOC, PPT och OpenDocument.
Snabbfakta
| Lanseringsdatum | 25 juni 2026 |
|---|---|
| Antal språk som stöds | 170 |
| Startpris per 1 000 sidor | 4 USD |
| Filformat som stöds | PDF, DOC, PPT, OpenDocument |
”OCR 4 outputs structured document representations with bounding boxes and block classification instead of flat text streams”
”On-premises deployment capability targets enterprises in regulated industries that cannot route sensitive documents through U.S. cloud APIs”
Varför det spelar roll
Historiskt sett har OCR-lösningar primärt handlat om att extrahera text. Mistral AI:s OCR 4 förändrar detta genom att leverera positioneringsdata, innehållsklassificering och konfidenspoäng direkt. Detta minskar behovet för företag att själva rekonstruera information, vilket effektiviserar arbetsprocesser som RAG-pipelines och efterlevnadskontroller inom reglerade branscher.
Vem påverkas
Lanseringen påverkar primärt företag, särskilt de inom reglerade industrier som har höga krav på datasäkerhet och suveränitet. Utvecklare som arbetar med dokumentbearbetning kan dra nytta av de strukturerade utdata för att bygga mer robusta integrationer. Användare i stort får tillgång till mer precisa och kontextuella dokumentanalyser.
EU-status
Mistral AI betonar europeisk suveränitet genom att erbjuda on-premise-installationer, vilket är fördelaktigt för europeiska företag som hanterar känslig data. OCR 4:s förmåga att installeras lokalt möter kraven från organisationer som inte kan dirigera känslig dokumentation via moln-API:er baserade utanför EU, i linje med GDPR-principerna. Detta gör den särskilt relevant för den europeiska marknaden.
Mer att veta
Prissättningen för OCR 4 börjar på 4 USD per 1 000 sidor, med en reducerad kostnad om 2 USD per 1 000 sidor vid användning av batch-API:et. Modellen är tillgänglig via Mistral API, Amazon SageMaker och Microsoft Foundry.
Snabba svar om den här nyheten
Vad har hänt?
När hände det?
Varför spelar det roll?
Påverkar det EU?
Länken öppnar i nytt fönster och leder till utgivarens egen sida.
Källan har spårats automatiskt från utgivaren via Fronts signalkedja.