- Tops in benchmark test, including reading order, tables, and title inference.
- Offers a perfect local security environment with the hybrid engine that combines AI and direct extraction heuristic engine
- Four AI functions via free AI add-ons; OCR, Table AI, Chart and Formula AI
- Change to Apache-2.0 licensing from MPL-2.0
SEOUL, South Korea, March 13, 2026 /PRNewswire/ -- Hancom, the South Korean software company behind the widely used Hangul word processor, has released OpenDataLoader PDF v2.0 — and the benchmark numbers back up the claim. In the company's own internal testing, OpenDataLoader PDF outperformed competing open-source tools across reading order recognition, table extraction, and heading inference. Hancom has published the full benchmark dataset and reproducible code on its official GitHub repository, allowing developers to verify the results independently.

The headline engineering move is a hybrid extraction engine that pairs AI-based parsing with direct extraction. The practical upside: enterprises and developers get high-accuracy PDF data extraction that runs entirely on-premise, with no data leaving the local environment. For organizations handling sensitive documents — legal, financial, medical — that's not a minor footnote.
Four Free AI Add-ons, Out of the Box
OpenDataLoader PDF PDF v2.0 includes the following four AI features as add-ons at no additional cost:
All four are built for compatibility with third-party open-source models, including Docling. Hancom is clear that no formal partnership or sponsorship is in place — the compatibility is purely technical, designed so developers can slot OpenDataLoader PDF into existing pipelines without rebuilding their stack.
Apache 2.0: Lowering the Barrier, Expanding the Ecosystem
The project has also shed its MPL 2.0 license in favor of Apache 2.0 — one of the most permissive open-source licenses available. The move directly reduces friction for commercial use, making it easier for global developers and enterprises to build on top of OpenDataLoader PDF without navigating license compatibility headaches. Hancom expects this to accelerate downstream business models including WebApp and SaaS applications built on the engine.
Ecosystem Expansion: LangChain Is In, More Integrations Coming
LangChain integration shipped in 2025. In 2026, Hancom is targeting Langflow, LlamaIndex, and Gemini CLI, plus MCP (Model Context Protocol) support for agentic AI workflows. The roadmap positions OpenDataLoader PDF as infrastructure for the autonomous AI agent era, not just a standalone parsing tool.
Later in 2026, a commercial AI add-on is planned — described as a concentration of Hancom's proprietary document AI technology.
AI based auto-tagging to Tagged PDF: Start The Accessibility Play
Perhaps the most forward-looking item on the roadmap is PDF accessibility. With the European Accessibility Act (EAA) now in force, South Korea's anti-discrimination legislation tightening, and accessibility regulations expanding globally, compliance has become a real operational burden for enterprises. Hancom says OpenDataLoader PDF will be the first open-source PDF tool to include AI-generated accessibility tagging — This will be the first open-source solution to provide a key step toward PDF/UA compliance.
What Hancom's CTO Said
"OpenDataLoader PDF v2.0 has evolved into an open PDF data platform that anyone can freely use and build upon, through its AI hybrid engine and transition to Apache 2.0," said Jihwan Jeong, CTO of Hancom. "With upcoming commercial AI add-ons and accessibility solutions, we aim to lead the global ecosystem — making PDF documents not only AI-ready, but accessible to everyone."
OpenDataLoader PDF PDF v2.0 is available now. Source code, benchmark datasets, and documentation are published at the OpenDataLoader PDF official GitHub repository.
Photo - https://mma.prnewswire.com/media/2933181/opendataloader_benchmark.jpg
View original content:https://www.prnewswire.co.uk/news-releases/hancom-tops-open-source-pdf-benchmarks-with-opendataloader-pdf-v2-0--302713099.html

Ein Jahr nach mehreren großflächigen Waldbränden in Ostdeutschland gehen die Länder mit ausgebauten Kapazitäten in die neue Saison. In Thüringen hatten Einsatzkräfte im Sommer 2025 gegen ein Feuer bislang unbekannten Ausmaßes gekämpft, zeitweise galt der Katastrophenfall. In der sächsischen Gohrischheide stießen Feuerwehren wegen alter Munition im Boden an physische Grenzen, während im Harz bereits 2024 Bundeswehr-Hubschrauber über Wochen im Einsatz waren – über die Kosten in Millionenhöhe wird noch gestritten. Forstleute sprechen nun von der ersten Hochrisikophase des Jahres.
Seit dem 1. März veröffentlichen die Forstverwaltungen in Sachsen, Sachsen‑Anhalt und Thüringen wieder täglich die Waldbrandgefahrenstufen. Lokal wurde bereits Stufe drei (mittlere Gefahr) und teilweise Stufe vier (hohe Gefahr) erreicht, bevor Niederschläge die Lage vorübergehend entspannten. Fachleute verweisen darauf, dass sich das Brandrisiko zunehmend ins Frühjahr verlagert: Steigende Temperaturen treffen auf Vegetation, die vielerorts noch im „Winterschlaf“ ist. Bei Sonne und Wind können sich Brände rasch entwickeln – häufig ausgelöst durch unvorsichtige Waldbesucher.
Der Hydrologe Andreas Marx vom Leipziger Helmholtz-Zentrum für Umweltforschung erwartet die kritischste Phase allerdings im Sommer. Erst wenn sich über mehrere Monate Trockenheit aufbaut, steige das Risiko, dass Feuer sich schnell ausbreiten und schwerer löschen lassen. Die Erfahrung aus Thüringen 2025 zeigt, wie stark Wasserlogistik zum Engpass werden kann: Tanklöschfahrzeuge mussten teils weite Strecken zurücklegen, kilometerlange Schlauchleitungen wurden verlegt, Landwirte unterstützten mit eigenen Fahrzeugen. Der Landkreis Saalfeld-Rudolstadt verweist inzwischen auf zusätzliche Ausrüstung wie Faltbehälter mit bis zu 30.000 Litern Wasser und geländegängige Pick-ups mit Waldbrandmodulen.
Thüringen stockt seinen Fuhrpark für den Katastrophenschutz deutlich auf. Das Innenministerium beschafft in diesem Jahr sechs Großtanklöschfahrzeuge mit jeweils 10.000 Litern Löschwasservolumen. Drei davon gingen bereits im Januar an die Kreise Hildburghausen, Kyffhäuser und Sonneberg. Bis 2030 sollen darüber hinaus 16 weitere Tanklöschfahrzeuge mit jeweils 3.000 Litern Wasserkapazität bestellt werden. In Sachsen bleibt die munitionsbelastete Gohrischheide ein zentrales Risiko. „Wir können nicht überall hinfahren, wo es brennt“, beschreibt Sachsenforst-Sprecher Marco Horn die Lage. Politisch rückt daher die Frage in den Fokus, ob belastete Flächen zumindest teilweise geräumt werden können. In einer laufenden Risikoanalyse wird zudem die Option eines gepanzerten unbemannten Löschfahrzeugs geprüft.
Zur Stärkung der Schlagkraft an sensiblen Standorten hat Sachsen ein Großtanklöschfahrzeug mit 10.000 Litern Wasser in Priestewitz stationiert, von wo aus mehrere Naturschutzgebiete gut erreichbar sind. Laut Innenministerium sind bis Ende 2025 insgesamt vier geländegängige Kommandowagen, 15 speziell für Waldbrände ausgerüstete Tanklöschfahrzeuge sowie sechs Großtanklöschfahrzeuge angeschafft worden. Perspektivisch sollen außerdem drei neue Hubschrauber der Landespolizei bereitstehen, die deutlich leistungsfähiger sein sollen als die bisherigen Modelle. Die ostdeutschen Länder setzen damit verstärkt auf mobile Löschwasservorräte, verbesserte Erreichbarkeit abgelegener Waldgebiete und technische Aufrüstung, um die erwarteten längeren Trockenphasen und steigenden Waldbrandgefahren in den kommenden Jahren besser abzufedern.