Datalab відкрила код Lift: 9B-модель для вилучення даних з PDF
Datalab відкрила вихідний код Lift — 9B-моделі для вилучення структурованих даних із документів.
За заявою розробників, модель демонструє 90,2% точності на їхньому бенчмарку проти 91,3% у Gemini 3.5 Flash і помітно випереджає спеціалізовані опенсорс-рішення на кшталт NuExtract3 (81,5%).
Lift уміє вилучати дані за JSON Schema, а медіанний час обробки становить 9,5 секунди.
Для запуску достатньо: pip install lift-pdf