Безплатний опенсорс: PDF/Word/Excel у чистий Markdown за секунди
Знайшов безплатний інструмент, який за секунди перетворює будь-які PDF, Word, Excel або відскановані зображення на чистий Markdown:
• текст у правильному порядку
• таблиці в HTML
• формули в LaTeX
• OCR
• 109 мов
Працює через CLI, Python або веб (mineru.net). Запускається локально на твоєму комп’ютері. 100% приватно.
Більше 70000 зірок на GitHub.