Відкрили коди Marlin-2B: VLM для пошуку подій у відео з таймкодами
Marlin-2B — компактна візуально-мовна модель для вилучення структурованих подій з відео: JSON-опис сцен і пошук фрагментів за запитом.
81 хв0
Marlin-2B — компактна візуально-мовна модель для вилучення структурованих подій з відео: JSON-опис сцен і пошук фрагментів за запитом.