Новий open-source RAG: корпус у 40 разів менший і пошук точніший
Open-source підхід до RAG: стискає корпус у 40 разів, зменшує токени на запит у 3 рази та підвищує релевантність векторного пошуку у 2,3 раза.
1001 хв0
Open-source підхід до RAG: стискає корпус у 40 разів, зменшує токени на запит у 3 рази та підвищує релевантність векторного пошуку у 2,3 раза.
Гайд зі створення RAG, що шукає по 36M+ векторах за <30 мс. Як бінарна квантизація дає до 32× економії пам’яті.