#vector-search×

cpaua·

Новий open-source RAG: корпус у 40 разів менший і пошук точніший

Open-source підхід до RAG: стискає корпус у 40 разів, зменшує токени на запит у 3 рази та підвищує релевантність векторного пошуку у 2,3 раза.

1001 хв0
cpaua·

Бінарна квантизація: RAG у 32 рази ефективніший за пам’яттю

Гайд зі створення RAG, що шукає по 36M+ векторах за <30 мс. Як бінарна квантизація дає до 32× економії пам’яті.

1961 хв0