Чому векторні бази даних не підходять для складних міркувань
Векторні бази даних не виконують міркування.
Пошук top-k за семантичною подібністю ранжує фрагменти тексту окремо щодо запиту. Це нормально для одноетапного вилучення фактів, але ламається там, де відповідь потребує пов’язування інформації з кількох фрагментів.
Це видно в результатах FalkorDB GraphRAG-Bench. Найбільший розрив — у завданнях Complex Reasoning (83.61) і Contextual Summarization (85.08) — типах запитів, де пошук має проходити за зв’язками між сутностями, а не оцінювати чанки ізольовано.
Корисно придивитися уважніше, якщо навантаження пов’язане з довгими текстами та складеними відповідями.