Стратегии поиска
Вы можете выбрать один из трех способов, которым система будет искать информацию в документах. У каждого свои особенности:
- Простой (Векторный): Этот режим ищет фрагменты, наиболее близкие по общему смыслу к вашему вопросу. Он отлично подходит для широких, концептуальных запросов, где точные формулировки не критичны.
Недостаток: может упустить важные детали, если они зависят от точных ключевых слов, так как он фокусируется на общем смысле.
- По предложениям (Векторный): Эта стратегия сначала находит наиболее релевантные отдельные предложения в тексте, а затем использует их полные родительские абзацы для генерации ответа. Это позволяет достичь высокой точности в поиске, не теряя при этом общий контекст.
Недостаток: может быть чувствителен к качеству разбиения на предложения, особенно в текстах со сложной пунктуацией.
- Семантический: Эта стратегия сначала "умно" нарезает документы на логически завершенные части, а затем ищет среди них. Может дать более точный ответ на сложные, узкоспециализированные вопросы.
Недостаток: иногда может неверно определить границы смысловых блоков, из-за чего часть важной информации не попадет в ответ.
- Гибридный: Этот режим одновременно ищет и по точному совпадению ключевых слов, и по общему смыслу (как Векторный). Это позволяет находить самые релевантные ответы, даже если они сформулированы иначе, чем ваш вопрос.
Недостаток: работает немного медленнее двух других стратегий, так как выполняет двойную работу по поиску.
Расширение контекста
Эта опция позволяет системе дать более полный контекст для ответа. Вот как это работает:
- Когда опция включена, система находит самый подходящий фрагмент текста и "захватывает" соседние с ним абзацы (до и после). Это очень полезно, так как важные детали и пояснения часто находятся рядом с основной мыслью.
Последствия: в контекст может попасть "информационный шум" из соседних, не относящихся к делу абзацев, что иногда может сделать ответ менее точным.
- Когда опция выключена, система использует для ответа только тот самый, один, наиболее релевантный фрагмент. Ответ будет более сжатым, но есть риск упустить важные детали из окружения.
Последствия: ответ может быть неполным, если для понимания сути вопроса важны соседние абзацы или предложения.