Tipos de búsqueda en la recuperación agéntica en Foundry Local

Un método o tipo de búsqueda, como texto completo, vectorial o híbrido, determina cómo Agentic Retrieval recupera y clasifica resultados a partir de sus datos indexados. Da forma a la forma en que los usuarios interactúan con la solución y la calidad de las respuestas que obtienen.

Seleccionas un tipo de búsqueda al configurar los ajustes de la consulta de datos en el portal para desarrolladores de Agentic Retrieval. Todos los tipos de búsqueda están disponibles con el punto de conexión del modelo de lenguaje BYOM.

Importante

Recuperación de agentes en Foundry local está actualmente en VERSIÓN PRELIMINAR. Consulte Términos de uso complementarios para las versiones preliminares de Microsoft Azure para conocer los términos legales que se aplican a las características de Azure que se encuentran en la versión beta, en versión preliminar o que todavía no se han publicado para que estén disponibles con carácter general.

¿Por qué importa el tipo de búsqueda?

La elección del tipo de búsqueda afecta a:

  • Los tipos de preguntas que los usuarios pueden hacer.
    Por ejemplo: La búsqueda de texto funciona mejor para las consultas de palabras clave simples, mientras que la búsqueda vectorial o híbrida permite a los usuarios formular preguntas más naturales y conversacionales.
  • Relevancia y precisión de los resultados. Por ejemplo: la búsqueda híbrida puede devolver respuestas más relevantes combinando coincidencias exactas con comprensión semántica, mientras que la búsqueda de texto podría perder resultados contextualmente similares.
  • Acceso a características avanzadas, como la búsqueda multimodal. Por ejemplo: la búsqueda bidireccional híbrida permite a los usuarios encontrar información en texto e imágenes, que es una funcionalidad que no está disponible con otros tipos de búsqueda.

Tipos de búsqueda disponibles

Las definiciones siguientes describen cada tipo de búsqueda disponible en Recuperación agente, por lo que puede comprender cómo funcionan y elegir la mejor opción para su escenario.

  • Búsqueda de texto completo: método de búsqueda que examina y coincide con todo el cuerpo del texto en documentos, mediante palabras clave, frases o consultas booleanas para buscar fragmentos relevantes en los documentos proporcionados.

  • Búsqueda híbrida: combina la búsqueda de texto completo (basada en palabras clave) y la búsqueda vectorial (similitud semántica) para recuperar los documentos más relevantes. Usa la precisión de la coincidencia de palabras clave y la profundidad de comprensión semántica para mejorar la precisión de la recuperación.

  • Búsqueda bidireccional híbrida: combina la búsqueda de texto completo y vectores en los datos de texto e imagen, lo que permite a la recuperación agentica recuperar y clasificar los resultados de varios tipos de datos en una sola consulta. A diferencia de la búsqueda híbrida, que solo funciona con texto, mediante la similitud semántica y la palabra clave, la búsqueda bidireccional híbrida amplía este enfoque para incluir imágenes. Este enfoque permite respuestas más completas y enriquecidas que se extraen del contenido textual y visual.

  • Búsqueda vectorial: método de búsqueda que busca documentos relevantes comparando la similitud semántica entre las incrustaciones vectoriales de la consulta del usuario y las incrustaciones precaladas de documentos, normalmente mediante la similitud coseno u otras métricas de distancia en un espacio vectorial.

Comparación de tipos de búsqueda

Agentic Recovery admite varios tipos de búsqueda. En la tabla siguiente se resumen cada tipo de búsqueda, los mejores casos de uso y las consideraciones de rendimiento:

Tipo de búsqueda Qué hace Casos de uso recomendados Notas sobre el rendimiento
Búsqueda de texto Busca palabras o frases exactas en los documentos mediante palabras clave, frases o consultas booleanas. Preguntas y respuestas estándar (preguntas y respuestas), búsqueda de documentos, escenarios de cumplimiento Rápido; altamente eficaz para búsquedas sencillas.
Búsqueda de vectores Usa la similitud semántica para buscar resultados contextualmente relevantes mediante la comparación de incrustaciones de vectores. Preguntas y respuestas conversacionales, búsqueda de contenido relacionado Rápido; un poco más de cómputo que la búsqueda de texto.
Búsqueda híbrida Combina texto (palabra clave) y vector (semántica) para mejorar la cobertura y la precisión. La mayoría de los escenarios; valor predeterminado para uso general Rápido; combina puntos fuertes de texto y búsqueda vectorial.
Híbrido multimodal Combina la búsqueda de texto, vector e imagen para recuperar y clasificar los resultados de varios tipos de datos en una sola consulta. Escenarios que implican texto e imágenes Más lento que el texto/vector; el rendimiento depende del tamaño o tipo de datos.
Búsqueda de texto completo Examina y compara todo el texto en los documentos. Legal, cumplimiento o cuando se requieren coincidencias exactas Más rápido para búsquedas de palabras clave; podría perder coincidencias semánticas.

Disponibilidad del tipo de búsqueda por implementación

Todos los tipos de búsqueda están disponibles con Agentic Retrieval, ya que todos los despliegues usan BYOM:

Tipo de búsqueda Disponible
Búsqueda híbrida
Búsqueda de texto
Búsqueda de vectores
Búsqueda multimodal híbrida

Para obtener más información sobre la implementación con un modelo de lenguaje, consulte:

Cómo seleccionar un tipo de búsqueda

Seleccione el tipo de búsqueda en el portal para desarrolladores de recuperación agente al configurar las opciones de consulta de datos. Algunos parámetros pueden diferir según el tipo de búsqueda y el modelo.

Puede definir el ámbito de todos los tipos de búsqueda a colecciones específicas. Al consultar a través del portal para desarrolladores o la API, especifique las colecciones que se van a buscar:

  • Portal para desarrolladores: seleccione la recopilación de destino en la configuración de consulta de datos.
  • API de inferencia: establezca data_sources[0].parameters.index_name en el nombre de la colección.
  • Servidor MCP: establezca collection_names en los argumentos de la herramienta. Puede consultar varias colecciones en una sola solicitud.

Para obtener más información, consulte Información general sobre colecciones y Introducción al servidor MCP.

Consideraciones sobre el rendimiento

Cada tipo de búsqueda ofrece diferentes características de rendimiento. Tenga en cuenta estos puntos al elegir la mejor opción para su escenario:

  • Texto, vector y búsqueda híbrida: Estos tipos de búsqueda están optimizados para velocidad y eficiencia. Devuelven resultados rápidamente, convirtiéndolos en una buena opción para la mayoría de los escenarios de búsqueda de documentos y preguntas y respuestas estándar.

  • Búsqueda híbrida multimodal: Este tipo de búsqueda procesa tanto texto como imágenes, lo cual puede incrementar el tiempo de procesamiento en comparación con las búsquedas de solo texto. El rendimiento depende del tamaño y el tipo de los datos.

Sugerencias para elegir un tipo de búsqueda

Utilice estos consejos para seleccionar el mejor tipo de búsqueda para su implementación de Agentic Retrieval y su escenario:

  • Elija el tipo de búsqueda que coincida con los datos y las necesidades del usuario.
  • La búsqueda híbrida es un buen valor predeterminado para la mayoría de los escenarios.
  • Todos los tipos de búsqueda están disponibles con el punto de conexión BYOM.
  • Cuando se usan agentes, el servidor MCP integrado proporciona herramientas de búsqueda. Consulte Introducción al servidor MCP.

Parámetros de tipo de búsqueda

En las tablas siguientes se enumeran y describen todos los parámetros que puede configurar para cada tipo de búsqueda en Agentic Recovery. No todos los parámetros están disponibles para cada tipo de búsqueda o implementación. El portal para desarrolladores de recuperación agente muestra solo las opciones que se aplican al tipo de búsqueda y al modelo de búsqueda seleccionados.

Parámetros del modelo

Los siguientes parámetros de modelo están disponibles para los tipos de búsqueda de texto, vector, híbrido y multimodal híbrido. Esta configuración controla cómo el modelo de lenguaje genera respuestas, como la creatividad o el enfoque de las respuestas, en lugar de cómo se recuperan o clasifican los documentos.

Parámetro de modelo Description
Temperatura Controla la aleatoriedad. Reducir la temperatura significa que el modelo genera respuestas más repetitivas y deterministas. Aumentar la temperatura da como resultado respuestas más inesperadas o creativas. Intente ajustar la temperatura o el Top P pero no ambos.
Top-P (muestreo de núcleo) De forma similar a la temperatura, este parámetro controla la aleatoriedad, pero usa un método diferente. Reducir Top P estrecha la selección de tokens del modelo a los tokens más probables. Aumentar Top P permite al modelo elegir entre tokens con alta y baja probabilidad. Intente ajustar la temperatura o el Top P pero no ambos.

Parámetros de búsqueda

Los siguientes parámetros de búsqueda están disponibles para los tipos de búsqueda textual, vectorial, híbrida e híbrida multimodal. Aunque los parámetros del modelo controlan cómo el modelo de lenguaje genera respuestas, estos parámetros de búsqueda permiten ajustar la forma en que la recuperación agente recupera, filtra y clasifica los documentos de los datos indexados. Estos parámetros le ayudan a optimizar la relevancia y precisión de la información enviada al modelo para cada consulta.

Estos parámetros solo se aplican a la experiencia de chat basada en conocimientos.

Parámetro de búsqueda Description
documentos deTop-N Hace referencia al número de fragmentos más relevantes proporcionados al modelo de lenguaje. Elegir N depende de las necesidades de la aplicación:

- Para una amplia cobertura, use un N mayor. Por ejemplo, 10-20.
- Para tareas críticas de precisión, use un N más pequeño. Por ejemplo, 3-5.

Experimente con valores N para equilibrar la precisión de recuperación y el rendimiento del modelo posterior. Mayor es el valor de N, cuanto mayor sea el tiempo de inferencia.
Rigor del texto Controla lo estrictamente que el sistema RAG filtra y clasifica los documentos de texto recuperados antes de pasarlos al modelo de generación.

- Baja rigurosidad: se consideran más documentos relevantes, incluso si solo están relacionados de forma flexible con la consulta.
- Alta precisión: solo se usan documentos que coincidan estrechamente con la consulta.
Restricción de imagen (solo búsqueda híbrida multimodal) Es similar a la rigurosidad del texto, pero se aplica a los datos de imágenes recuperados.

- Baja rigurosidad: el sistema podría recuperar una gama más amplia de imágenes.
- Alta rigurosidad: solo se recuperan las imágenes que están estrechamente alineadas con la consulta.