Configuración de una caché de enriquecimiento

Importante

Esta característica está en versión preliminar en términos de uso complementarios. Las API REST en versión preliminar admiten esta característica.

En este artículo se explica cómo añadir almacenamiento en caché a la canalización de un conjunto de aptitudes para que pueda modificar el proceso de enriquecimiento posterior sin necesidad de realizar una recompilación completa cada vez. De forma predeterminada, un conjunto de aptitudes no tiene estado y el cambio de cualquier parte de su composición requiere una nueva ejecución completa del indexador. Con una caché de enriquecimiento, el indexador determina qué partes del árbol de documentos se deben actualizar en función de los cambios de definición del conjunto de aptitudes o del indexador. La salida procesada existente se conserva y se reutiliza siempre que sea posible.

El contenido almacenado en caché se coloca en Azure Storage mediante un cadena de conexión que proporcione. Estos objetos se crean al ejecutar el indexador. Debe considerarse un componente interno administrado por el servicio de búsqueda y no debe modificarse.

  • Un contenedor denominado ms-az-search-indexercache-<alpha-numeric-string>
  • Tablas denominadas MsAzSearchIndexerCacheIndex<alpha-numeric-string>

Requisitos previos

  • Azure Storage para almacenar enriquecimientos almacenados en caché. La cuenta de almacenamiento debe ser de uso general v2.

  • Solo para la indexación de blobs, si necesita una eliminación sincronizada de documentos tanto de la caché como del índice cuando se eliminan blobs de su origen de datos, active una directiva de eliminación en el indexador. Sin esta directiva, no se admite la eliminación de documentos de la memoria caché.

Debe estar familiarizado con la configuración de indexadores y conjuntos de habilidades. Comience con la información general del indexador y continúe con las conjunto de aptitudes para aprender sobre las canalizaciones de enriquecimiento.

Limitaciones

Precaución

Si usa el indexador SharePoint (versión preliminar), debe evitar el enriquecimiento incremental. En determinadas circunstancias, la memoria caché no es válida, lo que requiere un restablecimiento del indexador y una recompilación completa, si decide volver a cargarla.

Permisos

Una identidad de Búsqueda de Azure AI necesita tener acceso de escritura a Azure Storage.

  • Colaborador de datos de Storage Blob
  • Contribuidor de datos de la tabla de almacenamiento

La sintaxis de la cadena de conexión determina si se usa una identidad asignada por el sistema o por el usuario. Para obtener más información, consulte Connect to Azure Storage using a managed identity.

Establecimiento de la propiedad de caché

Use este procedimiento para indizadores nuevos y existentes.

En la definición del indexador, establezca cache con:

  • (Obligatorio) storageConnectionString establecido en una cadena de conexión de Azure Storage.
  • (Opcional) enableReprocessing (true de forma predeterminada). Establézcalo en false para suspender el enriquecimiento incremental temporalmente y vuelva a cambiarlo a true más adelante.
  1. A la izquierda, seleccione Indexadores.

  2. Seleccione Agregar indexador para crear un nuevo indexador o abrir uno existente en modo de edición JSON.

  3. Habilite el enriquecimiento incremental, establezca la cuenta de almacenamiento de caché de enriquecimiento y guarde el indexador.

    Captura de pantalla de la opción del portal de Azure para la caché de enriquecimiento.

  4. Restablezca el indexador si ya existe.

  5. Ejecute el indexador. Esta recompilación completa de una sola vez inicializa la memoria caché. Una vez cargado, la reutilización incremental se aplica a las ejecuciones posteriores.