Elegir un modelo de precios y un nivel de servicio en Búsqueda de Azure AI

Al crear un servicio de búsqueda, debe elegir un modelo de precios y un nivel de servicio. Búsqueda de Azure AI ofrece dos modelos de precios, cada uno adecuado para diferentes patrones de carga de trabajo, con niveles de servicio asociados que determinan la capacidad y las características:

Modelo de precios Más adecuado para Cómo se le factura
Dedicated Cargas de trabajo estables, predecibles y de uso elevado Capacidad fija a través de unidades de búsqueda (SU); tarifa por hora basada en la selección de un nivel de servicio
Sin servidor (versión preliminar) Cargas de trabajo poco frecuentes, con picos o muy variables Basado en el consumo: medido por unidades de proceso (RU) e almacenamiento indexado (GB/mes)

Nota:

Las unidades de búsqueda de modelos dedicados (SU) y las unidades de proceso del modelo sin servidor (RU) no son iguales y no se pueden usar indistintamente. No utilice calculadoras ni estimaciones de precios basadas en SU para cargas de trabajo sin servidor.

Ambos modelos proporcionan las mismas características principales de búsqueda (con algunas excepciones secundarias para la versión preliminar sin servidor que se indica a continuación). La principal diferencia es el comportamiento de precios y escala, no las funcionalidades.

Al seleccionar el modelo de precios dedicado, es necesario calcular las necesidades de la carga de trabajo y , a continuación, elegir un nivel de servicio con la capacidad aprovisionada adecuada.

La selección del modelo de precios sin servidor no requiere seleccionar un nivel de servicio aprovisionado previamente, pero usa precios basados en el consumo, por lo que la optimización del rendimiento afectará directamente al costo.

Sin servidor (versión preliminar)

Importante

El nivel Desarrollador sin servidor está actualmente en versión preliminar. Esta versión preliminar se ofrece sin contrato de nivel de servicio y no es aconsejable usarla en las cargas de trabajo de producción. Es posible que algunas características no se admitan o que tengan funcionalidades restringidas. Para más información, consulte Términos de uso complementarios para las versiones preliminares de Microsoft Azure.

La facturación del nivel Desarrollador sin servidor aún no está habilitada durante la versión preliminar. Los costos estimados del uso están disponibles en el portal de Azure y la telemetría, pero ese uso no aparecerá en la factura de Azure durante este período inicial. Microsoft proporcionará al menos 30 días de aviso antes de que comience la facturación. El aplazamiento de la facturación durante esta versión preliminar es temporal. El desarrollador sin servidor es un nivel de pago y será responsable de los cargos acumulados una vez que comience la facturación.

El nivel Desarrollador sin servidor no admite la migración a ni desde otros planes de tarifa y algunas características disponibles en otros niveles no se admiten durante la versión preliminar pública. Los límites de servicio, las características admitidas y los detalles de precios pueden cambiar antes de la disponibilidad general.

La versión preliminar solo está disponible actualmente en centro-oeste de EE. UU., Norte de Suiza y Este de Japón.

El modelo de precios sin servidor es una oferta basada en el consumo que escala automáticamente el proceso y el almacenamiento en función de la carga de trabajo. Elimina la necesidad de aprovisionar la capacidad por adelantado, lo que le permite pagar solo por los recursos que usa.

Con el modelo sin servidor, no configura réplicas, particiones ni unidades de búsqueda. En su lugar, el servicio administra la capacidad dinámicamente en respuesta al volumen de consulta, la actividad de indexación y la complejidad de la carga de trabajo.

La facturación se basa en dos dimensiones principales:

  • Uso de cómputo: se mide en Unidades de Cómputo por hora (CU/h) y se factura en función del trabajo realizado (consultas, indexación y otras operaciones).
  • Almacenamiento de índices: Se cobra por GB al mes según el tamaño de los índices.

Este modelo está diseñado para cargas de trabajo con demanda variable, incluido el tráfico de ráfaga y las aplicaciones multiinquilino. Admite las mismas características y API de búsqueda principales que los servicios dedicados, por lo que puede compilar y ejecutar aplicaciones de búsqueda sin volver a escribir código.

El nivel Desarrollador sin servidor está en versión preliminar pública y actualmente no admite las siguientes características:

  • Alias de índice: no admitidos
  • Sesiones de depuración: No admitidas
  • Redes privadas para indexadores: no compatible
  • Origen de conocimiento de archivos (versión preliminar): no admitido
  • Recursos de Private Link compartidos: no hay compatibilidad planeada con el modelo sin servidor
  • Acuerdo de nivel de servicio (SLA): no disponible durante la versión preliminar pública

Para obtener más información, consulte los límites del servicio en Búsqueda de Azure AI.

Para obtener más opciones de implementación sin servidor a gran escala, póngase en contacto con Microsoft mediante el formulario de registro de la versión preliminar privada sin servidor Búsqueda de Azure AI.

Dedicated

El modelo de precios dedicado es una oferta de capacidad aprovisionada que proporciona un rendimiento y un costo predecibles asignando infraestructura fija a la carga de trabajo. Configure la capacidad por adelantado, lo que permite al servicio controlar las demandas coherentes de indexación y consulta con recursos garantizados.

Con los niveles Dedicados, se configuran explícitamente réplicas, particiones y unidades de búsqueda (SU). Las réplicas proporcionan rendimiento de consultas y alta disponibilidad, mientras que las particiones definen la capacidad de almacenamiento e indexación. Juntos, determinan las características de capacidad y rendimiento totales del servicio de búsqueda.

La facturación se basa en:

  • Nivel de servicio: capacidad aprovisionada previamente seleccionada.
  • Unidades de búsqueda (SUs): la unidad de facturación para servicios dedicados, calculada como réplicas × particiones. Se le factura a una tarifa horaria fija según el número de unidades de búsqueda y el nivel de servicio seleccionado.

Este modelo está diseñado para cargas de trabajo con demanda estable y predecible, donde el rendimiento coherente, la baja latencia y el escalado controlado son importantes.

En el modelo de precios dedicado, el nivel de servicio seleccionado determina:

  • Número máximo de índices y otros objetos permitidos en el servicio.
  • Tamaño y velocidad de las particiones (almacenamiento físico).
  • Tasa facturable como un costo mensual fijo, pero también un costo incremental si agrega capacidad.
  • Características de la carga de trabajo. Algunos niveles están optimizados para cargas de trabajo específicas.

En algunos casos, el nivel también determina la disponibilidad de las características premium.

Descripciones de los planes

Entre los niveles facturables más usados se incluyen:

  • Basic admite cargas de trabajo de producción y puede cumplir los requisitos del Acuerdo de Nivel de Servicio con hasta tres réplicas.

  • Standard (S1, S2, S3) es el nivel predeterminado. Admite el escalado de particiones y réplicas, lo que permite cargas de trabajo más grandes y un rendimiento mejorado.

Algunos niveles están diseñados para determinados tipos de trabajo:

  • Standard 3 High Density (S3 HD) es un modo de alojamiento para S3 optimizado para la multitenencia. S3 HD tiene el mismo cargo por unidad que S3, pero admite un gran número de índices más pequeños y usa hardware optimizado para lecturas rápidas de archivos y escenarios de almacenamiento de alta densidad.

  • Los niveles optimizados para almacenamiento (L1, L2) proporcionan un almacenamiento de menor costo por TB y están diseñados para índices grandes y actualizados con menos frecuencia. Normalmente, estos niveles tienen una mayor latencia de consulta.

También hay un nivel de servicio de búsqueda gratuito y limitado:

  • Gratis crea un servicio de búsqueda limitado para proyectos pequeños, como tutoriales y desarrollo. Los recursos se comparten entre inquilinos y no se admite el escalado. Algunas características premium no están disponibles y el servicio puede eliminarse después de períodos de inactividad. Solo puede tener un servicio de búsqueda gratuito por suscripción de Azure.

Las tarifas de facturación se muestran en el portal Azure al crear un nuevo servicio de búsqueda de IA en la página Seleccionar plan de tarifa.

Captura de pantalla del portal de Azure: seleccione un gráfico de nivel de precios que muestra los niveles de servicio y sus SKU correspondientes.

Puede consultar la página de precios de las tarifas regionales.

Revise Planeamiento y administración de costos para obtener más información sobre el modelo de precios dedicado y cómo se compara con el modelo sin servidor.

Compruebe los límites de Service en Búsqueda de Azure AI o los límites de almacenamiento, cargas de trabajo y recuentos de objetos por nivel.

Cómo seleccionar un nivel

En el portal de Azure, los niveles de servicio se especifican en la página Seleccionar plan de tarifa al crear el servicio.

En PowerShell o la CLI de Azure, el nivel se especifica mediante el parámetro -Sku.

Disponibilidad de regiones por nivel

La lista de regiones proporciona las ubicaciones donde se ofrece Búsqueda de Azure AI. Algunas regiones pueden tener restricciones de capacidad para determinados niveles, lo que impide la creación de nuevos servicios de búsqueda en esos niveles. La lista usa notas al pie para indicar regiones y niveles restringidos.

Al crear un servicio de búsqueda en Azure Portal, las combinaciones de nivel de región no disponible se excluyen automáticamente.

Disponibilidad de características por nivel

La mayoría de las características están disponibles en todos los niveles. En algunos casos, la disponibilidad de características depende del nivel seleccionado:

Característica Consideraciones sobre el nivel
Indizadores Los indexadores están disponibles en S3 HD con cuota de ejecución diaria entre indexadores y otras consideraciones. Los indexadores tienen más limitaciones en el nivel gratis.
indexador executionEnvironment parámetro de configuración La capacidad de anclar todo el procesamiento del indexador a solo los clústeres de búsqueda asignados al servicio de búsqueda requiere S2 y versiones posteriores.
Enriquecimiento con IA Se ejecuta en el nivel Gratis, pero no se recomienda para cargas de trabajo de gran tamaño.
Identidades administradas o de confianza para el acceso saliente (indexador) No disponibles en el nivel Gratis.
Claves de cifrado administradas por el cliente No disponibles en el nivel Gratis.
Acceso al firewall de IP No disponibles en el nivel Gratis.
Punto de conexión privado (integración con Azure Private Link) En el caso de las conexiones entrantes a un servicio de búsqueda, no está disponible en el nivel Gratis.
En el caso de las conexiones salientes de indexadores a otros recursos de Azure, no es´ta disponible en el nivel Gratis ni S3 HD.
Para los indexadores que usan conjuntos de aptitudes, no está disponible en los niveles Gratis, Básico, S1 o S3 HD.
Zonas de disponibilidad No disponibles en el nivel Gratis.
Clasificador semántico Se ejecuta en el nivel Gratis, pero no se recomienda para cargas de trabajo de gran tamaño.

Es posible que las características que consumen muchos recursos no funcionen bien a menos que se le proporcione capacidad suficiente. Por ejemplo, el enriquecimiento con IA contiene funciones de ejecución prolongada que agotan el tiempo de espera en un servicio Gratis, a menos que el conjunto de datos sea pequeño.

Límites superiores

Los niveles determinan el almacenamiento máximo del propio servicio, además del número máximo de índices, indexadores, orígenes de datos, conjuntos de aptitudes y mapas de sinónimos que puede crear. Para obtener un desglose completo de todos los límites, consulte Límites de servicio en Azure AI Search.

Tamaño de partición y velocidad

Los precios del plan incluyen detalles sobre el almacenamiento por partición, que va desde 15 GB para Básico hasta 2 TB para los niveles optimizados para almacenamiento (L2). Otras características de hardware, como la velocidad de las operaciones, la latencia y las tasas de transferencia, no se publican, pero los niveles que están diseñados para arquitecturas de soluciones específicas se basan en hardware que tiene las características necesarias para admitir esos escenarios. Para más información sobre particiones, vea Estimación y administración de la capacidad y Confiabilidad en Búsqueda de Azure AI.

Nota:

Las particiones de mayor capacidad estuvieron disponibles en regiones seleccionadas en abril de 2024. En mayo de 2024 se publicó una segunda oleada de particiones de mayor capacidad. Si tiene un servicio de búsqueda anterior, es posible que pueda actualizar el servicio para beneficiarse de más capacidad a la misma tarifa de facturación.

Tasas de facturación

Los niveles tienen tasas de facturación diferentes, con tasas mayores para los niveles que se ejecutan en hardware más caro o proporcionan características más costosas. La tarifa de facturación del nivel puede encontrarse en las páginas de precios de Azure para Azure AI Search.

Después de crear un servicio, la tasa de facturación se convierte en un costo fijo de ejecutar el servicio las 24 horas, y un costo incremental si decides agregar más capacidad.

En el modelo dedicado, la facturación se basa en unidades de búsqueda (SU), que combinan particiones (almacenamiento) y réplicas (capacidad de consulta).

  • Un servicio comienza con una partición y una réplica (una SU)
  • Agregar particiones o réplicas aumenta el costo linealmente con el número de SU

Por ejemplo, agregar réplicas para mejorar la disponibilidad o el rendimiento aumenta el costo mensual proporcionalmente.

Para obtener más información, consulte Planeamiento y administración de costos.

Ejemplo de tasa de facturación

En el ejemplo siguiente se propociona una ilustración. Supongamos que tenemos una tasa de facturación hipotética de 100 $ al mes. Si mantiene el servicio de búsqueda en su capacidad inicial de una partición y una réplica, pagará 100 $ al final del mes. Sin embargo, si agrega dos réplicas más para lograr una alta disponibilidad, la factura mensual aumenta a 300 $ (100 $ para el primer par de réplica-partición más 200 $ para las dos réplicas).

Cambios de nivel

Nota:

Los servicios de búsqueda existentes pueden cambiar entre los niveles Básico y Estándar (S1, S2 y S3). La configuración del servicio actual no puede superar los límites del nivel de destino y la región no puede tener restricciones de capacidad en el nivel de destino. Para obtener más información, consulte Cambio del plan de tarifa.

Para cambiar a un nivel diferente al de los enumerados anteriormente:

  1. Cree un servicio de búsqueda en el nuevo nivel.
  2. Implementar contenido de búsqueda en el nuevo nivel. Siga esta lista de comprobación para asegurarse de que tiene todo el contenido.
  3. Elimine el servicio antiguo cuando esté seguro de que ya no es necesario.

Para índices de gran tamaño que no desea recompilar desde cero, use uno de los siguientes ejemplos de copia de seguridad y restauración:

Pasos siguientes

La mejor manera de elegir un plan de tarifa es empezar con un plan de costo mínimo y, a continuación, permitir la experiencia y las pruebas para informar a su decisión de mantener el servicio o cambiar a un nivel superior.

Para conocer los pasos siguientes, se recomienda crear un servicio de búsqueda en un nivel que pueda dar cabida al nivel de pruebas que propone realizar y, a continuación, revisar las siguientes instrucciones sobre cómo calcular el costo y la capacidad: