Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Video Indexer de Azure AI admite el reconocimiento automático de voz mediante la integración con Microsoft Custom Speech Service. Puede personalizar el modelo de lenguaje cargando texto de adaptación. Este texto procede del dominio del cual desea que el motor use su vocabulario para adaptarse. Una vez que entrenas tu modelo, el motor reconoce nuevas palabras que aparecen en el texto de adaptación, asumiendo que la pronunciación es predeterminada, y el modelo de lenguaje aprende nuevas secuencias probables de palabras. Consulte la lista de idiomas compatibles con Azure AI Video Indexer en idiomas compatibles.
Por ejemplo, Kubernetes (en el contexto del servicio Azure Kubernetes), es una palabra muy específica. Dado que la palabra es nueva para Azure AI Video Indexer, se reconoce como comunidades. Entrene el modelo para reconocerlo como Kubernetes. En otros casos, existen las palabras, pero el modelo de lenguaje no espera que aparezcan en un contexto determinado. Por ejemplo, el servicio de contenedor no es una secuencia de dos palabras que un modelo de lenguaje no especificado reconocería como un conjunto específico de palabras.
Hay dos maneras de personalizar un modelo de lenguaje:
- Opción 1: Edite la transcripción generada por Video Indexer de Azure AI. Al editar y corregir la transcripción, se entrena un modelo de lenguaje para proporcionar resultados mejorados en el futuro.
- Opción 2: Cargar archivos de texto para entrenar el modelo de lenguaje. El archivo puede contener una lista de palabras que desea que aparezcan en la transcripción del Indexador de Video de Azure AI. O bien, puede contener las palabras pertinentes incluidas naturalmente en oraciones y párrafos. A medida que se logren mejores resultados con este último enfoque, incluya oraciones completas o párrafos relacionados con el contenido del archivo de carga.
Importante
No incluya en el archivo de carga las palabras o oraciones transcritas incorrectamente en el momento (por ejemplo, comunidades), ya que esta inclusión niega el impacto deseado. Incluya solo las palabras que quiera que aparezcan (por ejemplo, Kubernetes).
Optimización del modelo de lenguaje personalizado
Video Indexer de Azure AI aprende en función de las probabilidades de combinaciones de palabras, por lo que aprenderá mejor:
- Ofrézcale suficientes ejemplos de oraciones reales del modo en que se pronunciarían.
- Coloque solo una oración por línea, no más. De lo contrario, el sistema aprende probabilidades entre oraciones.
- Está bien utilizar una sola palabra como una oración para resaltar esa palabra frente a otras, pero el sistema aprende mejor de las oraciones completas.
- Al introducir palabras o acrónimos nuevos, si es posible, proporcione tantos ejemplos de uso como pueda en una oración completa para ofrecer al sistema tanto contexto como sea posible.
- Intente colocar varias opciones de adaptación y vea cómo funcionan.
- Evite la repetición de la misma oración exacta varias veces. Podría crear sesgos en el resto de la entrada.
- Evite incluir símbolos poco comunes (~, # @ % &) porque se descartan. Las oraciones en las que aparecen también se descartan.
- Evite colocar entradas demasiado grandes, como cientos de miles de oraciones, ya que al hacerlo se diluye el efecto de aumentar.
Requisitos previos
- Una cuenta de Azure
- Una cuenta de Video Indexer de Azure AI
Creación de un modelo de lenguaje
- Vaya al sitio web de Azure AI Video Indexer e inicie sesión.
- Para personalizar un modelo en su cuenta, seleccione el botón Content model customization (Personalización del modelo de contenido) a la izquierda de la página.
- Seleccione la pestaña Idioma . Verá una lista de idiomas admitidos.
- En el idioma que desee, seleccione Agregar modelo.
- Escriba el nombre del modelo de lenguaje y presione Entrar. En este paso se crea el modelo y se ofrece la opción de cargar en él archivos de texto.
- Para agregar un archivo de texto, seleccione Agregar archivo. Se abre el explorador de archivos.
- Vaya al archivo de texto y selecciónelo. Puede agregar varios archivos de texto a un modelo de lenguaje. También puede agregar un archivo de texto seleccionando el botón ... situado en el lado derecho del modelo de lenguaje y seleccionando Agregar archivo.
- Cuando haya terminado de cargar los archivos de texto, seleccione la opción verde Entrenar.
Este proceso puede tardar varios minutos. Cuando se realiza el entrenamiento, Trained aparece junto al modelo. Puede obtener una vista previa del archivo del modelo, descargarlo y eliminarlo.
Uso de un modelo de lenguaje en un nuevo vídeo
Para usar el modelo de lenguaje en un nuevo vídeo, complete una de las siguientes acciones:
- Seleccione Cargar en la parte superior de la página.
- Coloque el archivo de audio o vídeo o busque el archivo.
- Seleccione un modelo de lenguaje que creó en la lista Idioma de origen de vídeo .
- Seleccione la opción Cargar en la parte inferior de la página. Tu nuevo vídeo se indexa mediante tu modelo de lenguaje.
Uso de un modelo de lenguaje para volver a indexar
- Inicie sesión en la página principal de Azure AI Video Indexer .
- Seleccione los puntos suspensivos (...) en el vídeo y, a continuación, seleccione Volver a indexar.
- Seleccione la lista Idioma de origen de vídeo y seleccione un modelo de lenguaje que creó en la lista.
- Seleccione Volver a indexar y el vídeo se vuelve a indexar mediante el modelo de lenguaje.
Edición de un modelo de lenguaje
Puede editar un modelo de lenguaje cambiando su nombre, agregando archivos a él y eliminando archivos de él. Si agrega o elimina archivos del modelo de lenguaje, debe volver a entrenar el modelo seleccionando la opción Train (Entrenar) verde.
Cambiar el nombre del modelo de lenguaje
Para cambiar el nombre del modelo de lenguaje, seleccione los puntos suspensivos (...) en el lado derecho del modelo de lenguaje y seleccione Cambiar nombre. Escriba el nuevo nombre.
Incorporación de archivos
- Seleccione Add file (Agregar archivo). Se abre el Explorador de archivos.
- Vaya al archivo de texto y selecciónelo. Puede agregar varios archivos de texto a un modelo de lenguaje.
También puede agregar un archivo de texto seleccionando el botón de puntos suspensivos (...) situado en el lado derecho del modelo de lenguaje y seleccionando Agregar archivo.
Eliminar archivos
Esta acción quita completamente el archivo del modelo de lenguaje.
- Seleccione el botón de puntos suspensivos (...) situado en el lado derecho del archivo de texto.
- Seleccione Eliminar. Aparece una nueva ventana que le indica que la eliminación no se puede deshacer.
- Seleccione la opción Eliminar en la nueva ventana.
Eliminación de un modelo de lenguaje
Esta acción quita el modelo de lenguaje de la cuenta. Cualquier vídeo que use el modelo de lenguaje eliminado mantiene el mismo índice hasta que vuelva a indexar el vídeo. Si vuelve a indexar el vídeo, puede asignar un nuevo modelo de lenguaje al vídeo. De lo contrario, Video Indexer de Azure AI usa su modelo predeterminado para volver a indexar el vídeo.
- Seleccione el botón de puntos suspensivos (...) situado a la derecha del modelo de lenguaje.
- Seleccione Eliminar. Aparece una nueva ventana que le indica que la eliminación no se puede deshacer.
- Seleccione la opción Eliminar en la nueva ventana.
Personalización de modelos de lenguaje mediante la corrección de transcripciones
Video Indexer de Azure AI personaliza los modelos de lenguaje en función de las correcciones reales que realizan los usuarios en las transcripciones de sus vídeos. Captura todas las líneas que corrigió en la transcripción del vídeo y las agrega a un archivo de texto denominado From transcript edits. Estas ediciones se usan para volver a entrenar el modelo de lenguaje que se usó para indexar el vídeo.
También se incluyen las modificaciones que realice en la escala de tiempo del widget .
Si no especifica un modelo de lenguaje al indexar este vídeo, Video Indexer de Azure AI almacena todas las ediciones de este vídeo en un modelo de lenguaje predeterminado llamado Account adaptations dentro del idioma detectado del vídeo.
Si realiza varias modificaciones en la misma línea, Video Indexer de Azure AI usa solo la última versión de la línea corregida para actualizar el modelo de lenguaje.
Nota:
Solo las correcciones textuales se usan para la personalización. No se incluyen las correcciones que no impliquen palabras reales (por ejemplo, los signos de puntuación o los espacios).
- Seleccione el vídeo que desea editar desde la biblioteca.
- Seleccione la pestaña Timeline (Escala de tiempo).
- Seleccione el icono del lápiz para editar la transcripción.
- Verá que las correcciones de transcripción aparecen en la pestaña Idioma de la página Personalización del modelo de contenido. Seleccione el modelo de lenguaje que desee para ver su archivo "Ediciones de transcripción de origen".