Personalización de un modelo de lenguaje con Video Indexer de Azure AI

Se aplica a: Cloud-based Azure AI Video Indexer

Video Indexer de Azure AI admite el reconocimiento automático de voz mediante la integración con Microsoft Custom Speech Service. Puede personalizar el modelo de lenguaje cargando texto de adaptación. Este texto procede del dominio del cual desea que el motor use su vocabulario para adaptarse. Una vez que entrenas tu modelo, el motor reconoce nuevas palabras que aparecen en el texto de adaptación, asumiendo que la pronunciación es predeterminada, y el modelo de lenguaje aprende nuevas secuencias probables de palabras. Consulte la lista de idiomas compatibles con Azure AI Video Indexer en idiomas compatibles.

Por ejemplo, Kubernetes (en el contexto del servicio Azure Kubernetes), es una palabra muy específica. Dado que la palabra es nueva para Azure AI Video Indexer, se reconoce como comunidades. Entrene el modelo para reconocerlo como Kubernetes. En otros casos, existen las palabras, pero el modelo de lenguaje no espera que aparezcan en un contexto determinado. Por ejemplo, el servicio de contenedor no es una secuencia de dos palabras que un modelo de lenguaje no especificado reconocería como un conjunto específico de palabras.

Hay dos maneras de personalizar un modelo de lenguaje:

Opción 1: Edite la transcripción generada por Video Indexer de Azure AI. Al editar y corregir la transcripción, se entrena un modelo de lenguaje para proporcionar resultados mejorados en el futuro.
Opción 2: Cargar archivos de texto para entrenar el modelo de lenguaje. El archivo puede contener una lista de palabras que desea que aparezcan en la transcripción del Indexador de Video de Azure AI. O bien, puede contener las palabras pertinentes incluidas naturalmente en oraciones y párrafos. A medida que se logren mejores resultados con este último enfoque, incluya oraciones completas o párrafos relacionados con el contenido del archivo de carga.

Importante

No incluya en el archivo de carga las palabras o oraciones transcritas incorrectamente en el momento (por ejemplo, comunidades), ya que esta inclusión niega el impacto deseado. Incluya solo las palabras que quiera que aparezcan (por ejemplo, Kubernetes).

Optimización del modelo de lenguaje personalizado

Video Indexer de Azure AI aprende en función de las probabilidades de combinaciones de palabras, por lo que aprenderá mejor:

Ofrézcale suficientes ejemplos de oraciones reales del modo en que se pronunciarían.
Coloque solo una oración por línea, no más. De lo contrario, el sistema aprende probabilidades entre oraciones.
Está bien utilizar una sola palabra como una oración para resaltar esa palabra frente a otras, pero el sistema aprende mejor de las oraciones completas.
Al introducir palabras o acrónimos nuevos, si es posible, proporcione tantos ejemplos de uso como pueda en una oración completa para ofrecer al sistema tanto contexto como sea posible.
Intente colocar varias opciones de adaptación y vea cómo funcionan.
Evite la repetición de la misma oración exacta varias veces. Podría crear sesgos en el resto de la entrada.
Evite incluir símbolos poco comunes (~, # @ % &) porque se descartan. Las oraciones en las que aparecen también se descartan.
Evite colocar entradas demasiado grandes, como cientos de miles de oraciones, ya que al hacerlo se diluye el efecto de aumentar.

Requisitos previos

Una cuenta de Azure
Una cuenta de Video Indexer de Azure AI

Portal web
API

Creación de un modelo de lenguaje

Vaya al sitio web de Azure AI Video Indexer e inicie sesión.
Para personalizar un modelo en su cuenta, seleccione el botón Content model customization (Personalización del modelo de contenido) a la izquierda de la página.
Seleccione la pestaña Idioma . Verá una lista de idiomas admitidos.
En el idioma que desee, seleccione Agregar modelo.
Escriba el nombre del modelo de lenguaje y presione Entrar. En este paso se crea el modelo y se ofrece la opción de cargar en él archivos de texto.
Para agregar un archivo de texto, seleccione Agregar archivo. Se abre el explorador de archivos.
Vaya al archivo de texto y selecciónelo. Puede agregar varios archivos de texto a un modelo de lenguaje. También puede agregar un archivo de texto seleccionando el botón ... situado en el lado derecho del modelo de lenguaje y seleccionando Agregar archivo.
Cuando haya terminado de cargar los archivos de texto, seleccione la opción verde Entrenar.

Este proceso puede tardar varios minutos. Cuando se realiza el entrenamiento, Trained aparece junto al modelo. Puede obtener una vista previa del archivo del modelo, descargarlo y eliminarlo.

Uso de un modelo de lenguaje en un nuevo vídeo

Para usar el modelo de lenguaje en un nuevo vídeo, complete una de las siguientes acciones:

Seleccione Cargar en la parte superior de la página.
Coloque el archivo de audio o vídeo o busque el archivo.
Seleccione un modelo de lenguaje que creó en la lista Idioma de origen de vídeo .
Seleccione la opción Cargar en la parte inferior de la página. Tu nuevo vídeo se indexa mediante tu modelo de lenguaje.

Uso de un modelo de lenguaje para volver a indexar

Inicie sesión en la página principal de Azure AI Video Indexer .
Seleccione los puntos suspensivos (...) en el vídeo y, a continuación, seleccione Volver a indexar.
Seleccione la lista Idioma de origen de vídeo y seleccione un modelo de lenguaje que creó en la lista.
Seleccione Volver a indexar y el vídeo se vuelve a indexar mediante el modelo de lenguaje.

Edición de un modelo de lenguaje

Puede editar un modelo de lenguaje cambiando su nombre, agregando archivos a él y eliminando archivos de él. Si agrega o elimina archivos del modelo de lenguaje, debe volver a entrenar el modelo seleccionando la opción Train (Entrenar) verde.

Cambiar el nombre del modelo de lenguaje

Para cambiar el nombre del modelo de lenguaje, seleccione los puntos suspensivos (...) en el lado derecho del modelo de lenguaje y seleccione Cambiar nombre. Escriba el nuevo nombre.

Incorporación de archivos

Seleccione Add file (Agregar archivo). Se abre el Explorador de archivos.
Vaya al archivo de texto y selecciónelo. Puede agregar varios archivos de texto a un modelo de lenguaje.

También puede agregar un archivo de texto seleccionando el botón de puntos suspensivos (...) situado en el lado derecho del modelo de lenguaje y seleccionando Agregar archivo.

Eliminar archivos

Esta acción quita completamente el archivo del modelo de lenguaje.

Seleccione el botón de puntos suspensivos (...) situado en el lado derecho del archivo de texto.
Seleccione Eliminar. Aparece una nueva ventana que le indica que la eliminación no se puede deshacer.
Seleccione la opción Eliminar en la nueva ventana.

Eliminación de un modelo de lenguaje

Esta acción quita el modelo de lenguaje de la cuenta. Cualquier vídeo que use el modelo de lenguaje eliminado mantiene el mismo índice hasta que vuelva a indexar el vídeo. Si vuelve a indexar el vídeo, puede asignar un nuevo modelo de lenguaje al vídeo. De lo contrario, Video Indexer de Azure AI usa su modelo predeterminado para volver a indexar el vídeo.

Seleccione el botón de puntos suspensivos (...) situado a la derecha del modelo de lenguaje.
Seleccione Eliminar. Aparece una nueva ventana que le indica que la eliminación no se puede deshacer.
Seleccione la opción Eliminar en la nueva ventana.

Personalización de modelos de lenguaje mediante la corrección de transcripciones

Video Indexer de Azure AI personaliza los modelos de lenguaje en función de las correcciones reales que realizan los usuarios en las transcripciones de sus vídeos. Captura todas las líneas que corrigió en la transcripción del vídeo y las agrega a un archivo de texto denominado From transcript edits. Estas ediciones se usan para volver a entrenar el modelo de lenguaje que se usó para indexar el vídeo.

También se incluyen las modificaciones que realice en la escala de tiempo del widget .

Si no especifica un modelo de lenguaje al indexar este vídeo, Video Indexer de Azure AI almacena todas las ediciones de este vídeo en un modelo de lenguaje predeterminado llamado Account adaptations dentro del idioma detectado del vídeo.

Si realiza varias modificaciones en la misma línea, Video Indexer de Azure AI usa solo la última versión de la línea corregida para actualizar el modelo de lenguaje.

Nota:

Solo las correcciones textuales se usan para la personalización. No se incluyen las correcciones que no impliquen palabras reales (por ejemplo, los signos de puntuación o los espacios).

Seleccione el vídeo que desea editar desde la biblioteca.
Seleccione la pestaña Timeline (Escala de tiempo).
Seleccione el icono del lápiz para editar la transcripción.
Verá que las correcciones de transcripción aparecen en la pestaña Idioma de la página Personalización del modelo de contenido. Seleccione el modelo de lenguaje que desee para ver su archivo "Ediciones de transcripción de origen".

Creación de un modelo de lenguaje

Realice una solicitud Create Language Model API para crear un nuevo modelo de lenguaje personalizado para la cuenta especificada. Puede cargar archivos para el modelo de lenguaje con esta solicitud. Como alternativa, puede crear el modelo de lenguaje aquí y cargar archivos para el modelo más adelante actualizando el modelo de lenguaje.

Debe cargar archivos dentro del cuerpo del mensaje mediante FormData además de proporcionar valores para los parámetros necesarios. Puede definir el par de claves para esta tarea de dos maneras:

La clave es el nombre de archivo y el valor es el archivo txt.
La clave es el nombre de archivo y el valor es una dirección URL al archivo txt.

Nota:

Todavía tiene que entrenar al modelo con sus archivos habilitados para que aprenda el contenido de sus archivos.

Respuesta de ejemplo

{
    "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
    "name": "TestModel",
    "language": "En-US",
    "state": "None",
    "languageModelId": "00000000-0000-0000-0000-000000000000",
    "files": [
    {
        "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.6733333"
    },
    {
        "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
        "name": "worldfile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.86"
    }
    ]
}

Entrenamiento de un modelo de lenguaje

La solicitud Train Language Model entrena un modelo de lenguaje personalizado para la cuenta especificada con el contenido de los archivos cargados y habilitados en el modelo de lenguaje.

Nota:

Primero debe crear el modelo de lenguaje y cargar sus archivos. Puede cargar archivos al crear el modelo de lenguaje o actualizando el modelo de lenguaje.

Respuesta de ejemplo

{
    "id": "41464adf-e432-42b1-8e09-f52905d7e29d",
    "name": "TestModel",
    "language": "En-US",
    "state": "Waiting",
    "languageModelId": "531e5745-681d-4e1d-b124-12e5ab57a891",
    "files": [
    {
        "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
        "name": "RenamedFile",
        "enable": false,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.5233333"
    },
    {
        "id": "9ac35b4b-1381-49c4-9fe4-8234bfdd0f50",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.68"
    }
    ]
}

id es un identificador único que se usa para distinguir entre los modelos de lenguaje. Sin embargo, languageModelId se usa para cargar un vídeo para indexar y volver a indexar una solicitud de vídeo . Las solicitudes de carga y reindexación de Video Indexer de Azure AI también hacen referencia a ella como linguisticModelId.

Eliminación de un modelo de lenguaje

Use la solicitud Delete Language Model API para eliminar un modelo de lenguaje personalizado de la cuenta especificada. Cualquier vídeo que use el modelo de lenguaje eliminado mantiene el mismo índice hasta que vuelva a indexar el vídeo. Si vuelve a indexar el vídeo, puede asignar un nuevo modelo de lenguaje al vídeo. De lo contrario, Video Indexer de Azure AI usa su modelo predeterminado para volver a indexar el vídeo.

Respuesta de ejemplo

No se devuelve contenido cuando el modelo de lenguaje se elimina correctamente.

Actualización de un modelo de lenguaje

La solicitud Update Language Model actualiza un modelo de persona de idioma personalizado en la cuenta especificada.

Nota:

Asegúrese de crear el modelo de lenguaje. Use esta llamada a: habilite o deshabilite todos los archivos del modelo, actualice el nombre del modelo de lenguaje y cargue los archivos para agregarlos al modelo de lenguaje.

Para cargar archivos para agregar al modelo de lenguaje, debe cargar archivos en el cuerpo mediante FormData. También debe proporcionar valores para los parámetros necesarios mencionados anteriormente. Para realizar la tarea, hay dos maneras:

La clave es el nombre de archivo y el valor es el archivo txt.
La clave es el nombre de archivo y el valor es una dirección URL al archivo txt.

Respuesta de ejemplo

{
    "id": "41464adf-e432-42b1-8e09-f52905d7e29d",
    "name": "TestModel",
    "language": "En-US",
    "state": "Waiting",
    "languageModelId": "531e5745-681d-4e1d-b124-12e5ab57a891",
    "files": [
    {
        "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
        "name": "RenamedFile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.5233333"
    },
    {
        "id": "9ac35b4b-1381-49c4-9fe4-8234bfdd0f50",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.68"
    }
    ]
}

Para descargar el contenido del archivo, use el id de los archivos proporcionados en la respuesta.

Actualización de un archivo desde un modelo de lenguaje

La solicitud Actualizar archivo de modelo de lenguaje actualiza el nombre y enable el estado de un archivo en un modelo de lenguaje personalizado de la cuenta especificada.

Respuesta de ejemplo

{
  "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
  "name": "RenamedFile",
  "enable": false,
  "creator": "John Doe",
  "creationTime": "2018-04-27T20:10:10.5233333"
}

Para descargar el contenido del archivo, use el id del archivo devuelto en la respuesta.

Obtención de un modelo de lenguaje específico

Realice una solicitud Get Language Model API para devolver información sobre el modelo de lenguaje especificado en la cuenta especificada, como el idioma y los archivos que se encuentran en el modelo de lenguaje.

Respuesta de ejemplo

{
    "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
    "name": "TestModel",
    "language": "En-US",
    "state": "None",
    "languageModelId": "00000000-0000-0000-0000-000000000000",
    "files": [
    {
        "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.6733333"
    },
    {
        "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
        "name": "worldfile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.86"
    }
    ]
}

Para descargar el contenido del archivo, use el id del archivo devuelto en la respuesta.

Obtención de todos los modelos de lenguaje

Use una solicitud Get Language Models API para devolver todos los modelos de lenguaje de Azure AI personalizados de la cuenta especificada en una lista.

Respuesta de ejemplo

[
    {
        "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
        "name": "TestModel",
        "language": "En-US",
        "state": "None",
        "languageModelId": "00000000-0000-0000-0000-000000000000",
        "files": [
        {
            "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
            "name": "hellofile",
            "enable": true,
            "creator": "John Doe",
            "creationTime": "2018-04-28T11:55:34.6733333"
        },
        {
            "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
            "name": "worldfile",
            "enable": true,
            "creator": "John Doe",
            "creationTime": "2018-04-28T11:55:34.86"
        }
        ]
    },
    {
        "id": "dfae5745-6f1d-4edd-b224-42e1ab57a892",
        "name": "AnotherTestModel",
        "language": "En-US",
        "state": "None",
        "languageModelId": "00000000-0000-0000-0000-000000000001",
        "files": []
    }
]

Eliminación de un archivo de un modelo de lenguaje

La solicitud Delete Language Model File elimina el archivo especificado del modelo de lenguaje de Azure AI especificado en la cuenta especificada.

Respuesta de ejemplo

No se devuelve contenido cuando el archivo se elimina del modelo de lenguaje correctamente.

Obtención de metadatos en un archivo de un modelo de lenguaje de Azure AI

La solicitud Obtener datos de archivo del modelo de lenguaje de Azure AI devuelve el contenido y los metadatos del archivo especificado del modelo de lenguaje de Azure AI elegido en la cuenta.

Respuesta de ejemplo

{
    "content": "hello\r\nworld",
    "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
    "name": "Hello",
    "enable": true,
    "creator": "John Doe",
    "creationTime": "2018-04-27T20:10:10.5233333"
}

Nota:

El contenido de este archivo de ejemplo son las palabras "hello" y "world" en dos líneas independientes.

Descarga de un archivo de un modelo de lenguaje de Azure AI

La solicitud Descargar contenido de archivo del modelo de lenguaje de Azure AI descarga un archivo de texto que contiene el contenido del archivo especificado desde el modelo de lenguaje de Azure AI en la cuenta especificada. Este archivo de texto coincide con el contenido del archivo de texto que cargó originalmente.

Respuesta de ejemplo

La respuesta es la descarga de un archivo de texto con el contenido del archivo en formato JSON.

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2025-10-08

Personalización de un modelo de lenguaje con Video Indexer de Azure AI

Optimización del modelo de lenguaje personalizado

Requisitos previos

Creación de un modelo de lenguaje

Uso de un modelo de lenguaje en un nuevo vídeo

Uso de un modelo de lenguaje para volver a indexar

Edición de un modelo de lenguaje

Cambiar el nombre del modelo de lenguaje

Incorporación de archivos

Eliminar archivos

Eliminación de un modelo de lenguaje

Personalización de modelos de lenguaje mediante la corrección de transcripciones

Comentarios

Recursos adicionales