Configuración de Azure Cosmos DB para MongoDB en una actividad de copia

En este artículo se describe cómo usar la actividad de copia en canalizaciones para copiar datos desde y hacia Azure Cosmos DB para MongoDB.

Configuración admitida

Para la configuración de cada pestaña en la actividad de copia, vaya a las secciones siguientes respectivamente.

General

Consulte la guía de Configuración general para configurar la pantalla de configuración General.

Fuente

Vaya a la pestaña Origen para configurar el origen de la actividad de copia. Consulte el siguiente contenido para obtener la configuración detallada.

Captura de pantalla que muestra la pestaña de origen y la lista de propiedades.

Se requieren las siguientes propiedades:

  • Conexión: seleccione una conexión de Azure Cosmos DB para MongoDB en la lista de conexiones. Si no existe ninguna conexión, cree una conexión de Azure Cosmos DB para MongoDB seleccionando Más en la parte inferior de la lista de conexiones.
  • Base de datos: seleccione la base de datos en la lista desplegable.
  • Nombre de la colección: especifique el nombre de la colección de Azure Cosmos DB. Puede seleccionar la colección en la lista desplegable.
  • Versión: la versión que especifique. Se recomienda actualizar a la versión más reciente para aprovechar las mejoras más recientes. Para obtener información sobre la diferencia entre varias versiones, vaya a esta sección.

En Avanzado, puede especificar los campos siguientes:

  • Filtro: especifica el filtro de selección mediante operadores de consulta. Para devolver todos los documentos de una colección, omita este parámetro o pase un documento vacío ({}). Para más información sobre cómo consultar Azure Cosmos DB para MongoDB, consulte estos tutoriales de consulta.
  • Métodos de cursor: seleccione + Nuevo para especificar la forma en que se ejecuta la consulta subyacente. Las formas de ejecutar la consulta son:
    • project: especifica los campos que se van a devolver en los documentos para la proyección. Para devolver todos los campos de los documentos coincidentes, omita este parámetro.
    • sort: especifica el orden en el que la consulta devuelve documentos coincidentes. Vaya a cursor.sort() para obtener más información.
    • limit: especifica el número máximo de documentos que devuelve el servidor. Vaya a cursor.limit() para obtener más información.
    • skip: especifica el número de documentos que se van a omitir y desde dónde comienza MongoDB a devolver resultados. Vaya a cursor.skip() para obtener más información.
  • Tamaño del lote: especifica el número de documentos que se van a devolver en cada lote de la respuesta de la instancia de MongoDB. En la mayoría de los casos, modificar el tamaño del lote no afectará al usuario ni a la aplicación. Azure Cosmos DB limita cada lote no puede superar los 40 MB de tamaño, que es la suma del número de tamaño del lote de los documentos, por lo que reduce este valor si el tamaño del documento es grande. El valor predeterminado es 100.
  • Columnas adicionales: agregue columnas de datos adicionales para almacenar la ruta de acceso relativa o el valor estático de los archivos de origen. La expresión se admite para este último.

Destino

Vaya a la pestaña Destino para configurar el destino de la actividad de copia. Consulte el siguiente contenido para obtener la configuración detallada.

Captura de pantalla que muestra la pestaña de destino y la lista de propiedades.

Se requieren las siguientes propiedades:

  • Conexión: seleccione una conexión de Azure Cosmos DB para MongoDB en la lista de conexiones. Si no existe ninguna conexión, cree una conexión de Azure Cosmos DB para MongoDB seleccionando Más en la parte inferior de la lista de conexiones.
  • Base de datos: seleccione la base de datos en la lista desplegable.
  • Nombre de la colección: especifique el nombre de la colección de Azure Cosmos DB. Puede seleccionar la colección en la lista desplegable.

En Avanzado, puede especificar los campos siguientes:

  • Comportamiento de escritura: describe cómo escribir datos en Azure Cosmos DB para MongoDB. Valores permitidos: Insert y Upsert.

    El comportamiento de Upsert es reemplazar el documento si ya existe un documento con el mismo _id ; de lo contrario, inserte el documento.

    Nota:

    El servicio genera automáticamente un _id para un documento si no se especifica en _id el documento original o mediante la asignación de columnas. Esto significa que debe asegurarse de que, para que Upsert funcione según lo previsto, el documento tiene un identificador.

  • Escritura del tiempo de espera por lotes: especifique el tiempo de espera para que finalice la operación de inserción por lotes antes de que se agote el tiempo de espera. El valor permitido es timespan y el valor predeterminado es 00:30:00 (30 minutos).

  • Escribir tamaño del lote: esta propiedad controla el tamaño de los documentos que se van a escribir en cada lote. Puede intentar aumentar el valor para mejorar el rendimiento y reducir el valor si el tamaño del documento es grande. El valor predeterminado es 10 000.

Asignación

Para la configuración de la pestaña Asignación , consulte Configuración de las asignaciones en la pestaña Asignación. No se admite la asignación cuando tanto el origen como el destino son datos jerárquicos.

Asignación de tipos de datos para Azure Cosmos DB para MongoDB

Al copiar datos desde Azure Cosmos DB para MongoDB, se usan las siguientes asignaciones de tipos de datos de Azure Cosmos DB para MongoDB en tipos de datos provisionales usados por el servicio internamente.

Tipo de datos de Azure Cosmos DB para MongoDB Tipo de datos de servicio provisional (para la versión 1.1) Tipo de datos de servicio provisional (para la versión 1.0)
Fecha DateTime Int64
ObjectId String String
Decimal128 String String
Timestamp Los 32 bits más significativos:> DateTime
Los 32 bits menos significativos:> Int64
Los 32 bits más significativos :> Int64
Los 32 bits menos significativos:> Int64
String String String
Double Double Double
Int32 Int64 Int64
Int64 Int64 Int64
Boolean Boolean Boolean
Null Null Null
JavaScript String String
Expresión regular String String
Tecla mínima String Int64
Tecla máxima String Int64
Binary GUID (cuando SubType es "04" )
String
String

Configuración

Para la configuración de la pestañaConfiguración, vaya a Configurar los otros parámetros en la ficha Configuración .

Diferencias entre las versiones de Azure Cosmos DB para MongoDB

En la tabla siguiente se muestran las diferencias de características entre varias versiones.

Versión 1.1 Versión 1.0
Las siguientes asignaciones se usan de los tipos de datos de Azure Cosmos DB para MongoDB para los tipos de datos provisionales de servicio.

Fecha:> DateTime
TimeStamp (los 32 bits más significativos):> DateTime
Clave mínima:> cadena
Clave máxima:> cadena
Binario:> GUID (cuando SubType es "04") / String
Las siguientes asignaciones se usan de los tipos de datos de Azure Cosmos DB para MongoDB para los tipos de datos provisionales de servicio.

Fecha:> Int64
TimeStamp (los 32 bits más significativos):> Int64
Tecla mínima:> Int64
Tecla máxima:> Int64
Binario:> cadena

Resumen de tabla

La tabla siguiente contiene más información sobre la actividad de copia en Azure Cosmos DB para MongoDB.

Información de origen

Nombre Description Importancia Obligatorio Propiedad de script JSON
Connection La conexión al almacén de datos de origen. < conexión de Azure Cosmos DB para MongoDB > connection
Base de datos La base de datos que usa como origen. < su base de datos > base de datos
Nombre de la colección Nombre de la colección de Azure Cosmos DB. < la colección > colección
Versión Versión que especifique. • 1.1
• 1.0
Versión:
• 1.1
• 1.0
Filter Filtro de selección mediante operadores de consulta. Para devolver todos los documentos de una colección, omita este parámetro o pase un documento vacío ({}). < filtro de selección > No filtrar
Métodos de cursor La forma en que se ejecuta la consulta subyacente. proyecto
ordenar
límite
omitir
No cursorMethods:
•proyecto
•ordenar
•límite
•saltarse
Tamaño del lote Número de documentos que se van a devolver en cada lote de la respuesta de la instancia de MongoDB. En la mayoría de los casos, modificar el tamaño del lote no afectará al usuario ni a la aplicación. Azure Cosmos DB limita cada lote no puede superar los 40 MB de tamaño, que es la suma del número de tamaño del lote de los documentos, por lo que reduce este valor si el tamaño del documento es grande. < el tamaño del lote de escritura >
(el valor predeterminado es 100)
No batchSize
Columnas adicionales Agregue columnas de datos adicionales para almacenar la ruta de acceso relativa o el valor estático de los archivos de origen. La expresión se admite para este último. • Nombre
• Valor
No additionalColumns:
•nombre
•valor

Información de destino

Nombre Description Importancia Obligatorio Propiedad de script JSON
Connection La conexión al almacén de datos de destino. < conexión de Azure Cosmos DB para MongoDB > connection
Base de datos La base de datos que se usa como destino. < su base de datos > base de datos
Nombre de la colección Nombre de la colección de Azure Cosmos DB. < la colección > colección
Comportamiento de escritura Describe cómo escribir datos en Azure Cosmos DB para MongoDB. Valores permitidos: Insert y Upsert.

El comportamiento de Upsert es reemplazar el documento si ya existe un documento con el mismo _id ; de lo contrario, inserte el documento.

Nota: El servicio genera automáticamente un _id para un documento si no se especifica en _id el documento original o mediante la asignación de columnas. Esto significa que debe asegurarse de que, para que Upsert funcione según lo previsto, el documento tiene un identificador.
Insertar (valor predeterminado)
Upsert
No writeBehavior:
•insertar
• Actualizar o Insertar
Tiempo de espera de escritura por lotes Tiempo de espera para que finalice la operación de inserción por lotes antes de que se agote el tiempo de espera. timespan
(el valor predeterminado es 00:30:00 - 30 minutos)
No writeBatchTimeout
Escribir tamaño de lote Controla el tamaño de los documentos que se van a escribir en cada lote. Puede intentar aumentar este valor para mejorar el rendimiento y reducir el valor si el tamaño del documento es grande. < el tamaño del lote de escritura >
(el valor predeterminado es 10 000)
No writeBatchSize