Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En este artículo se describe cómo usar la actividad de copia en canalizaciones para copiar datos desde y hacia Azure Cosmos DB para MongoDB.
Configuración admitida
Para la configuración de cada pestaña en la actividad de copia, vaya a las secciones siguientes respectivamente.
General
Consulte la guía de Configuración general para configurar la pantalla de configuración General.
Fuente
Vaya a la pestaña Origen para configurar el origen de la actividad de copia. Consulte el siguiente contenido para obtener la configuración detallada.
Se requieren las siguientes propiedades:
- Conexión: seleccione una conexión de Azure Cosmos DB para MongoDB en la lista de conexiones. Si no existe ninguna conexión, cree una conexión de Azure Cosmos DB para MongoDB seleccionando Más en la parte inferior de la lista de conexiones.
- Base de datos: seleccione la base de datos en la lista desplegable.
- Nombre de la colección: especifique el nombre de la colección de Azure Cosmos DB. Puede seleccionar la colección en la lista desplegable.
- Versión: la versión que especifique. Se recomienda actualizar a la versión más reciente para aprovechar las mejoras más recientes. Para obtener información sobre la diferencia entre varias versiones, vaya a esta sección.
En Avanzado, puede especificar los campos siguientes:
- Filtro: especifica el filtro de selección mediante operadores de consulta. Para devolver todos los documentos de una colección, omita este parámetro o pase un documento vacío ({}). Para más información sobre cómo consultar Azure Cosmos DB para MongoDB, consulte estos tutoriales de consulta.
-
Métodos de cursor: seleccione + Nuevo para especificar la forma en que se ejecuta la consulta subyacente. Las formas de ejecutar la consulta son:
- project: especifica los campos que se van a devolver en los documentos para la proyección. Para devolver todos los campos de los documentos coincidentes, omita este parámetro.
- sort: especifica el orden en el que la consulta devuelve documentos coincidentes. Vaya a cursor.sort() para obtener más información.
- limit: especifica el número máximo de documentos que devuelve el servidor. Vaya a cursor.limit() para obtener más información.
- skip: especifica el número de documentos que se van a omitir y desde dónde comienza MongoDB a devolver resultados. Vaya a cursor.skip() para obtener más información.
- Tamaño del lote: especifica el número de documentos que se van a devolver en cada lote de la respuesta de la instancia de MongoDB. En la mayoría de los casos, modificar el tamaño del lote no afectará al usuario ni a la aplicación. Azure Cosmos DB limita cada lote no puede superar los 40 MB de tamaño, que es la suma del número de tamaño del lote de los documentos, por lo que reduce este valor si el tamaño del documento es grande. El valor predeterminado es 100.
- Columnas adicionales: agregue columnas de datos adicionales para almacenar la ruta de acceso relativa o el valor estático de los archivos de origen. La expresión se admite para este último.
Destino
Vaya a la pestaña Destino para configurar el destino de la actividad de copia. Consulte el siguiente contenido para obtener la configuración detallada.
Se requieren las siguientes propiedades:
- Conexión: seleccione una conexión de Azure Cosmos DB para MongoDB en la lista de conexiones. Si no existe ninguna conexión, cree una conexión de Azure Cosmos DB para MongoDB seleccionando Más en la parte inferior de la lista de conexiones.
- Base de datos: seleccione la base de datos en la lista desplegable.
- Nombre de la colección: especifique el nombre de la colección de Azure Cosmos DB. Puede seleccionar la colección en la lista desplegable.
En Avanzado, puede especificar los campos siguientes:
Comportamiento de escritura: describe cómo escribir datos en Azure Cosmos DB para MongoDB. Valores permitidos: Insert y Upsert.
El comportamiento de Upsert es reemplazar el documento si ya existe un documento con el mismo
_id; de lo contrario, inserte el documento.Nota:
El servicio genera automáticamente un
_idpara un documento si no se especifica en_idel documento original o mediante la asignación de columnas. Esto significa que debe asegurarse de que, para que Upsert funcione según lo previsto, el documento tiene un identificador.Escritura del tiempo de espera por lotes: especifique el tiempo de espera para que finalice la operación de inserción por lotes antes de que se agote el tiempo de espera. El valor permitido es timespan y el valor predeterminado es 00:30:00 (30 minutos).
Escribir tamaño del lote: esta propiedad controla el tamaño de los documentos que se van a escribir en cada lote. Puede intentar aumentar el valor para mejorar el rendimiento y reducir el valor si el tamaño del documento es grande. El valor predeterminado es 10 000.
Asignación
Para la configuración de la pestaña Asignación , consulte Configuración de las asignaciones en la pestaña Asignación. No se admite la asignación cuando tanto el origen como el destino son datos jerárquicos.
Asignación de tipos de datos para Azure Cosmos DB para MongoDB
Al copiar datos desde Azure Cosmos DB para MongoDB, se usan las siguientes asignaciones de tipos de datos de Azure Cosmos DB para MongoDB en tipos de datos provisionales usados por el servicio internamente.
| Tipo de datos de Azure Cosmos DB para MongoDB | Tipo de datos de servicio provisional (para la versión 1.1) | Tipo de datos de servicio provisional (para la versión 1.0) |
|---|---|---|
| Fecha | DateTime | Int64 |
| ObjectId | String | String |
| Decimal128 | String | String |
| Timestamp | Los 32 bits más significativos:> DateTime Los 32 bits menos significativos:> Int64 |
Los 32 bits más significativos :> Int64 Los 32 bits menos significativos:> Int64 |
| String | String | String |
| Double | Double | Double |
| Int32 | Int64 | Int64 |
| Int64 | Int64 | Int64 |
| Boolean | Boolean | Boolean |
| Null | Null | Null |
| JavaScript | String | String |
| Expresión regular | String | String |
| Tecla mínima | String | Int64 |
| Tecla máxima | String | Int64 |
| Binary | GUID (cuando SubType es "04" ) String |
String |
Configuración
Para la configuración de la pestañaConfiguración, vaya a Configurar los otros parámetros en la ficha Configuración .
Diferencias entre las versiones de Azure Cosmos DB para MongoDB
En la tabla siguiente se muestran las diferencias de características entre varias versiones.
| Versión 1.1 | Versión 1.0 |
|---|---|
| Las siguientes asignaciones se usan de los tipos de datos de Azure Cosmos DB para MongoDB para los tipos de datos provisionales de servicio. Fecha:> DateTime TimeStamp (los 32 bits más significativos):> DateTime Clave mínima:> cadena Clave máxima:> cadena Binario:> GUID (cuando SubType es "04") / String |
Las siguientes asignaciones se usan de los tipos de datos de Azure Cosmos DB para MongoDB para los tipos de datos provisionales de servicio. Fecha:> Int64 TimeStamp (los 32 bits más significativos):> Int64 Tecla mínima:> Int64 Tecla máxima:> Int64 Binario:> cadena |
Resumen de tabla
La tabla siguiente contiene más información sobre la actividad de copia en Azure Cosmos DB para MongoDB.
Información de origen
| Nombre | Description | Importancia | Obligatorio | Propiedad de script JSON |
|---|---|---|---|---|
| Connection | La conexión al almacén de datos de origen. | < conexión de Azure Cosmos DB para MongoDB > | Sí | connection |
| Base de datos | La base de datos que usa como origen. | < su base de datos > | Sí | base de datos |
| Nombre de la colección | Nombre de la colección de Azure Cosmos DB. | < la colección > | Sí | colección |
| Versión | Versión que especifique. | • 1.1 • 1.0 |
Sí | Versión: • 1.1 • 1.0 |
| Filter | Filtro de selección mediante operadores de consulta. Para devolver todos los documentos de una colección, omita este parámetro o pase un documento vacío ({}). | < filtro de selección > | No | filtrar |
| Métodos de cursor | La forma en que se ejecuta la consulta subyacente. | • proyecto • ordenar • límite • omitir |
No | cursorMethods: •proyecto •ordenar •límite •saltarse |
| Tamaño del lote | Número de documentos que se van a devolver en cada lote de la respuesta de la instancia de MongoDB. En la mayoría de los casos, modificar el tamaño del lote no afectará al usuario ni a la aplicación. Azure Cosmos DB limita cada lote no puede superar los 40 MB de tamaño, que es la suma del número de tamaño del lote de los documentos, por lo que reduce este valor si el tamaño del documento es grande. |
< el tamaño del lote de escritura > (el valor predeterminado es 100) |
No | batchSize |
| Columnas adicionales | Agregue columnas de datos adicionales para almacenar la ruta de acceso relativa o el valor estático de los archivos de origen. La expresión se admite para este último. | • Nombre • Valor |
No | additionalColumns: •nombre •valor |
Información de destino
| Nombre | Description | Importancia | Obligatorio | Propiedad de script JSON |
|---|---|---|---|---|
| Connection | La conexión al almacén de datos de destino. | < conexión de Azure Cosmos DB para MongoDB > | Sí | connection |
| Base de datos | La base de datos que se usa como destino. | < su base de datos > | Sí | base de datos |
| Nombre de la colección | Nombre de la colección de Azure Cosmos DB. | < la colección > | Sí | colección |
| Comportamiento de escritura | Describe cómo escribir datos en Azure Cosmos DB para MongoDB. Valores permitidos: Insert y Upsert. El comportamiento de Upsert es reemplazar el documento si ya existe un documento con el mismo _id ; de lo contrario, inserte el documento.Nota: El servicio genera automáticamente un _id para un documento si no se especifica en _id el documento original o mediante la asignación de columnas. Esto significa que debe asegurarse de que, para que Upsert funcione según lo previsto, el documento tiene un identificador. |
• Insertar (valor predeterminado) • Upsert |
No | writeBehavior: •insertar • Actualizar o Insertar |
| Tiempo de espera de escritura por lotes | Tiempo de espera para que finalice la operación de inserción por lotes antes de que se agote el tiempo de espera. | timespan (el valor predeterminado es 00:30:00 - 30 minutos) |
No | writeBatchTimeout |
| Escribir tamaño de lote | Controla el tamaño de los documentos que se van a escribir en cada lote. Puede intentar aumentar este valor para mejorar el rendimiento y reducir el valor si el tamaño del documento es grande. |
< el tamaño del lote de escritura > (el valor predeterminado es 10 000) |
No | writeBatchSize |