Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En este artículo se describe cómo usar la actividad de copia en una canalización para copiar datos de Amazon RDS For Oracle.
En concreto, este conector de Amazon RDS For Oracle es compatible con:
- Las siguientes versiones de una base de datos de Amazon RDS For Oracle:
- Amazon RDS para Oracle 19c y versiones posteriores
- Amazon RDS para Oracle 18c y versiones posteriores
- Amazon RDS para Oracle 12c y versiones posteriores
- Amazon RDS para Oracle 11g y versiones posteriores
- Copia paralela desde una fuente de Amazon RDS For Oracle. Consulte la sección Copia en paralelo de Amazon RDS For Oracle para obtener más información.
Nota:
No se admite Amazon RDS para el servidor proxy de Oracle.
Configuración admitida
Para la configuración de cada pestaña en la actividad de copia, vaya a las secciones siguientes respectivamente.
General
Consulte las instruccionesgenerales para configurar la pestaña de parámetros General.
Fuente
Las siguientes propiedades son compatibles con Amazon RDS For Oracle en la pestaña Origen de una actividad de copia.
Las siguientes propiedades son obligatorias:
Conexión: seleccione una conexión de Amazon RDS for Oracle en la lista de conexiones. Si no existe ninguna conexión, cree una nueva conexión de Amazon RDS For Oracle.
Usar consulta: seleccione Tabla o Consulta.
Si selecciona Tabla:
- Tabla: seleccione la tabla de la lista desplegable o seleccione Ingresar manualmente para ingresarlo manualmente para leer los datos.
Si selecciona Consulta:
Consulta: especifique la consulta SQL personalizada para leer datos. Por ejemplo:
SELECT * FROM MyTable. Tenga en cuenta que la consulta no debe terminar con un punto y coma (;).Si habilita la carga con particiones, deberá enlazar todos los parámetros de partición integrados correspondientes en la consulta. Para obtener ejemplos, consulte la sección Copia en paralelo desde Amazon RDS For Oracle .
En Avanzado, puede especificar los campos siguientes:
Opción de partición: especifica las opciones de creación de particiones de datos que se usan para cargar datos de Amazon RDS For Oracle. Los valores permitidos son: Ninguno (por defecto), PhysicalPartitionsOfTable, y DynamicRange. Cuando se habilita una opción de partición (es decir, no Ninguno), el grado de paralelismo para cargar datos simultáneamente desde una base de datos de Amazon RDS For Oracle se controla mediante el grado de paralelismo de copia en la pestaña Configuración de la actividad de copia.
Si selecciona Ninguno, decide no usar la partición.
Si selecciona Particiones físicas de la tabla:
Nombres de partición: especifique la lista de particiones físicas que se deben copiar.
Si usa una consulta para recuperar datos de origen, enlace
?AdfTabularPartitionNameen la cláusula WHERE. Para obtener un ejemplo, consulte la sección Copia en paralelo de Amazon RDS for Oracle .
Si selecciona Rango dinámico:
Nombre de la columna de partición: especifique el nombre de la columna de origen de tipo entero que la partición por intervalos utilizará para la copia en paralelo. Si no se especifica, se detectará automáticamente la clave principal de la tabla y se usará como columna de partición.
Si usa una consulta para recuperar datos de origen, enlace
?AdfRangePartitionColumnNameen la cláusula WHERE. Para obtener un ejemplo, consulte la sección Copia en paralelo de Amazon RDS for Oracle .Límite superior de partición: especifique el valor máximo de la columna de partición para copiar los datos.
Si usa una consulta para recuperar datos de origen, enlace
?AdfRangePartitionUpbounden la cláusula WHERE. Para obtener un ejemplo, consulte la sección Copia en paralelo de Amazon RDS for Oracle .Límite inferior de partición: especifique el valor mínimo de la columna de partición para copiar los datos.
Si usa una consulta para recuperar datos de origen, enlace
?AdfRangePartitionLowbounden la cláusula WHERE. Para obtener un ejemplo, consulte la sección Copia en paralelo de Amazon RDS for Oracle .
Tiempo de espera de consulta (minutos): especifique el tiempo de espera para la ejecución del comando de consulta; el valor predeterminado es de 120 minutos. Si se establece un parámetro para esta propiedad, los valores permitidos son intervalos de tiempo, como "02:00:00" (120 minutos).
Configuración de NUMBER: especifique la precisión y la escala de NUMBER. Esto solo se aplica a los tipos NUMBER que no tienen precisión y escala definida explícitamente en la base de datos de Amazon RDS For Oracle.
Precisión: especifique el número máximo de dígitos decimales significativos. Los valores permitidos oscilan entre 1 y 256. El valor predeterminado es 256 si no se especifica.
Escala: especifique el número de dígitos después del separador decimal. Los valores permitidos oscilan entre 0 y 130 y deben ser menores o iguales que la precisión. Si no se especifica, el valor predeterminado es 130.
Columnas adicionales: agregue columnas de datos adicionales para almacenar la ruta de acceso relativa o el valor estático de los archivos de origen. La expresión se admite para este último.
Cartografía
Para la configuración de la pestaña Asignación, vaya a Configurar las asignaciones en la pestaña Asignación.
Asignación de tipos de datos para Amazon RDS for Oracle
Al copiar datos desde Amazon RDS For Oracle, se utilizan las siguientes asignaciones de los tipos de datos de Amazon RDS For Oracle a los tipos de datos intermedios que el servicio utiliza internamente.
| Tipo de datos de Amazon RDS para Oracle | Tipo de datos de servicio provisional |
|---|---|
| BFILE | Byte[] |
| BINARY_FLOAT | Soltero |
| BINARY_DOUBLE | Double |
| BLOB | Byte[] |
| CHAR | String |
| CLOB | String |
| DATE | DateTime |
| FLOAT (P < 16) | Double |
| FLOAT (P >= 16) | Decimal |
| INTERVALO AÑO A MES | Int64 |
| INTERVALO DÍA A SEGUNDO | TimeSpan |
| LONG | String |
| LONG RAW | Byte[] |
| NCHAR | String |
| NCLOB | String |
| NÚMERO (p,s) | Int16, Int32, Int64, Double, Single, Decimal |
| NUMBER sin precisión ni escala | Decimal |
| NVARCHAR2 | String |
| RAW | Byte[] |
| TIMESTAMP | DateTime |
| MARCA DE TIEMPO CON ZONA HORARIA LOCAL | DateTime |
| MARCA DE TIEMPO CON ZONA HORARIA | DateTimeOffset |
| VARCHAR2 | String |
| XMLTYPE | String |
Nota:
NUMBER(p,s) se asigna al tipo de datos de servicio intermedio adecuado según la precisión (p) y la escala (s).
Configuración
Para la configuración de la pestaña Configuración, consulte Configuración de otras opciones en la pestaña Configuración.
Copia en paralelo desde Amazon RDS For Oracle
El conector de Amazon RDS For Oracle en la actividad de copia proporciona particiones de datos integradas para copiar datos en paralelo. Puede encontrar las opciones de creación de particiones de datos en la pestaña Origen de la actividad de copia.
Al habilitar la copia con particiones, la actividad de copia ejecuta consultas paralelas en el origen de Amazon RDS For Oracle para cargar datos por particiones. El grado paralelo se controla mediante el grado de paralelismo de copia en la pestaña configuración de la actividad de copia. Por ejemplo, si establece Grado de paralelismo de copia en cuatro, el servicio genera y ejecuta simultáneamente cuatro consultas basadas en la configuración y la opción de partición especificadas, y cada consulta recupera una parte de los datos de su Amazon RDS For Oracle.
Se recomienda habilitar la copia en paralelo con la creación de particiones de datos, especialmente cuando se carga una gran cantidad de datos de Amazon RDS For Oracle. Estas son algunas configuraciones sugeridas para diferentes escenarios. Cuando se copian datos en un almacén de datos basado en archivos, se recomienda escribirlos en una carpeta como varios archivos (solo especifique el nombre de la carpeta), en cuyo caso el rendimiento es mejor que escribirlos en un único archivo.
| Scenario | Configuración sugerida |
|---|---|
| Carga completa de una tabla grande con particiones físicas. |
Opción de partición: Particiones físicas de la tabla. Durante la ejecución, el servicio detecta automáticamente las particiones físicas y copia los datos por particiones. |
| Carga completa de una tabla grande, sin particiones físicas, aunque con una columna de enteros para la creación de particiones de datos. |
Opciones de partición: Intervalo dinámico. Columna de partición: especifique la columna usada para crear la partición de datos. Si no se especifica, se usa la columna de clave principal. |
| Cargue una gran cantidad de datos mediante una consulta personalizada con particiones físicas. |
Opción de partición: Particiones físicas de la tabla. Consulta: SELECT * FROM <TABLENAME> PARTITION("?AdfTabularPartitionName") WHERE <your_additional_where_clause>.Nombrede partición: especifique los nombres de partición de los que se van a copiar los datos. Si no se especifica, el servicio detecta automáticamente las particiones físicas en la tabla especificada en el conjunto de datos de Amazon RDS For Oracle. Durante la ejecución, el servicio reemplaza ?AdfTabularPartitionName por el nombre de partición real y envía a Amazon RDS For Oracle. |
| Carga de grandes cantidades de datos mediante una consulta personalizada, sin particiones físicas, aunque cuenta con una columna de enteros para la creación de particiones de datos. |
Opciones de partición: Intervalo dinámico. Consulta: SELECT * FROM <TABLENAME> WHERE ?AdfRangePartitionColumnName <= ?AdfRangePartitionUpbound AND ?AdfRangePartitionColumnName >= ?AdfRangePartitionLowbound AND <your_additional_where_clause>.Columna de partición: especifique la columna usada para crear la partición de datos. Puede crear particiones en la columna con un tipo de datos entero. Límite superior de partición y Límite inferior de partición: especifique si desea filtrar por la columna de partición para recuperar datos solo entre el intervalo inferior y el superior. Durante la ejecución, el servicio reemplaza ?AdfRangePartitionColumnName, ?AdfRangePartitionUpbound y ?AdfRangePartitionLowbound con los nombres de columna reales y los intervalos de valores para cada partición, y los envía a Amazon RDS for Oracle. Por ejemplo, si establece la columna de partición "ID" con un límite inferior de 1 y un límite superior de 80, con la copia en paralelo establecida en 4, el servicio recupera los datos de 4 particiones. Los identificadores están comprendidos entre [1, 20], [21, 40], [41, 60] y [61, 80] respectivamente. |
Sugerencia
Al copiar datos de una tabla sin particiones, puede usar la opción de partición "Dynamic range" (Intervalo dinámico) para crear particiones en una columna de enteros. Si los datos de origen no tienen este tipo de columna, puede aprovechar la función ORA_HASH de la consulta de origen para generar una columna y usarla como columna de partición.
Resumen de tabla
Las tablas siguientes contienen más información sobre la actividad de copia en Amazon RDS For Oracle.
Información de origen
| Nombre | Description | Importancia | Obligatorio | Propiedad de script JSON |
|---|---|---|---|---|
| Conexión | Tu conexión con el almacén de datos de origen. | <su conexión Amazon RDS for Oracle> | Sí | connection |
| Ejecutar consulta | La manera de leer datos de Amazon RDS For Oracle. Aplique Table para leer datos de la tabla especificada o aplicar Query para leer datos mediante consultas. | • Tabla • Consulta |
No | / |
| Para Tabla | ||||
| nombre de esquema | Nombre del esquema. | < el nombre del esquema > | No | schema |
| nombre de tabla | Nombre de la tabla. | < tu nombre de tabla > | No | table |
| Para consulta | ||||
| Query | Use la consulta SQL personalizada para leer los datos. Un ejemplo es SELECT * FROM MyTable. Tenga en cuenta que la consulta no debe terminar con un punto y coma (;). Si habilita la carga con particiones, deberá enlazar todos los parámetros de partición integrados correspondientes en la consulta. Para obtener ejemplos, consulte la sección Copia en paralelo desde Amazon RDS For Oracle . |
< Consultas SQL > | No | oracleReaderQuery |
| Nombres de partición | Lista de particiones físicas que deben copiarse. Si usa una consulta para recuperar datos de origen, enlace ?AdfTabularPartitionName en la cláusula WHERE. |
< nombres de partición > | No | nombres de particiones |
| Nombre de columna de partición | Nombre de la columna de origen en tipo entero que usará el particionado por rango para la copia en paralelo. Si no se especifica, se detectará automáticamente la clave principal de la tabla y se usará como columna de partición. | < nombres de columna de partición > | No | partitionColumnName |
| Límite superior de partición | Valor máximo de la columna de partición para copiar los datos fuera. Si usa una consulta para recuperar los datos de origen, inserte ?AdfRangePartitionUpbound en la cláusula WHERE. |
< límite superior de la partición > | No | límite superior de partición |
| Límite inferior de partición | Valor mínimo de la columna de partición para copiar los datos hacia afuera. Si usa una consulta para recuperar los datos de origen, incluya ?AdfRangePartitionLowbound en la cláusula WHERE. |
< tu límite inferior de la partición > | No | partitionLowerBound |
| Tiempo de espera de consulta (minutos) | El tiempo de espera para la ejecución del comando de consulta, el valor predeterminado es de 120 minutos. | lapso de tiempo | No | queryTimeout |
| Precisión | Número máximo de dígitos decimales significativos. Los valores permitidos oscilan entre 1 y 256. El valor predeterminado es 256 si no se especifica. | < tu precisión > | No | numberPrecision |
| Scale | Número de dígitos después del separador decimal. Los valores permitidos oscilan entre 0 y 130 y deben ser menores o iguales que la precisión. Si no se especifica, el valor predeterminado es 130. | < tu escala > | No | numberScale |
| Columnas adicionales | Agregue columnas de datos adicionales para almacenar la ruta de acceso relativa o el valor estático de los archivos de origen. La expresión se admite para este último. | • Nombre • Valor |
No | columnas adicionales: • nombre •valor |