Configuración de Amazon RDS para Oracle en una actividad de copia

En este artículo se describe cómo usar la actividad de copia en una canalización para copiar datos de Amazon RDS For Oracle.

En concreto, este conector de Amazon RDS For Oracle es compatible con:

  • Las siguientes versiones de una base de datos de Amazon RDS For Oracle:
    • Amazon RDS para Oracle 19c y versiones posteriores
    • Amazon RDS para Oracle 18c y versiones posteriores
    • Amazon RDS para Oracle 12c y versiones posteriores
    • Amazon RDS para Oracle 11g y versiones posteriores
  • Copia paralela desde una fuente de Amazon RDS For Oracle. Consulte la sección Copia en paralelo de Amazon RDS For Oracle para obtener más información.

Nota:

No se admite Amazon RDS para el servidor proxy de Oracle.

Configuración admitida

Para la configuración de cada pestaña en la actividad de copia, vaya a las secciones siguientes respectivamente.

General

Consulte las instruccionesgenerales para configurar la pestaña de parámetros General.

Fuente

Las siguientes propiedades son compatibles con Amazon RDS For Oracle en la pestaña Origen de una actividad de copia.

Captura de pantalla que muestra la pestaña de origen y la lista de propiedades.

Las siguientes propiedades son obligatorias:

  • Conexión: seleccione una conexión de Amazon RDS for Oracle en la lista de conexiones. Si no existe ninguna conexión, cree una nueva conexión de Amazon RDS For Oracle.

  • Usar consulta: seleccione Tabla o Consulta.

    • Si selecciona Tabla:

      • Tabla: seleccione la tabla de la lista desplegable o seleccione Ingresar manualmente para ingresarlo manualmente para leer los datos.
    • Si selecciona Consulta:

      • Consulta: especifique la consulta SQL personalizada para leer datos. Por ejemplo: SELECT * FROM MyTable. Tenga en cuenta que la consulta no debe terminar con un punto y coma (;).

        Si habilita la carga con particiones, deberá enlazar todos los parámetros de partición integrados correspondientes en la consulta. Para obtener ejemplos, consulte la sección Copia en paralelo desde Amazon RDS For Oracle .

        Captura de pantalla que muestra la consulta.

En Avanzado, puede especificar los campos siguientes:

  • Opción de partición: especifica las opciones de creación de particiones de datos que se usan para cargar datos de Amazon RDS For Oracle. Los valores permitidos son: Ninguno (por defecto), PhysicalPartitionsOfTable, y DynamicRange. Cuando se habilita una opción de partición (es decir, no Ninguno), el grado de paralelismo para cargar datos simultáneamente desde una base de datos de Amazon RDS For Oracle se controla mediante el grado de paralelismo de copia en la pestaña Configuración de la actividad de copia.

    Si selecciona Ninguno, decide no usar la partición.

    Si selecciona Particiones físicas de la tabla:

    • Nombres de partición: especifique la lista de particiones físicas que se deben copiar.

      Si usa una consulta para recuperar datos de origen, enlace ?AdfTabularPartitionName en la cláusula WHERE. Para obtener un ejemplo, consulte la sección Copia en paralelo de Amazon RDS for Oracle .

      Captura de pantalla que muestra la configuración al seleccionar Particiones físicas de la tabla.

    Si selecciona Rango dinámico:

    • Nombre de la columna de partición: especifique el nombre de la columna de origen de tipo entero que la partición por intervalos utilizará para la copia en paralelo. Si no se especifica, se detectará automáticamente la clave principal de la tabla y se usará como columna de partición.

      Si usa una consulta para recuperar datos de origen, enlace ?AdfRangePartitionColumnName en la cláusula WHERE. Para obtener un ejemplo, consulte la sección Copia en paralelo de Amazon RDS for Oracle .

    • Límite superior de partición: especifique el valor máximo de la columna de partición para copiar los datos.

      Si usa una consulta para recuperar datos de origen, enlace ?AdfRangePartitionUpbound en la cláusula WHERE. Para obtener un ejemplo, consulte la sección Copia en paralelo de Amazon RDS for Oracle .

    • Límite inferior de partición: especifique el valor mínimo de la columna de partición para copiar los datos.

      Si usa una consulta para recuperar datos de origen, enlace ?AdfRangePartitionLowbound en la cláusula WHERE. Para obtener un ejemplo, consulte la sección Copia en paralelo de Amazon RDS for Oracle .

      Captura de pantalla que muestra la configuración al seleccionar Intervalo dinámico.

  • Tiempo de espera de consulta (minutos): especifique el tiempo de espera para la ejecución del comando de consulta; el valor predeterminado es de 120 minutos. Si se establece un parámetro para esta propiedad, los valores permitidos son intervalos de tiempo, como "02:00:00" (120 minutos).

  • Configuración de NUMBER: especifique la precisión y la escala de NUMBER. Esto solo se aplica a los tipos NUMBER que no tienen precisión y escala definida explícitamente en la base de datos de Amazon RDS For Oracle.

    • Precisión: especifique el número máximo de dígitos decimales significativos. Los valores permitidos oscilan entre 1 y 256. El valor predeterminado es 256 si no se especifica.

    • Escala: especifique el número de dígitos después del separador decimal. Los valores permitidos oscilan entre 0 y 130 y deben ser menores o iguales que la precisión. Si no se especifica, el valor predeterminado es 130.

  • Columnas adicionales: agregue columnas de datos adicionales para almacenar la ruta de acceso relativa o el valor estático de los archivos de origen. La expresión se admite para este último.

Cartografía

Para la configuración de la pestaña Asignación, vaya a Configurar las asignaciones en la pestaña Asignación.

Asignación de tipos de datos para Amazon RDS for Oracle

Al copiar datos desde Amazon RDS For Oracle, se utilizan las siguientes asignaciones de los tipos de datos de Amazon RDS For Oracle a los tipos de datos intermedios que el servicio utiliza internamente.

Tipo de datos de Amazon RDS para Oracle Tipo de datos de servicio provisional
BFILE Byte[]
BINARY_FLOAT Soltero
BINARY_DOUBLE Double
BLOB Byte[]
CHAR String
CLOB String
DATE DateTime
FLOAT (P < 16) Double
FLOAT (P >= 16) Decimal
INTERVALO AÑO A MES Int64
INTERVALO DÍA A SEGUNDO TimeSpan
LONG String
LONG RAW Byte[]
NCHAR String
NCLOB String
NÚMERO (p,s) Int16, Int32, Int64, Double, Single, Decimal
NUMBER sin precisión ni escala Decimal
NVARCHAR2 String
RAW Byte[]
TIMESTAMP DateTime
MARCA DE TIEMPO CON ZONA HORARIA LOCAL DateTime
MARCA DE TIEMPO CON ZONA HORARIA DateTimeOffset
VARCHAR2 String
XMLTYPE String

Nota:

NUMBER(p,s) se asigna al tipo de datos de servicio intermedio adecuado según la precisión (p) y la escala (s).

Configuración

Para la configuración de la pestaña Configuración, consulte Configuración de otras opciones en la pestaña Configuración.

Copia en paralelo desde Amazon RDS For Oracle

El conector de Amazon RDS For Oracle en la actividad de copia proporciona particiones de datos integradas para copiar datos en paralelo. Puede encontrar las opciones de creación de particiones de datos en la pestaña Origen de la actividad de copia.

Al habilitar la copia con particiones, la actividad de copia ejecuta consultas paralelas en el origen de Amazon RDS For Oracle para cargar datos por particiones. El grado paralelo se controla mediante el grado de paralelismo de copia en la pestaña configuración de la actividad de copia. Por ejemplo, si establece Grado de paralelismo de copia en cuatro, el servicio genera y ejecuta simultáneamente cuatro consultas basadas en la configuración y la opción de partición especificadas, y cada consulta recupera una parte de los datos de su Amazon RDS For Oracle.

Se recomienda habilitar la copia en paralelo con la creación de particiones de datos, especialmente cuando se carga una gran cantidad de datos de Amazon RDS For Oracle. Estas son algunas configuraciones sugeridas para diferentes escenarios. Cuando se copian datos en un almacén de datos basado en archivos, se recomienda escribirlos en una carpeta como varios archivos (solo especifique el nombre de la carpeta), en cuyo caso el rendimiento es mejor que escribirlos en un único archivo.

Scenario Configuración sugerida
Carga completa de una tabla grande con particiones físicas. Opción de partición: Particiones físicas de la tabla.

Durante la ejecución, el servicio detecta automáticamente las particiones físicas y copia los datos por particiones.
Carga completa de una tabla grande, sin particiones físicas, aunque con una columna de enteros para la creación de particiones de datos. Opciones de partición: Intervalo dinámico.
Columna de partición: especifique la columna usada para crear la partición de datos. Si no se especifica, se usa la columna de clave principal.
Cargue una gran cantidad de datos mediante una consulta personalizada con particiones físicas. Opción de partición: Particiones físicas de la tabla.
Consulta: SELECT * FROM <TABLENAME> PARTITION("?AdfTabularPartitionName") WHERE <your_additional_where_clause>.
Nombrede partición: especifique los nombres de partición de los que se van a copiar los datos. Si no se especifica, el servicio detecta automáticamente las particiones físicas en la tabla especificada en el conjunto de datos de Amazon RDS For Oracle.

Durante la ejecución, el servicio reemplaza ?AdfTabularPartitionName por el nombre de partición real y envía a Amazon RDS For Oracle.
Carga de grandes cantidades de datos mediante una consulta personalizada, sin particiones físicas, aunque cuenta con una columna de enteros para la creación de particiones de datos. Opciones de partición: Intervalo dinámico.
Consulta: SELECT * FROM <TABLENAME> WHERE ?AdfRangePartitionColumnName <= ?AdfRangePartitionUpbound AND ?AdfRangePartitionColumnName >= ?AdfRangePartitionLowbound AND <your_additional_where_clause>.
Columna de partición: especifique la columna usada para crear la partición de datos. Puede crear particiones en la columna con un tipo de datos entero.
Límite superior de partición y Límite inferior de partición: especifique si desea filtrar por la columna de partición para recuperar datos solo entre el intervalo inferior y el superior.

Durante la ejecución, el servicio reemplaza ?AdfRangePartitionColumnName, ?AdfRangePartitionUpbound y ?AdfRangePartitionLowbound con los nombres de columna reales y los intervalos de valores para cada partición, y los envía a Amazon RDS for Oracle.
Por ejemplo, si establece la columna de partición "ID" con un límite inferior de 1 y un límite superior de 80, con la copia en paralelo establecida en 4, el servicio recupera los datos de 4 particiones. Los identificadores están comprendidos entre [1, 20], [21, 40], [41, 60] y [61, 80] respectivamente.

Sugerencia

Al copiar datos de una tabla sin particiones, puede usar la opción de partición "Dynamic range" (Intervalo dinámico) para crear particiones en una columna de enteros. Si los datos de origen no tienen este tipo de columna, puede aprovechar la función ORA_HASH de la consulta de origen para generar una columna y usarla como columna de partición.

Resumen de tabla

Las tablas siguientes contienen más información sobre la actividad de copia en Amazon RDS For Oracle.

Información de origen

Nombre Description Importancia Obligatorio Propiedad de script JSON
Conexión Tu conexión con el almacén de datos de origen. <su conexión Amazon RDS for Oracle> connection
Ejecutar consulta La manera de leer datos de Amazon RDS For Oracle. Aplique Table para leer datos de la tabla especificada o aplicar Query para leer datos mediante consultas. Tabla
Consulta
No /
Para Tabla
nombre de esquema Nombre del esquema. < el nombre del esquema > No schema
nombre de tabla Nombre de la tabla. < tu nombre de tabla > No table
Para consulta
Query Use la consulta SQL personalizada para leer los datos. Un ejemplo es SELECT * FROM MyTable. Tenga en cuenta que la consulta no debe terminar con un punto y coma (;).
Si habilita la carga con particiones, deberá enlazar todos los parámetros de partición integrados correspondientes en la consulta. Para obtener ejemplos, consulte la sección Copia en paralelo desde Amazon RDS For Oracle .
< Consultas SQL > No oracleReaderQuery
Nombres de partición Lista de particiones físicas que deben copiarse. Si usa una consulta para recuperar datos de origen, enlace ?AdfTabularPartitionName en la cláusula WHERE. < nombres de partición > No nombres de particiones
Nombre de columna de partición Nombre de la columna de origen en tipo entero que usará el particionado por rango para la copia en paralelo. Si no se especifica, se detectará automáticamente la clave principal de la tabla y se usará como columna de partición. < nombres de columna de partición > No partitionColumnName
Límite superior de partición Valor máximo de la columna de partición para copiar los datos fuera. Si usa una consulta para recuperar los datos de origen, inserte ?AdfRangePartitionUpbound en la cláusula WHERE. < límite superior de la partición > No límite superior de partición
Límite inferior de partición Valor mínimo de la columna de partición para copiar los datos hacia afuera. Si usa una consulta para recuperar los datos de origen, incluya ?AdfRangePartitionLowbound en la cláusula WHERE. < tu límite inferior de la partición > No partitionLowerBound
Tiempo de espera de consulta (minutos) El tiempo de espera para la ejecución del comando de consulta, el valor predeterminado es de 120 minutos. lapso de tiempo No queryTimeout
Precisión Número máximo de dígitos decimales significativos. Los valores permitidos oscilan entre 1 y 256. El valor predeterminado es 256 si no se especifica. < tu precisión > No numberPrecision
Scale Número de dígitos después del separador decimal. Los valores permitidos oscilan entre 0 y 130 y deben ser menores o iguales que la precisión. Si no se especifica, el valor predeterminado es 130. < tu escala > No numberScale
Columnas adicionales Agregue columnas de datos adicionales para almacenar la ruta de acceso relativa o el valor estático de los archivos de origen. La expresión se admite para este último. • Nombre
• Valor
No columnas adicionales:
• nombre
•valor