Configuración de Amazon RDS para Oracle en una actividad de copia

En este artículo se describe cómo usar la actividad de copia en una canalización para copiar datos de Amazon RDS For Oracle.

En concreto, este conector de Amazon RDS For Oracle es compatible con:

Las siguientes versiones de una base de datos de Amazon RDS For Oracle:
- Amazon RDS para Oracle 19c y versiones posteriores
- Amazon RDS para Oracle 18c y versiones posteriores
- Amazon RDS para Oracle 12c y versiones posteriores
- Amazon RDS para Oracle 11g y versiones posteriores
Copia paralela desde una fuente de Amazon RDS For Oracle. Consulte la sección Copia en paralelo de Amazon RDS For Oracle para obtener más información.

Nota:

No se admite Amazon RDS para el servidor proxy de Oracle.

Configuración admitida

Para la configuración de cada pestaña en la actividad de copia, vaya a las secciones siguientes respectivamente.

General
Fuente
Cartografía
Settings

General

Consulte las instruccionesgenerales para configurar la pestaña de parámetros General.

Fuente

Las siguientes propiedades son compatibles con Amazon RDS For Oracle en la pestaña Origen de una actividad de copia.

Las siguientes propiedades son obligatorias:

Conexión: seleccione una conexión de Amazon RDS for Oracle en la lista de conexiones. Si no existe ninguna conexión, cree una nueva conexión de Amazon RDS For Oracle.
Usar consulta: seleccione Tabla o Consulta.
- Si selecciona Tabla:
  - Tabla: seleccione la tabla de la lista desplegable o seleccione Ingresar manualmente para ingresarlo manualmente para leer los datos.
- Si selecciona Consulta:
  - Consulta: especifique la consulta SQL personalizada para leer datos. Por ejemplo: SELECT * FROM MyTable. Tenga en cuenta que la consulta no debe terminar con un punto y coma (;).
    
    Si habilita la carga con particiones, deberá enlazar todos los parámetros de partición integrados correspondientes en la consulta. Para obtener ejemplos, consulte la sección Copia en paralelo desde Amazon RDS For Oracle .

En Avanzado, puede especificar los campos siguientes:

Opción de partición: especifica las opciones de creación de particiones de datos que se usan para cargar datos de Amazon RDS For Oracle. Los valores permitidos son: Ninguno (por defecto), PhysicalPartitionsOfTable, y DynamicRange. Cuando se habilita una opción de partición (es decir, no Ninguno), el grado de paralelismo para cargar datos simultáneamente desde una base de datos de Amazon RDS For Oracle se controla mediante el grado de paralelismo de copia en la pestaña Configuración de la actividad de copia.

Si selecciona Ninguno, decide no usar la partición.

Si selecciona Particiones físicas de la tabla:
- Nombres de partición: especifique la lista de particiones físicas que se deben copiar.
  
  Si usa una consulta para recuperar datos de origen, enlace ?AdfTabularPartitionName en la cláusula WHERE. Para obtener un ejemplo, consulte la sección Copia en paralelo de Amazon RDS for Oracle .
Si selecciona Rango dinámico:
- Nombre de la columna de partición: especifique el nombre de la columna de origen de tipo entero que la partición por intervalos utilizará para la copia en paralelo. Si no se especifica, se detectará automáticamente la clave principal de la tabla y se usará como columna de partición.
  
  Si usa una consulta para recuperar datos de origen, enlace ?AdfRangePartitionColumnName en la cláusula WHERE. Para obtener un ejemplo, consulte la sección Copia en paralelo de Amazon RDS for Oracle .
- Límite superior de partición: especifique el valor máximo de la columna de partición para copiar los datos.
  
  Si usa una consulta para recuperar datos de origen, enlace ?AdfRangePartitionUpbound en la cláusula WHERE. Para obtener un ejemplo, consulte la sección Copia en paralelo de Amazon RDS for Oracle .
- Límite inferior de partición: especifique el valor mínimo de la columna de partición para copiar los datos.
  
  Si usa una consulta para recuperar datos de origen, enlace ?AdfRangePartitionLowbound en la cláusula WHERE. Para obtener un ejemplo, consulte la sección Copia en paralelo de Amazon RDS for Oracle .
Tiempo de espera de consulta (minutos): especifique el tiempo de espera para la ejecución del comando de consulta; el valor predeterminado es de 120 minutos. Si se establece un parámetro para esta propiedad, los valores permitidos son intervalos de tiempo, como "02:00:00" (120 minutos).
Configuración de NUMBER: especifique la precisión y la escala de NUMBER. Esto solo se aplica a los tipos NUMBER que no tienen precisión y escala definida explícitamente en la base de datos de Amazon RDS For Oracle.
- Precisión: especifique el número máximo de dígitos decimales significativos. Los valores permitidos oscilan entre 1 y 256. El valor predeterminado es 256 si no se especifica.
- Escala: especifique el número de dígitos después del separador decimal. Los valores permitidos oscilan entre 0 y 130 y deben ser menores o iguales que la precisión. Si no se especifica, el valor predeterminado es 130.
Columnas adicionales: agregue columnas de datos adicionales para almacenar la ruta de acceso relativa o el valor estático de los archivos de origen. La expresión se admite para este último.

Cartografía

Para la configuración de la pestaña Asignación, vaya a Configurar las asignaciones en la pestaña Asignación.

Asignación de tipos de datos para Amazon RDS for Oracle

Al copiar datos desde Amazon RDS For Oracle, se utilizan las siguientes asignaciones de los tipos de datos de Amazon RDS For Oracle a los tipos de datos intermedios que el servicio utiliza internamente.

Tipo de datos de Amazon RDS para Oracle	Tipo de datos de servicio provisional
BFILE	Byte[]
BINARY_FLOAT	Soltero
BINARY_DOUBLE	Double
BLOB	Byte[]
CHAR	String
CLOB	String
DATE	DateTime
FLOAT (P < 16)	Double
FLOAT (P >= 16)	Decimal
INTERVALO AÑO A MES	Int64
INTERVALO DÍA A SEGUNDO	TimeSpan
LONG	String
LONG RAW	Byte[]
NCHAR	String
NCLOB	String
NÚMERO (p,s)	Int16, Int32, Int64, Double, Single, Decimal
NUMBER sin precisión ni escala	Decimal
NVARCHAR2	String
RAW	Byte[]
TIMESTAMP	DateTime
MARCA DE TIEMPO CON ZONA HORARIA LOCAL	DateTime
MARCA DE TIEMPO CON ZONA HORARIA	DateTimeOffset
VARCHAR2	String
XMLTYPE	String

Nota:

NUMBER(p,s) se asigna al tipo de datos de servicio intermedio adecuado según la precisión (p) y la escala (s).

Configuración

Para la configuración de la pestaña Configuración, consulte Configuración de otras opciones en la pestaña Configuración.

Copia en paralelo desde Amazon RDS For Oracle

El conector de Amazon RDS For Oracle en la actividad de copia proporciona particiones de datos integradas para copiar datos en paralelo. Puede encontrar las opciones de creación de particiones de datos en la pestaña Origen de la actividad de copia.

Al habilitar la copia con particiones, la actividad de copia ejecuta consultas paralelas en el origen de Amazon RDS For Oracle para cargar datos por particiones. El grado paralelo se controla mediante el grado de paralelismo de copia en la pestaña configuración de la actividad de copia. Por ejemplo, si establece Grado de paralelismo de copia en cuatro, el servicio genera y ejecuta simultáneamente cuatro consultas basadas en la configuración y la opción de partición especificadas, y cada consulta recupera una parte de los datos de su Amazon RDS For Oracle.

Se recomienda habilitar la copia en paralelo con la creación de particiones de datos, especialmente cuando se carga una gran cantidad de datos de Amazon RDS For Oracle. Estas son algunas configuraciones sugeridas para diferentes escenarios. Cuando se copian datos en un almacén de datos basado en archivos, se recomienda escribirlos en una carpeta como varios archivos (solo especifique el nombre de la carpeta), en cuyo caso el rendimiento es mejor que escribirlos en un único archivo.

Scenario	Configuración sugerida
Carga completa de una tabla grande con particiones físicas.	Opción de partición: Particiones físicas de la tabla. Durante la ejecución, el servicio detecta automáticamente las particiones físicas y copia los datos por particiones.
Carga completa de una tabla grande, sin particiones físicas, aunque con una columna de enteros para la creación de particiones de datos.	Opciones de partición: Intervalo dinámico. Columna de partición: especifique la columna usada para crear la partición de datos. Si no se especifica, se usa la columna de clave principal.
Cargue una gran cantidad de datos mediante una consulta personalizada con particiones físicas.	Opción de partición: Particiones físicas de la tabla. Consulta: `SELECT * FROM <TABLENAME> PARTITION("?AdfTabularPartitionName") WHERE <your_additional_where_clause>`. Nombrede partición: especifique los nombres de partición de los que se van a copiar los datos. Si no se especifica, el servicio detecta automáticamente las particiones físicas en la tabla especificada en el conjunto de datos de Amazon RDS For Oracle. Durante la ejecución, el servicio reemplaza `?AdfTabularPartitionName` por el nombre de partición real y envía a Amazon RDS For Oracle.
Carga de grandes cantidades de datos mediante una consulta personalizada, sin particiones físicas, aunque cuenta con una columna de enteros para la creación de particiones de datos.	Opciones de partición: Intervalo dinámico. Consulta: `SELECT * FROM <TABLENAME> WHERE ?AdfRangePartitionColumnName <= ?AdfRangePartitionUpbound AND ?AdfRangePartitionColumnName >= ?AdfRangePartitionLowbound AND <your_additional_where_clause>`. Columna de partición: especifique la columna usada para crear la partición de datos. Puede crear particiones en la columna con un tipo de datos entero. Límite superior de partición y Límite inferior de partición: especifique si desea filtrar por la columna de partición para recuperar datos solo entre el intervalo inferior y el superior. Durante la ejecución, el servicio reemplaza `?AdfRangePartitionColumnName`, `?AdfRangePartitionUpbound` y `?AdfRangePartitionLowbound` con los nombres de columna reales y los intervalos de valores para cada partición, y los envía a Amazon RDS for Oracle. Por ejemplo, si establece la columna de partición "ID" con un límite inferior de 1 y un límite superior de 80, con la copia en paralelo establecida en 4, el servicio recupera los datos de 4 particiones. Los identificadores están comprendidos entre [1, 20], [21, 40], [41, 60] y [61, 80] respectivamente.

Sugerencia

Al copiar datos de una tabla sin particiones, puede usar la opción de partición "Dynamic range" (Intervalo dinámico) para crear particiones en una columna de enteros. Si los datos de origen no tienen este tipo de columna, puede aprovechar la función ORA_HASH de la consulta de origen para generar una columna y usarla como columna de partición.

Resumen de tabla

Las tablas siguientes contienen más información sobre la actividad de copia en Amazon RDS For Oracle.

Información de origen

Nombre	Description	Importancia	Obligatorio	Propiedad de script JSON
Conexión	Tu conexión con el almacén de datos de origen.	<su conexión Amazon RDS for Oracle>	Sí	connection
Ejecutar consulta	La manera de leer datos de Amazon RDS For Oracle. Aplique Table para leer datos de la tabla especificada o aplicar Query para leer datos mediante consultas.	• Tabla • Consulta	No	/
Para Tabla
nombre de esquema	Nombre del esquema.	< el nombre del esquema >	No	schema
nombre de tabla	Nombre de la tabla.	< tu nombre de tabla >	No	table
Para consulta
Query	Use la consulta SQL personalizada para leer los datos. Un ejemplo es `SELECT * FROM MyTable`. Tenga en cuenta que la consulta no debe terminar con un punto y coma (;). Si habilita la carga con particiones, deberá enlazar todos los parámetros de partición integrados correspondientes en la consulta. Para obtener ejemplos, consulte la sección Copia en paralelo desde Amazon RDS For Oracle .	< Consultas SQL >	No	oracleReaderQuery

Nombres de partición	Lista de particiones físicas que deben copiarse. Si usa una consulta para recuperar datos de origen, enlace `?AdfTabularPartitionName` en la cláusula WHERE.	< nombres de partición >	No	nombres de particiones
Nombre de columna de partición	Nombre de la columna de origen en tipo entero que usará el particionado por rango para la copia en paralelo. Si no se especifica, se detectará automáticamente la clave principal de la tabla y se usará como columna de partición.	< nombres de columna de partición >	No	partitionColumnName
Límite superior de partición	Valor máximo de la columna de partición para copiar los datos fuera. Si usa una consulta para recuperar los datos de origen, inserte `?AdfRangePartitionUpbound` en la cláusula WHERE.	< límite superior de la partición >	No	límite superior de partición
Límite inferior de partición	Valor mínimo de la columna de partición para copiar los datos hacia afuera. Si usa una consulta para recuperar los datos de origen, incluya `?AdfRangePartitionLowbound` en la cláusula WHERE.	< tu límite inferior de la partición >	No	partitionLowerBound
Tiempo de espera de consulta (minutos)	El tiempo de espera para la ejecución del comando de consulta, el valor predeterminado es de 120 minutos.	lapso de tiempo	No	queryTimeout
Precisión	Número máximo de dígitos decimales significativos. Los valores permitidos oscilan entre 1 y 256. El valor predeterminado es 256 si no se especifica.	< tu precisión >	No	numberPrecision
Scale	Número de dígitos después del separador decimal. Los valores permitidos oscilan entre 0 y 130 y deben ser menores o iguales que la precisión. Si no se especifica, el valor predeterminado es 130.	< tu escala >	No	numberScale
Columnas adicionales	Agregue columnas de datos adicionales para almacenar la ruta de acceso relativa o el valor estático de los archivos de origen. La expresión se admite para este último.	• Nombre • Valor	No	columnas adicionales: • nombre •valor

Introducción a Amazon RDS For Oracle

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2025-10-21