Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En este artículo se describe cómo usar la actividad de copia en una canalización para copiar datos de SAP HANA.
Prerrequisitos
Para usar el conector de SAP HANA, debe:
- Configure una puerta de enlace de datos local. Para más información, consulte Acceso a orígenes de datos locales en Data Factory.
- Instale el controlador ODBC de SAP HANA en la máquina de puerta de enlace. Puede descargar el controlador ODBC de SAP HANA desde el centro de descarga de software de SAP. Busque con la palabra clave SAP HANA CLIENT for Windows (Cliente SAP HANA para Windows).
Configuración admitida
Para la configuración de cada pestaña en la actividad de copia, vaya a las secciones siguientes respectivamente.
General
Consulte las instruccionesgenerales para configurar la pestaña de parámetros General.
Fuente
Las siguientes propiedades son compatibles con SAP HANA en la pestaña Origen de una actividad de copia.
Las siguientes propiedades son obligatorias:
Conexión: seleccione una conexión de SAP HANA en la lista de conexiones. Si la conexión no existe, cree una nueva conexión de SAP HANA.
Usar consulta: puede elegir Tabla o Consulta como consulta de uso. La siguiente lista describe la configuración de cada opción.
- Tabla: seleccione la tabla de la base de datos en la lista desplegable. O bien, seleccione Entrar manualmente para escribir manualmente el esquema y el nombre de la tabla.
- Consulta: especifique la consulta SQL para leer datos de la instancia de SAP HANA.
En Avanzado, puede especificar los campos siguientes:
Opción de partición: especifica las opciones de creación de particiones de datos que se usan para cargar datos de SAP HANA. Cuando se habilita una opción de partición (es decir, no Ninguno), el grado de paralelismo para cargar datos simultáneamente desde SAP HANA se controla mediante la configuración Grado de paralelismo de copia en la actividad de copia. Los valores permitidos son:
- Ninguno (valor predeterminado): no hay particiones.
- Particiones físicas de tabla: el servicio detecta automáticamente el tipo de partición física de la tabla de SAP HANA especificada y elige la estrategia de partición correspondiente. Para obtener más información, vaya a Copia en paralelo desde la sección SAP HANA . Esta opción no está disponible cuando se usa la consulta para leer la tabla.
-
Intervalo dinámico: cuando se usa una consulta para recuperar los datos de origen, enlace
?AdfHanaDynamicRangePartitionConditionen la cláusula WHERE. Para obtener más información, consulte la sección Copia en paralelo desde SAP HANA .- Nombre de columna de partición: especifique el nombre de la columna de origen que usa la partición para la copia en paralelo. Si no se especifica, el índice o la clave primaria de la tabla se detectan automáticamente y se usan como columna de partición.
Tamaño de paquete (KB): especifica el tamaño del paquete de red en kilobytes para dividir los datos en varios bloques. Si tiene una gran cantidad de datos para copiar, aumentar el tamaño del paquete puede aumentar la velocidad de lectura de SAP HANA en la mayoría de los casos. El valor predeterminado es 2048 (2 MB).
Columnas adicionales: añada columnas de datos adicionales para almacenar la ruta relativa o el valor estático de los archivos de origen. La expresión se admite para este último.
Cartografía
Para la configuración de la pestaña Asignación, vaya a Configurar sus asignaciones en la pestaña de asignación.
Settings
Para la configuración de la pestaña Configuración, vaya a Configurar los otros parámetros en la pestaña configuración.
Copia paralela desde SAP HANA
El conector de SAP HANA proporciona la creación de particiones de datos integrada para copiar datos de SAP HANA en paralelo. Puede encontrar las opciones de creación de particiones de datos en la pestaña Origen de la actividad de copia.
Al habilitar la copia con particiones, el servicio ejecuta consultas en paralelo en el origen de SAP HANA para recuperar datos mediante particiones. El grado paralelo se controla mediante la configuración Grado de paralelismo de copia en la actividad de copia. Por ejemplo, si establece el grado de paralelismo de copia en cuatro, el servicio genera y ejecuta simultáneamente cuatro consultas basadas en la configuración y la opción de partición especificadas, y cada consulta recupera una parte de los datos de SAP HANA.
Es recomendable que habilite la copia en paralelo con la creación de particiones de datos, especialmente si ingiere grandes cantidades de datos de SAP HANA. Estas son algunas configuraciones sugeridas para diferentes escenarios. Cuando se copian datos en un almacén de datos basado en archivos, se recomienda escribirlos en una carpeta como varios archivos (solo especifique el nombre de la carpeta), en cuyo caso el rendimiento es mejor que escribirlos en un único archivo.
| Escenario | Configuración sugerida |
|---|---|
| Carga completa de una tabla grande. |
Opción de partición: particiones físicas de la tabla. Durante la ejecución, el servicio detecta automáticamente el tipo de partición física de la tabla de SAP HANA especificada y elige la estrategia de partición correspondiente: - Creación de particiones por rangos: obtenga la columna de partición y los intervalos de partición definidos para la tabla y, luego, copia los datos por intervalo. - Creación de particiones por hash: use la clave de partición hash como columna de partición y, luego, divida y copie los datos en función de los intervalos calculados por el servicio. - Round-Robin Creación de particiones o Sin partición: use la clave principal como columna de partición y, a continuación, particione y copie los datos en función de los intervalos calculados por el servicio. |
| Cargue grandes cantidades de datos mediante una consulta personalizada. |
Opción de partición: partición por rangos dinámica. Consulta: SELECT * FROM <TABLENAME> WHERE (?AdfHanaDynamicRangePartitionCondition) AND <your_additional_where_clause>>.Columna de partición: especifique la columna que se usa para aplicar la partición de intervalos dinámicos. Durante la ejecución, el servicio calcula primero los intervalos de valores de la columna de partición especificada, al distribuir uniformemente las filas en un número de cubos según el número de valores de columna de partición distintos y la configuración de copia paralela, reemplaza ?AdfHanaDynamicRangePartitionCondition por filtrar el intervalo de valores de columna de partición para cada partición y envía a SAP HANA.Si quiere usar varias columnas como columna de partición, puede concatenar los valores de cada columna como una columna de la consulta y especificarla como columna de partición, como SELECT * FROM (SELECT *, CONCAT(<KeyColumn1>, <KeyColumn2>) AS PARTITIONCOLUMN FROM <TABLENAME>) WHERE (?AdfHanaDynamicRangePartitionCondition). |
Asignación de tipos de datos para SAP HANA
Al copiar datos desde SAP HANA, se utilizan las siguientes asignaciones de tipos de datos de SAP HANA a tipos de datos intermedios utilizados internamente por el servicio.
| Tipo de datos de SAP HANA | Tipo de datos provisional |
|---|---|
| ALPHANUM | String |
| BIGINT | Int64 |
| BINARIO | Matriz de bytes |
| BINTEXT | String |
| BLOB | Matriz de bytes |
| BOOL | Byte |
| CLOB | String |
| FECHA | DateTime |
| DECIMAL | Decimal |
| DOUBLE | Double |
| FLOTAR | Double |
| INTEGER | Int32 |
| NCLOB | String |
| NVARCHAR | String |
| REAL | Soltero |
| SEGUNDAFECHA | DateTime |
| SHORTTEXT | String |
| DECIMALPEQUEÑO | Decimal |
| SMALLINT | Int16 |
| STGEOMETRYTYPE | Matriz de bytes |
| STPOINTTYPE | Matriz de bytes |
| Mensaje de texto | String |
| TIME | TimeSpan |
| TINYINT | Byte |
| VARCHAR | String |
| TIMESTAMP | DateTime |
| VARBINARY | Matriz de bytes |
Resumen de tabla
La tabla siguiente contiene más información sobre la actividad de copia en SAP HANA.
Fuente
| Nombre | Descripción | Importancia | Obligatorio | Propiedad del script de JSON |
|---|---|---|---|---|
| Conexión | Tu conexión con el almacén de datos de origen. | < tu conexión de SAP HANA > | Sí | conexión |
| Usar consulta | La manera de leer datos de SAP HANA. | / | Sí | / |
| Tabla | El nombre de la tabla para leer los datos. | < nombre de la tabla de origen> | Sí (si Usar consulta es Tabla) | typeProperties (en typeProperties ->source)-esquema - mesa |
| Query | Consulta SQL para leer datos de SAP HANA. | < tu consulta SQL> | Sí (si Usar consulta es Consulta) | query |
| Opción de partición | Las opciones de creación de particiones de datos usadas para cargar datos desde SAP HANA. | •Ninguno • ParticionesFísicasDeTabla • SapHanaDynamicRange |
No | partitionOption |
| Nombre de columna de partición | Nombre de la columna de origen usada por la partición para la copia en paralelo. | < tu columna de partición > | Sí (cuando se usa la partición de intervalo dinámico) | partitionColumnName (en partitionSettings) |
| Tamaño de paquete (KB) | Tamaño del paquete de red (en kilobytes) para dividir los datos en varios bloques. |
< tamaño de paquete > El valor predeterminado es 2048 (2 MB) |
No | tamaño del paquete |
| Columnas adicionales | Agregue columnas de datos adicionales para almacenar la ruta de acceso relativa o el valor estático de los archivos de origen. La expresión se admite para este último. | • Nombre • Valor |
No | columnas adicionales: • nombre •valor |