Del via


Konfigurer Amazon RDS til Oracle i en kopiaktivitet

I denne artikel beskrives det, hvordan du bruger kopieringsaktiviteten i en pipeline til at kopiere data fra Amazon RDS til Oracle.

Specifikt understøtter denne Amazon RDS For Oracle-connector:

  • Følgende versioner af en Amazon RDS For Oracle-database:
    • Amazon RDS til Oracle 19c og højere
    • Amazon RDS til Oracle 18c og højere
    • Amazon RDS til Oracle 12c og højere
    • Amazon RDS til Oracle 11g og højere
  • Parallel kopiering fra en Amazon RDS For Oracle-kilde. Se afsnittet Parallel kopi fra Amazon RDS til Oracle for at få flere oplysninger.

Notat

Amazon RDS For Oracle-proxyserveren understøttes ikke.

Understøttet konfiguration

Hvis du vil konfigurere hver fane under kopiaktivitet, skal du gå til henholdsvis følgende afsnit.

Generel

Se vejledningen til generelle indstillinger for at konfigurere fanen Generelle indstillinger.

Source

Følgende egenskaber understøttes for Amazon RDS For Oracle under fanen Kilde for en kopieringsaktivitet.

Skærmbillede, der viser kildefanen og listen over egenskaber.

Følgende egenskaber er påkrævet:

  • Forbindelse: Vælg en Amazon RDS For Oracle-forbindelse fra forbindelseslisten. Hvis der ikke findes nogen forbindelse, skal du oprette en ny Amazon RDS For Oracle-forbindelse.

  • Brug forespørgsel: Vælg Tabel eller Forespørgsel.

    • Hvis du vælger Tabel:

      • Tabel: Vælg tabellen på rullelisten, eller vælg Enter manuelt for manuelt at angive den for at læse data.
    • Hvis du vælger Forespørgsel:

      • Forespørgsel: Angiv den brugerdefinerede SQL-forespørgsel for at læse data. For eksempel: SELECT * FROM MyTable. Bemærk, at forespørgslen ikke må slutte med et semikolon (;).

        Når du aktiverer partitioneret indlæsning, skal du tilknytte eventuelle tilsvarende indbyggede partitionsparametre i forespørgslen. Du kan finde eksempler i afsnittet Parallel kopi fra Amazon RDS til Oracle .

        Skærmbillede, der viser forespørgsel.

Under Avanceret kan du angive følgende felter:

  • Partitionsindstilling: Angiver de datapartitioneringsindstillinger, der bruges til at indlæse data fra Amazon RDS For Oracle. Tilladte værdier er: Ingen (standard), PhysicalPartitionsOfTable og DynamicRange. Når en partitionsindstilling er aktiveret (dvs. ikke Ingen), styres graden af parallelitet for samtidig indlæsning af data fra en Amazon RDS For Oracle-database af graden af kopiparallelitet under fanen indstillinger for kopieringsaktivitet.

    Hvis du vælger Ingen, vælger du ikke at bruge partition.

    Hvis du vælger Fysiske partitioner af tabellen:

    • Partitionsnavne: Angiv listen over fysiske partitioner, der skal kopieres.

      Hvis du bruger en forespørgsel til at hente kildedataene, skal du tilslutte ?AdfTabularPartitionName WHERE-delsætningen. Du kan f.eks. se afsnittet Parallel kopi fra Amazon RDS til Oracle .

      Skærmbillede, der viser konfigurationen, når du vælger Fysiske partitioner i tabellen.

    Hvis du vælger Dynamisk område:

    • Partitionskolonnenavn: Angiv navnet på kildekolonnen i heltalstype , der skal bruges af områdepartitionering til parallel kopiering. Hvis det ikke er angivet, registreres den primære nøgle i tabellen automatisk og bruges som partitionskolonne.

      Hvis du bruger en forespørgsel til at hente kildedataene, skal du tilslutte ?AdfRangePartitionColumnName WHERE-delsætningen. Du kan f.eks. se afsnittet Parallel kopi fra Amazon RDS til Oracle .

    • Partitionens øvre grænse: Angiv den maksimale værdi af partitionskolonnen, der skal kopieres data ud.

      Hvis du bruger en forespørgsel til at hente kildedataene, skal du tilslutte ?AdfRangePartitionUpbound WHERE-delsætningen. Du kan f.eks. se afsnittet Parallel kopi fra Amazon RDS til Oracle .

    • Partitionens nedre grænse: Angiv minimumværdien for partitionskolonnen, der skal kopieres data ud.

      Hvis du bruger en forespørgsel til at hente kildedataene, skal du tilslutte ?AdfRangePartitionLowbound WHERE-delsætningen. Du kan f.eks. se afsnittet Parallel kopi fra Amazon RDS til Oracle .

      Skærmbillede, der viser konfigurationen, når du vælger Dynamisk område.

  • Timeout for forespørgsel (minutter): Angiv timeout for udførelse af forespørgselskommandoer, standarden er 120 minutter. Hvis der er angivet en parameter for denne egenskab, er tilladte værdier tidsrum, f.eks. "02:00:00" (120 minutter).

  • NUMMER-indstillinger: Angiv præcisionen og skalaen for TAL. Dette gælder kun for NUMBER-typer, der ikke har præcision og skalering, der eksplicit er defineret i Amazon RDS For Oracle-databasen.

    • Præcision: Angiv det maksimale antal betydende decimalcifre. Tilladte værdier spænder fra 1 til 256. Standardværdien er 256, hvis den ikke er angivet.

    • Skala: Angiv antallet af cifre efter decimaltegnet. De tilladte værdier går fra 0 til 130 og skal være mindre end eller lig med præcisionen. Standardværdien er 130, hvis den ikke er angivet.

  • Flere kolonner: Tilføj flere datakolonner for at gemme kildefilernes relative sti eller statiske værdi. Udtrykket understøttes for sidstnævnte.

Tilknytning

For konfiguration af fanen Tilknytning skal du gå til Konfigurer dine tilknytninger under fanen Tilknytning.

Datatypetilknytning til Amazon RDS til Oracle

Når du kopierer data fra Amazon RDS For Oracle, bruges følgende tilknytninger fra Amazon RDS For Oracle-datatyper til midlertidige datatyper, der bruges af tjenesten internt.

Amazon RDS til Oracle datatype Datatype for midlertidig service
BFILE Byte[]
BINARY_FLOAT Enlig
BINARY_DOUBLE Dobbelt
BLOB Byte[]
CHAR String
CLOB String
DATO Datetime
FLYDER (P < 16) Dobbelt
FLOAT (P >= 16) Decimaltal
INTERVAL ÅR TIL MÅNED Int64
INTERVAL DAG TIL SEKUND TimeSpan
LANG String
LANG RÅ Byte[]
NCHAR String
NCLOB String
ANTAL (p,s) Int16, Int32, Int64, Dobbelt, Enkelt, Decimal
ANTAL uden præcision og skala Decimaltal
NVARCHAR2 String
Byte[]
TIDSSTEMPEL Datetime
TIDSSTEMPEL MED LOKAL TIDSZONE Datetime
TIDSSTEMPEL MED TIDSZONE DateTimeOffset
VARCHAR2 String
XML-type String

Notat

NUMBER(p,s) er knyttet til den relevante midlertidige servicedatatype afhængigt af præcisionen (p) og skalaen (s).

Indstillinger

Du kan finde oplysninger om konfiguration af fanen Indstillinger under Konfigurer dine andre indstillinger under fanen Indstillinger.

Parallel kopi fra Amazon RDS til Oracle

Amazon RDS For Oracle-connectoren i kopieringsaktivitet giver indbygget datapartitionering til at kopiere data parallelt. Du kan finde indstillinger for datapartitionering under fanen Kilde i kopieringsaktiviteten.

Når du aktiverer partitioneret kopi, kører kopieringsaktiviteten parallelle forespørgsler mod din Amazon RDS For Oracle-kilde for at indlæse data efter partitioner. Den parallelle grad styres af graden af kopiparallelitet under fanen indstillinger for kopieringsaktivitet. Hvis du f.eks. angiver Grad af kopiparallelitet til fire, genererer og kører tjenesten samtidig fire forespørgsler baseret på din angivne partitionsindstilling og indstillinger, og hver forespørgsel henter en del af data fra din Amazon RDS For Oracle.

Det foreslås at aktivere parallel kopiering med datapartitionering, især når du indlæser store mængder data fra din Amazon RDS For Oracle. Følgende er foreslåede konfigurationer til forskellige scenarier. Når du kopierer data til et filbaseret datalager, anbefales det at skrive til en mappe som flere filer (angiv kun mappenavn), i hvilket tilfælde ydeevnen er bedre end at skrive til en enkelt fil.

Scenarie Foreslåede indstillinger
Fuld belastning fra stort bord med fysiske skillevægge. Partitionsindstilling: Fysiske partitioner af tabellen.

Under udførelsen registrerer tjenesten automatisk de fysiske partitioner og kopierer data efter partitioner.
Fuld belastning fra stor tabel uden fysiske partitioner, mens der er en heltalskolonne til datapartitionering. Partitionsindstillinger: Dynamisk område.
Partitionskolonne: Angiv den kolonne, der bruges til at partitionere data. Hvis det ikke er angivet, bruges kolonnen med primær nøgle.
Indlæs en stor mængde data ved hjælp af en brugerdefineret forespørgsel med fysiske partitioner. Partitionsindstilling: Fysiske partitioner af tabellen.
Forespørgsel: SELECT * FROM <TABLENAME> PARTITION("?AdfTabularPartitionName") WHERE <your_additional_where_clause>.
Partitionsnavn: Angiv det eller de partitionsnavne, der skal kopieres data fra. Hvis det ikke er angivet, registrerer tjenesten automatisk de fysiske partitioner i den tabel, du har angivet i Amazon RDS For Oracle-datasættet.

Under udførelsen erstattes ?AdfTabularPartitionName tjenesten med det faktiske partitionsnavn og sendes til Amazon RDS For Oracle.
Indlæs en stor mængde data ved hjælp af en brugerdefineret forespørgsel uden fysiske partitioner, mens du har en heltalskolonne til datapartitionering. Partitionsindstillinger: Dynamisk område.
Forespørgsel: SELECT * FROM <TABLENAME> WHERE ?AdfRangePartitionColumnName <= ?AdfRangePartitionUpbound AND ?AdfRangePartitionColumnName >= ?AdfRangePartitionLowbound AND <your_additional_where_clause>.
Partitionskolonne: Angiv den kolonne, der bruges til at partitionere data. Du kan partitionere mod kolonnen med heltalsdatatypen.
Partition øvre grænse og Partition nedre grænse: Angiv, om du vil filtrere mod partitionskolonne for kun at hente data mellem det nedre og øvre område.

Under udførelsen erstatter ?AdfRangePartitionColumnNametjenesten , ?AdfRangePartitionUpboundog ?AdfRangePartitionLowbound med det faktiske kolonnenavn og værdiområder for hver partition og sender til Amazon RDS For Oracle.
Hvis din partitionskolonne "ID" f.eks. er angivet med den nedre grænse som 1 og den øvre grænse som 80, med parallel kopi angivet som 4, henter tjenesten data med 4 partitioner. Deres ID'er er mellem henholdsvis [1,20], [21, 40], [41, 60] og [61, 80].

Tips

Når du kopierer data fra en ikke-partitioneret tabel, kan du bruge partitionsindstillingen "Dynamisk område" til at partitionere mod en heltalskolonne. Hvis dine kildedata ikke har en sådan type kolonne, kan du udnytte ORA_HASH funktion i kildeforespørgslen til at generere en kolonne og bruge den som partitionskolonne.

Tabeloversigt

Følgende tabeller indeholder flere oplysninger om kopieringsaktiviteten i Amazon RDS For Oracle.

Kildeoplysninger

Navn Beskrivelse Værdi Required JSON-scriptegenskab
Forbindelse Din forbindelse til kildedatalageret. <din Amazon RDS til Oracle-forbindelse> Ja forbindelse
Brug forespørgsel Måden at læse data fra Amazon RDS til Oracle. Anvend Tabel til at læse data fra den angivne tabel, eller anvend Forespørgsel til at læse data ved hjælp af forespørgsler. Tabel
Forespørgsel
Nej /
Til bord
Skemaets navn Navnet på skemaet. < dit skemanavn > Nej skema
Tabelens navn Tabellens navn. < Dit tabelnavn > Nej tabel
Til forespørgsel
Forespørgsel Brug den brugerdefinerede SQL-forespørgsel til at læse data. Et eksempel er SELECT * FROM MyTable. Bemærk, at forespørgslen ikke må slutte med et semikolon (;).
Når du aktiverer partitioneret indlæsning, skal du tilknytte eventuelle tilsvarende indbyggede partitionsparametre i forespørgslen. Du kan finde eksempler i afsnittet Parallel kopi fra Amazon RDS til Oracle .
< SQL-forespørgsler > Nej oracleReaderQuery
Navne på partitioner Listen over fysiske partitioner, der skal kopieres. Hvis du bruger en forespørgsel til at hente kildedataene, skal du tilslutte ?AdfTabularPartitionName WHERE-delsætningen. < dine partitionsnavne > Nej partitionNavne
Navn på partitionskolonne Navnet på kildekolonnen i heltalstype , der skal bruges af områdepartitionering til parallel kopiering. Hvis det ikke er angivet, registreres den primære nøgle i tabellen automatisk og bruges som partitionskolonne. < Dine partitionskolonnenavne > Nej partitionColumnName
Øvre grænse for skillevæg Den maksimale værdi af partitionskolonnen, der skal kopieres data ud. Hvis du bruger en forespørgsel til at hente kildedataene, skal du tilslutte ?AdfRangePartitionUpbound WHERE-delsætningen. < din partitions øvre grænse > Nej partitionUpperBound
Partition nedre grænse Minimumsværdien af partitionskolonnen, der skal kopieres data ud. Hvis du bruger en forespørgsel til at hente kildedataene, skal du tilslutte ?AdfRangePartitionLowbound WHERE-delsætningen. < din partitions nedre grænse > Nej partitionLowerBound
Timeout for forespørgsel (minutter) Timeout for udførelse af forespørgselskommandoer, standard, er 120 minutter. timespan Nej queryTimeout
Præcision Det maksimale antal betydende decimalcifre. Tilladte værdier spænder fra 1 til 256. Standardværdien er 256, hvis den ikke er angivet. < Din præcision > Nej nummerPræcision
Omfang Antallet af cifre efter decimaltegnet. De tilladte værdier går fra 0 til 130 og skal være mindre end eller lig med præcisionen. Standardværdien er 130, hvis den ikke er angivet. < din vægt > Nej numberScale
Flere kolonner Tilføj yderligere datakolonner for at gemme kildefilernes relative sti eller statiske værdi. Udtrykket understøttes for sidstnævnte. • Navn
•Værdi
Nej additionalColumns:
•Navn
•værdi