jdbc (DataFrameReader)

Tworzy tabelę DataFrame bazy danych dostępną za pośrednictwem adresu URL urlJDBC. Partycje tabeli są pobierane równolegle, jeśli column określono wartość lub predicates . Jeśli określono obie column wartości i predicates , column ma pierwszeństwo.

Składnia

jdbc(url, table, column=None, lowerBound=None, upperBound=None,
     numPartitions=None, predicates=None, properties=None)

Parametry

Parameter Typ Opis
url str Adres URL JDBC formularza jdbc:subprotocol:subname.
table str Nazwa tabeli w zewnętrznej bazie danych.
column str, opcjonalnie Kolumna do użycia do partycjonowania (alias opcji partitionColumn ). Wymaga lowerBound, upperBoundi numPartitions.
lowerBound int lub str, opcjonalnie Minimalna column wartość partycjonowania. Wymagane, gdy column jest określony.
upperBound int lub str, opcjonalnie Maksymalna wartość column partycjonowania. Wymagane, gdy column jest określony.
numPartitions int, opcjonalnie Liczba partycji. Wymagane, gdy column jest określony.
predicates lista, opcjonalnie Lista WHERE wyrażeń klauzul, z których każda definiuje jedną partycję obiektu DataFrame. Ignorowane, jeśli określono column.
properties dict, opcjonalnie Argumenty połączenia JDBC, zazwyczaj w tym 'user' i 'password'. Na przykład {'user': 'SYSTEM', 'password': 'mypassword'}.

Zwroty

DataFrame

Notatki

Unikaj równoległego tworzenia zbyt wielu partycji w dużym klastrze, ponieważ może to ulec awarii zewnętrznych systemów baz danych.