Megosztás a következőn keresztül:


Hive-tábla (örökölt)

Fontos

Ez a dokumentáció ki lett állítva, és lehet, hogy nem frissül.

Ez a cikk bemutatja, hogyan importálhat Hive-táblát a felhőbeli tárolóból az Azure Databricksbe egy külső tábla használatával.

A Databricks nem javasolja a Hive-táblák használatát az adatok tárolásához vagy rendszerezéséhez. Ez a dokumentáció segítséget nyújt egy meglévő Hive-táblával való kapcsolat konfigurálásához az adatok külső rendszerből való áttelepítéséhez vagy betöltéséhez.

1. lépés: Az CREATE TABLE utasítás megjelenítése

Adjon ki egy parancsot SHOW CREATE TABLE <tablename> a Hive parancssorban a táblát létrehozó utasítás megtekintéséhez.

hive> SHOW CREATE TABLE wikicc;
OK
CREATE  TABLE `wikicc`(
  `country` string,
  `count` int)
ROW FORMAT SERDE
  'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'
STORED AS INPUTFORMAT
  'org.apache.hadoop.mapred.TextInputFormat'
OUTPUTFORMAT
  'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
  '<path-to-table>'
TBLPROPERTIES (
  'totalSize'='2335',
  'numRows'='240',
  'rawDataSize'='2095',
  'COLUMN_STATS_ACCURATE'='true',
  'numFiles'='1',
  'transient_lastDdlTime'='1418173653')

2. lépés: Utasítás kiadása CREATE EXTERNAL TABLE

Ha a visszaadott utasítás parancsot CREATE TABLE használ, másolja ki az utasítást, és cserélje le a következőre CREATE TABLE CREATE EXTERNAL TABLE: .

  • EXTERNAL biztosítja, hogy a Spark SQL ne törölje az adatokat, ha elveti a táblát.
  • Kihagyhatja a TBLPROPERTIES mezőt.
DROP TABLE wikicc
CREATE EXTERNAL TABLE `wikicc`(
  `country` string,
  `count` int)
ROW FORMAT SERDE
  'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'
STORED AS INPUTFORMAT
  'org.apache.hadoop.mapred.TextInputFormat'
OUTPUTFORMAT
  'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
  '<path-to-table>'

3. lépés: SQL-parancsok kiadása az adatokon

SELECT * FROM wikicc