Databricks Runtime 5.5 LTS (sin soporte técnico)

Databricks publicó esta imagen en julio de 2019. En agosto de 2019 se declaró el soporte técnico a largo plazo (LTS). El 27 de julio de 2021 finalizó el soporte técnico. El Soporte técnico extendido de la versión 5.5 de Databricks Runtime (sin soporte técnico) se publicó el 8 de julio de 2021 y se amplió hasta diciembre de 2021. Usa Ubuntu 18.04.5 LTS en lugar de la distribución en desuso de Ubuntu 16.04.6 LTS usada en la versión inicial de Databricks Runtime 5.5 LTS. El soporte técnico de Ubuntu 16.04.6 LTS finalizó el 1 de abril de 2021.

En las siguientes notas de la versión se proporciona información sobre Databricks Runtime 5.5, con tecnología de Apache Spark.

Nuevas características

Optimización automática con Delta Lake en Azure Databricks

En este momento, al escribir datos en el almacenamiento en la nube, debe compactar los archivos para obtener un rendimiento óptimo de E/S. Tiene que preocuparse por el tamaño adecuado del archivo y la frecuencia con la que se deben compactar, así como del tamaño del clúster que va a usar, entre otras cosas. Para resolver esta clase de problemas, nos complace anunciar la disponibilidad general de la optimización automática con Delta Lake en Azure Databricks. Cada vez que se escribe en tablas Delta, se determinan automáticamente los tamaños correctos de los archivos y se compactan para que no tenga que preocuparse por optimizar el diseño del almacenamiento. Al escribir, si la opción auto-optimize es true, Azure Databricks determina automáticamente si se necesita una optimización y optimiza los archivos pequeños. Para obtener más información, consulte Configuración de Delta Lake para controlar el tamaño del archivo de datos.

Delta Lake en Azure Databricks mejoró el rendimiento de las consultas de agregación min, max y count

El rendimiento de las consultass de agregación min, max y count para Delta Lake en Azure Databricks se han mejorado significativamente al reducir la cantidad de datos que se leen. Estas consultas ahora se ejecutan mediante estadísticas y valores de partición en los metadatos, en lugar de examinar los datos.

Canalizaciones de inferencia de modelos más rápidas con mejor origen de datos de archivo binario y una UDF de pandas de iterador escalar (versión preliminar pública)

Las tareas de aprendizaje automático, especialmente en el dominio de imágenes y vídeos, a menudo tienen que funcionar en un gran número de archivos. Con Databricks Runtime 5.4, ya está disponible el origen de datos de archivo binario para la extracción, transformación y carga de datos de archivos arbitrarios, como imágenes, en tablas de Spark. En Databricks Runtime 5.5, se ha añadido una opción, recursiveFileLookup, para cargar archivos de forma recursiva desde los directorios de entrada anidados. Consulte Archivo binario.

El origen de datos de archivo binario permite ejecutar tareas de inferencia de modelos en paralelo desde tablas de Spark mediante una UDF escalar de pandas. Sin embargo, es posible que tenga que inicializar el modelo para cada lote de registros, lo que causa sobrecarga. En Databricks Runtime 5.5, se ha efectuado la portabilidad con versiones anteriores de un nuevo tipo de UDF de pandas llamado «iterador escalar» desde Apache Spark. Con él, puede inicializar un modelo solo una vez y aplicarlo a muchos lotes de entrada, lo que puede dar lugar a una velocidad de 2-3x para modelos como ResNet50. Consulte Serie a UDF escalar.

API de secretos en cuadernos de R

Con las API de secretos se pueden insertar secretos en cuadernos sin necesidad de hard code. Esta API ahora esta disponible en cuadernos de R además del soporte existente para los cuadernos de Python y Scala. Puede usar la función dbutils.secrets.get para obtener secretos. Los secretos se difuminan antes de imprimirlos en una celda del cuaderno.

Mejoras

  • Soporte para la ejecución de las operaciones de Delta Lake SQL en PythonforeachBatch: se corrigió la limitación reconocida por la que no se podía escribir en las tablas deltas desde el interior foreachBatch de una consulta de flujo estructurado definida en Python. Esto resulta útil en cargas de trabajo de flujo de Python habituales, como por ejemplo, Escribir agregados de flujos en el modo actualizar con COMBINAR y foreachBatch.
  • Rendimiento de las tablas de Delta almacenadas en Azure Data Lake Gen2: la comprobación de la versión más reciente de una tabla de Delta en ADLS Gen2 ahora solo comprueba el final del registro de transacciones, en lugar de enumerar todas las versiones disponibles. Esta optimización hace que UPDATE sea una operación de tiempo constante y mejora considerablemente la latencia.
  • Escalabilidad de la optimizaciónZORDER BY: el orden Z en tablas de Delta muy grandes usa ahora unidades de trabajo más pequeñas que regula un control de admisión avanzado. Con esta característica se mejora la estabilidad de esta operación sin sacrificar el uso del clúster.
  • Rendimiento mejorado de los comandos DML en tablas que tienen un número elevado de columnas: ahora se realiza una mejor eliminación de columnas al examinar los datos coincidentes en los comandos UPDATE, DELETE y MERGE.
  • Soporte para la configuración de VNet y de los puntos de conexión de servicio en el conector de Spark: Azure Synapse Analytics. Se han añadido rutas de acceso de ADL Gen2 a una lista de permitidos como localizaciones temporales de datos (.option("tempDir", "abfss://...") y se ha añadido una nueva opción, llamada useAzureMSI, para que sea usada en lugar de forward_spark_azure_storage_credentials, si Synapse Analytics está configurado para autenticar a través de identidades administradas a la cuenta de almacenamiento V2.
  • Invalidación automática de la caché de disco : la caché de disco ahora detecta automáticamente los archivos que se han modificado o sobrescrito después de almacenarse en la caché. Las entradas obsoletas se invalidan automáticamente y se expulsan de la caché. Consulte Optimización del rendimiento con el almacenamiento en caché en Azure Databricks.
  • Se ha actualizado la biblioteca wheel de Python de 0.33.3 a 0.33.4.
  • Se ha actualizado la biblioteca nlme R de 3.1-139 a 3.1-140.

Corrección de errores

  • Se ha corregido la cancelación de comandos R que no ejecutan trabajos de Spark. Anteriormente, los comandos R que no ejecutaban trabajos de Spark podían cancelarse, pero se perdía el estado de los cuadernos. Ahora no se pierde ese estado al cancelarse los comandos.
  • Al colocar o mover una tabla administrada ahora se invalida el registro de Delta Lake almacenado en caché.
  • Se corrigió un error al escribir el punto de control de Delta Lake debido a FileAlreadyExistsException.
  • El REPL de Scala ahora establece la -target:jvm-1.8marca adecuada para que admita la llamada de métodos Java que usan características de Java 8.

Spark de Apache

Databricks Runtime 5.5 incluye Apache Spark 2.4.3. Esta versión incluye todas las mejoras y correcciones de Spark incluidas en Databricks Runtime 5.4 (sin soporte técnico), junto con las siguientes mejoras y correcciones de errores adicionales que se han realizado en Spark:

  • [SPARK-24695] permite que los UDF devuelvan CalendarInterval
  • [SPARK-28056] Agrega docstring/doctest para UDF de pandas SCALAR_ITER
  • [SPARK-28185] Cierra el generador cuando los UDF de Python se detienen pronto
  • [SPARK-24703] Soporte para la multiplicación de intervalos
  • [SPARK-27018][CORE] Corrección de la eliminación incorrecta de archivos con puntos de comprobación en PeriodicCheckpointer
  • [SPARK-28127][SQL] Microoptimización del método mapChildren de TreeNode
  • [SPARK-26038] Decimal toScalaBigInt/toJavaBigInteger para los decimales que no caben
  • [SPARK-26555][SQL] Hace que la comprobación del subtipo ScalaReflection sea segura
  • [SPARK-28081][ML] Control de los números elevados de vocab en word2vec
  • [SPARK-21882][CORE] OutputMetrics no cuenta correctamente los bytes escritos en la función saveAsHadoopDataset
  • [SPARK-28030] Conversión del filePath en URI en el origen de datos de archivo binario
  • [SPARK-27803][SQL][PYTHON] Corrección de la eliminación de columnas para la UDF de Python
  • [SPARK-27917][SQL] la forma canónica del objecto CaseWhen es incorrecta
  • [SPARK-27798][SQL] from_avro no debería generar el mismo valor que al convertirse en una relación local
  • [SPARK-27873][SQL] columnNameOfCorruptRecord no debería comprobarse con los nombres de columna del encabezado CSV al deshabilitar enforceSchema
  • [SPARK-27907][SQL] HiveUDAF debería devolver NUL cuando hay 0 filas
  • [SPARK-27699][SQL] Inserción parcial de predicados disyuntivos en Parquet/ORC
  • [SPARK-27868][CORE] valor predeterminado y documentación mejores para el trabajo pendiente del servidor de sockets.
  • [SPARK-27869][CORE] Censura la información confidencial de Propiedades del sistema de la interfaz de usuario
  • [SPARK-27863][SQL][BACKPORT-2.4] los ficheros de metadatos y temporales no deberían contarse como ficheros de datos
  • [SPARK-27657][ML] Corrección del formato del registro de ml.util.Instrumentation.logFai…
  • [SPARK-27858][SQL] Corrección de la deserialización de Avro en los tipos de unión con varios tipos que no son null
  • [SPARK-27711][CORE] Anulación de InputFileBlockHolder al final de las tareas
  • [SPARK-27351][SQL] Cálculo de outputRows incorrecto después de AggregateEstimation con una única columna de valor NULL
  • [SPARK-27539][SQL] Corrección de cálculos erróneos de outputRows agregadas con columnas que contienen valores null
  • [SPARK-27800][SQL] Corrección de la respuesta incorrecta a los casos de prueba de BitwiseXor
  • [SPARK-27639][SQL] InMemoryTableScan muestra el nombre de la tabla en la interfaz de usuario si es posible
  • [SPARK-27726][CORE] Corrección del rendimiento de las eliminaciones de ElementTrackingStore al usar InMemoryStore con cargas elevadas
  • [SPARK-27771][SQL] Añade la descripción SQL para las funciones de agrupación (cubo, acumulación, agrupación y grouping_id)
  • [SPARK-27735][SS] La cadena de intervalo de análisis no debería distinguir mayúsculas de minúsculas en SS
  • [SPARK-26856][PYSPARK] Compatibilidad de Python con las API from_avro y to_avro
  • [SPARK-26870][SQL] Desplazamiento de to_avro/from_avro a los objetos de función debido a la compatibilidad con Java
  • [SPARK-26812][SQL] Informe de nulabilidad correcta para los tipos de datos complejos en Union
  • [SPARK-27671][SQL] Corrección del error al convertir de un null anidado en una estructura
  • [SPARK-27673][SQL] Información since añadida a las expresiones aleatorias, regulares y null
  • [SPARK-27672][SQL] Información since añadida a las expresiones de cadena
  • [SPARK-25139][SPARK-18406][CORE] Evita que NonFatals terminen el ejecutor en PythonRunner
  • [SPARK-27624][CORE] Corrección de CalenderInterval para mostrar correctamente un intervalo vacío
  • [SPARK-27577][MLLIB] Umbrales correctos reducidos en BinaryClassificationMetrics
  • [SPARK-27621][ML] Regresión lineal: se validan los parámetros relacionados con el entrenamiento como una pérdida ocurrida solo durante la fase de ajuste.
  • [SPARK-26048][SPARK-24530] Selección exclusiva de todas las confirmaciones que faltan en el script de la versión 2.4
  • [SPARK-24935][SQL] compatibilidad con INIT ->UPDATE -> MERGE -> FINISH en el adaptador UDAF de Hive

Actualizaciones de mantenimiento

Consulte Actualizaciones de mantenimiento de Databricks Runtime 5.5.

Entorno del sistema

  • Sistema operativo: Ubuntu 16.04.6 LTS
  • Java: 1.8.0_252
  • Scala: 2.11.12
  • Python: 2.7.12 para clústeres de Python 2 y 3.5.2 para clústeres de Python 3.
  • R: R, versión 3.6.0 (2019-04-26)
  • Clústeres de GPU: están instaladas las siguientes bibliotecas de GPU de NVIDIA:
    • Controlador Tesla 375.66
    • CUDA 9.0
    • cuDNN 7.0

Nota:

Scala 2.12 es compatible con Apache Spark 2.4, pero no con Databricks Runtime 5.5.

En esta sección:

Bibliotecas de Python instaladas

Biblioteca Versión Biblioteca Versión Biblioteca Versión
ansi2html 1.1.1 argparse 1.2.1 backports-abc 0.5
boto 2.42.0 boto3 1.4.1 botocore 1.4.70
brewer2mpl 1.4.1 certifi 2016.2.28 cffi 1.7.0
chardet 2.3.0 colorama 0.3.7 configobj 5.0.6
criptografía 1.5 cycler 0.10.0 Cython 0.24.1
decorator 4.0.10 docutils 0.14 enum34 1.1.6
et-xmlfile 1.0.1 freetype-py 1.0.2 funcsigs 1.0.2
fusepy 2.0.4 futuros 3.2.0 ggplot 0.6.8
html5lib 0,999 idna 2.1 ipaddress 1.0.16
ipython 2.2.0 ipython-genutils 0.1.0 jdcal 1.2
Jinja2 2.8 jmespath 0.9.0 llvmlite 0.13.0
lxml 3.6.4 MarkupSafe 0,23 matplotlib 1.5.3
mpld3 0,2 msgpack-python 0.4.7 ndg-httpsclient 0.3.3
numba 0.28.1 numpy 1.11.1 openpyxl 2.3.2
pandas 0.19.2 pathlib2 2.1.0 patsy 0.4.1
pexpect 4.0.1 pickleshare 0.7.4 Pillow 3.3.1
pip 19.1.1 ply 3.9 prompt-toolkit 1.0.7
psycopg2 2.6.2 ptyprocess 0.5.1 py4j 0.10.3
pyarrow 0.8.0 pyasn1 0.1.9 pycparser 2.14
Pygments 2.1.3 PyGObject 3.20.0 pyOpenSSL 16.0.0
pyparsing 2.2.0 pypng 0.0.18 Python 2.7.12
Python-dateutil 2.5.3 python-geohash 0.8.5 pytz 2016.6.1
Solicitudes 2.11.1 s3transfer 0.1.9 scikit-learn 0.18.1
scipy 0.18.1 scour 0,32 seaborn 0.7.1
setuptools 41.0.1 simplejson 3.8.2 simples3 1,0
singledispatch 3.4.0.3 six (seis) 1.10.0 statsmodels 0.6.1
tornado 5.1.1 traitlets 4.3.0 urllib3 1.19.1
virtualenv 16.1.0 wcwidth 0.1.7 wheel 0.33.4
wsgiref 0.1.2

Bibliotecas de R instaladas

Biblioteca Versión Biblioteca Versión Biblioteca Versión
abind 1.4-5 askpass 1.1 assertthat 0.2.1
backports 1.1.3 base 3.6.0 base64enc 0.1-3
BH 1.69.0-1 bit 1.1-14 bit64 0.9-7
bitops 1.0-6 blob 1.1.1 boot 1.3-20
brew 1.0-6 callr 3.2.0 automóvil 3.0-2
carData 3.0-2 caret 6.0-82 cellranger 1.1.0
chron 2.3-53 clase 7.3-15 cli 1.1.0
clipr 0.5.0 clisymbols 1.2.0 cluster 2.0.8
codetools 0.2-16 colorspace 1.4-1 commonmark 1.7
compiler 3.6.0 config 0,3 crayon 1.3.4
curl 3.3 data.table 1.12.0 conjuntos de datos 3.6.0
DBI 1.0.0 dbplyr 1.3.0 desc 1.2.0
devtools 2.0.1 digest 0.6.18 doMC 1.3.5
dplyr 0.8.0.1 ellipsis 0.1.0 fansi 0.4.0
forcats 0.4.0 foreach 1.4.4 foreign 0.8-71
forge 0.2.0 fs 1.2.7 gbm 2.1.5
generics 0.0.2 ggplot2 3.1.0 gh 1.0.1
git2r 0.25.2 glmnet 2.0-16 glue 1.3.1
gower 0.2.0 elementos gráficos 3.6.0 grDevices 3.6.0
grid 3.6.0 gridExtra 2.3 gsubfn 0.7
gtable 0.3.0 h2o 3.22.1.1 haven 2.1.0
hms 0.4.2 htmltools 0.3.6 htmlwidgets 1.3
httr 1.4.0 hwriter 1.3.2 hwriterPlus 1.0-3
ini 0.3.1 ipred 0.9-8 iterators 1.0.10
jsonlite 1.6 KernSmooth 2.23-15 labeling 0,3
lattice 0.20-38 lava 1.6.5 lazyeval 0.2.2
littler 0.3.7 lme4 1.1-21 lubridate 1.7.4
magrittr 1.5 mapproj 1.2.6 maps 3.3.0
maptools 0.9-5 MASS 7.3-51.1 Matriz 1.2-17
MatrixModels 0.4-1 memoise 1.1.0 methods 3.6.0
mgcv 1.8-28 mime 0.6 minqa 1.2.4
ModelMetrics 1.2.2 munsell 0.5.0 mvtnorm 1.0-10
nlme 3.1-140 nloptr 1.2.1 nnet 7.3-12
numDeriv 2016.8-1 openssl 1.3 openxlsx 4.1.0
parallel 3.6.0 pbkrtest 0.4-7 pillar 1.3.1
pkgbuild 1.0.3 pkgconfig 2.0.2 pkgKitten 0.1.4
pkgload 1.0.2 plogr 0.2.0 plyr 1.8.4
praise 1.0.0 prettyunits 1.0.2 pROC 1.14.0
processx 3.3.0 prodlim 2018.04.18 progreso 1.2.0
proto 1.0.0 ps 1.3.0 purrr 0.3.2
quantreg 5.38 R.methodsS3 1.7.1 R.oo 1.22.0
R.utils 2.8.0 r2d3 0.2.3 R6 2.4.0
randomForest 4.6-14 rappdirs 0.3.1 rcmdcheck 1.3.2
RColorBrewer 1.1-2 Rcpp 1.0.1 RcppEigen 0.3.3.5.0
RcppRoll 0.3.0 RCurl 1.95-4.12 readr 1.3.1
readxl 1.3.1 recipes 0.1.5 rematch 1.0.1
remotes 2.0.2 reshape2 1.4.3 rio 0.5.16
rlang 0.3.3 RODBC 1.3-15 roxygen2 6.1.1
rpart 4.1-15 rprojroot 1.3-2 Rserve 1.8-6
RSQLite 2.1.1 rstudioapi 0,10 scales 1.0.0
sessioninfo 1.1.1 sp 1.3-1 sparklyr 1.0.0
SparkR 2.4.4 SparseM 1.77 spatial 7.3-11
splines 3.6.0 sqldf 0.4-11 SQUAREM 2017.10-1
statmod 1.4.30 stats 3.6.0 stats4 3.6.0
stringi 1.4.3 stringr 1.4.0 survival 2.43-3
sys 3.1 tcltk 3.6.0 TeachingDemos 2,10
testthat 2.0.1 tibble 2.1.1 tidyr 0.8.3
tidyselect 0.2.5 timeDate 3043.102 tools 3.6.0
usethis 1.4.0 utf8 1.1.4 utils 3.6.0
viridisLite 0.3.0 whisker 0.3-2 withr 2.1.2
xml2 1.2.0 xopen 1.0.0 yaml 2.2.0
zip 2.0.1

Bibliotecas de Java y Scala instaladas (versión de clúster de Scala 2.11)

Identificador de grupo Identificador de artefacto Versión
antlr antlr 2.7.7
com.amazonaws amazon-kinesis-client 1.8.10
com.amazonaws aws-java-sdk-autoscaling 1.11.313
com.amazonaws aws-java-sdk-cloudformation 1.11.313
com.amazonaws aws-java-sdk-cloudfront 1.11.313
com.amazonaws aws-java-sdk-cloudhsm 1.11.313
com.amazonaws aws-java-sdk-cloudsearch 1.11.313
com.amazonaws aws-java-sdk-cloudtrail 1.11.313
com.amazonaws aws-java-sdk-cloudwatch 1.11.313
com.amazonaws aws-java-sdk-cloudwatchmetrics 1.11.313
com.amazonaws aws-java-sdk-codedeploy 1.11.313
com.amazonaws aws-java-sdk-cognitoidentity 1.11.313
com.amazonaws aws-java-sdk-cognitosync 1.11.313
com.amazonaws aws-java-sdk-config 1.11.313
com.amazonaws aws-java-sdk-core 1.11.313
com.amazonaws aws-java-sdk-datapipeline 1.11.313
com.amazonaws aws-java-sdk-directconnect 1.11.313
com.amazonaws aws-java-sdk-directory 1.11.313
com.amazonaws aws-java-sdk-dynamodb 1.11.313
com.amazonaws aws-java-sdk-ec2 1.11.313
com.amazonaws aws-java-sdk-ecs 1.11.313
com.amazonaws aws-java-sdk-efs 1.11.313
com.amazonaws aws-java-sdk-elasticache 1.11.313
com.amazonaws aws-java-sdk-elasticbeanstalk 1.11.313
com.amazonaws aws-java-sdk-elasticloadbalancing 1.11.313
com.amazonaws aws-java-sdk-elastictranscoder 1.11.313
com.amazonaws aws-java-sdk-emr 1.11.313
com.amazonaws aws-java-sdk-glacier 1.11.313
com.amazonaws aws-java-sdk-glue 1.11.313
com.amazonaws aws-java-sdk-iam 1.11.313
com.amazonaws aws-java-sdk-importexport 1.11.313
com.amazonaws aws-java-sdk-kinesis 1.11.313
com.amazonaws aws-java-sdk-kms 1.11.313
com.amazonaws aws-java-sdk-lambda 1.11.313
com.amazonaws aws-java-sdk-logs 1.11.313
com.amazonaws aws-java-sdk-machinelearning 1.11.313
com.amazonaws aws-java-sdk-opsworks 1.11.313
com.amazonaws aws-java-sdk-rds 1.11.313
com.amazonaws aws-java-sdk-redshift 1.11.313
com.amazonaws aws-java-sdk-route53 1.11.313
com.amazonaws aws-java-sdk-s3 1.11.313
com.amazonaws aws-java-sdk-ses 1.11.313
com.amazonaws aws-java-sdk-simpledb 1.11.313
com.amazonaws aws-java-sdk-simpleworkflow 1.11.313
com.amazonaws aws-java-sdk-sns 1.11.313
com.amazonaws aws-java-sdk-sqs 1.11.313
com.amazonaws aws-java-sdk-ssm 1.11.313
com.amazonaws aws-java-sdk-storagegateway 1.11.313
com.amazonaws aws-java-sdk-sts 1.11.313
com.amazonaws aws-java-sdk-support 1.11.313
com.amazonaws aws-java-sdk-swf-libraries 1.11.22
com.amazonaws aws-java-sdk-workspaces 1.11.313
com.amazonaws jmespath-java 1.11.313
com.carrotsearch hppc 0.7.2
com.chuusai shapeless_2.11 2.3.2
com.clearspring.analytics flujo 2.7.0
com.databricks Rserve 1.8-3
com.databricks dbml-local_2.11 0.5.0-db8-spark2.4
com.databricks dbml-local_2.11-tests 0.5.0-db8-spark2.4
com.databricks jets3t 0.7.1-0
com.databricks.scalapb compilerplugin_2.11 0.4.15-9
com.databricks.scalapb scalapb-runtime_2.11 0.4.15-9
com.esotericsoftware kryo-shaded 4.0.2
com.esotericsoftware minlog 1.3.0
com.fasterxml classmate 1.0.0
com.fasterxml.jackson.core jackson-annotations 2.6.7
com.fasterxml.jackson.core jackson-core 2.6.7
com.fasterxml.jackson.core jackson-databind 2.6.7.1
com.fasterxml.jackson.dataformat jackson-dataformat-cbor 2.6.7
com.fasterxml.jackson.datatype jackson-datatype-joda 2.6.7
com.fasterxml.jackson.module jackson-module-paranamer 2.6.7
com.fasterxml.jackson.module jackson-module-scala_2.11 2.6.7.1
com.github.fommil jniloader 1.1
com.github.fommil.netlib core 1.1.2
com.github.fommil.netlib native_ref-java 1.1
com.github.fommil.netlib native_ref-java-natives 1.1
com.github.fommil.netlib native_system-java 1.1
com.github.fommil.netlib native_system-java-natives 1.1
com.github.fommil.netlib netlib-native_ref-linux-x86_64-natives 1.1
com.github.fommil.netlib netlib-native_system-linux-x86_64-natives 1.1
com.github.luben zstd-jni 1.3.2-2
com.github.rwl jtransforms 2.4.0
com.google.code.findbugs jsr305 2.0.1
com.google.code.gson gson 2.2.4
com.google.guava guava 15.0
com.google.protobuf protobuf-java 2.6.1
com.googlecode.javaewah JavaEWAH 0.3.2
com.h2database h2 1.3.174
com.jcraft jsch 0.1.50
com.jolbox bonecp 0.8.0.RELEASE
com.microsoft.azure azure-data-lake-store-sdk 2.2.8
com.microsoft.azure azure-storage 5.2.0
com.microsoft.sqlserver mssql-jdbc 6.2.2.jre8
com.ning compress-lzf 1.0.3
com.sun.mail javax.mail 1.5.2
com.thoughtworks.paranamer paranamer 2.8
com.trueaccord.lenses lenses_2.11 0,3
com.twitter chill-java 0.9.3
com.twitter chill_2.11 0.9.3
com.twitter parquet-hadoop-bundle 1.6.0
com.twitter util-app_2.11 6.23.0
com.twitter util-core_2.11 6.23.0
com.twitter util-jvm_2.11 6.23.0
com.typesafe config 1.2.1
com.typesafe.scala-logging scala-logging-api_2.11 2.1.2
com.typesafe.scala-logging scala-logging-slf4j_2.11 2.1.2
com.univocity univocity-parsers 2.7.3
com.vlkan flatbuffers 1.2.0-3f79e055
com.zaxxer HikariCP 3.1.0
commons-beanutils commons-beanutils 1.9.3
commons-cli commons-cli 1.2
commons-codec commons-codec 1.10
commons-collections commons-collections 3.2.2
commons-configuration commons-configuration 1.6
commons-dbcp commons-dbcp 1.4
commons-digester commons-digester 1.8
commons-httpclient commons-httpclient 3.1
commons-io commons-io 2.4
commons-lang commons-lang 2.6
commons-logging commons-logging 1.1.3
commons-net commons-net 3.1
commons-pool commons-pool 1.5.4
info.ganglia.gmetric4j gmetric4j 1.0.7
io.airlift aircompressor 0,10
io.dropwizard.metrics metrics-core 3.1.5
io.dropwizard.metrics metrics-ganglia 3.1.5
io.dropwizard.metrics metrics-graphite 3.1.5
io.dropwizard.metrics metrics-healthchecks 3.1.5
io.dropwizard.metrics metrics-jetty9 3.1.5
io.dropwizard.metrics metrics-json 3.1.5
io.dropwizard.metrics metrics-jvm 3.1.5
io.dropwizard.metrics metrics-log4j 3.1.5
io.dropwizard.metrics metrics-servlets 3.1.5
io.netty netty 3.9.9.Final
io.netty netty-all 4.1.17.Final
javax.activation activation 1.1.1
javax.annotation javax.annotation-api 1.2
javax.el javax.el-api 2.2.4
javax.jdo jdo-api 3.0.1
javax.servlet javax.servlet-api 3.1.0
javax.servlet.jsp jsp-api 2.1
javax.transaction jta 1.1
javax.validation validation-api 1.1.0.Final
javax.ws.rs javax.ws.rs-api 2.0.1
javax.xml.bind jaxb-api 2.2.2
javax.xml.stream stax-api 1.0-2
javolution javolution 5.5.1
jline jline 2.14.6
joda-time joda-time 2.9.3
log4j apache-log4j-extras 1.2.17
log4j log4j 1.2.17
maven-trees hive-exec-with-glue hive-12679-patch_deploy
maven-trees hive-exec-with-glue hive-exec_shaded
net.hydromatic eigenbase-properties 1.1.5
net.razorvine pyrolite 4.13
net.sf.jpam jpam 1.1
net.sf.opencsv opencsv 2.3
net.sf.supercsv super-csv 2.2.0
net.snowflake snowflake-ingest-sdk 0.9.5
net.snowflake snowflake-jdbc 3.6.15
net.snowflake spark-snowflake_2.11 2.4.10-spark_2.4
net.sourceforge.f2j arpack_combined_all 0,1
org.acplt oncrpc 1.0.7
org.antlr ST4 4.0.4
org.antlr antlr-runtime 3.4
org.antlr antlr4-runtime 4,7
org.antlr stringtemplate 3.2.1
org.apache.ant ant 1.9.2
org.apache.ant ant-jsch 1.9.2
org.apache.ant ant-launcher 1.9.2
org.apache.arrow arrow-format 0.10.0
org.apache.arrow arrow-memory 0.10.0
org.apache.arrow arrow-vector 0.10.0
org.apache.avro avro 1.8.2
org.apache.avro avro-ipc 1.8.2
org.apache.avro avro-mapred-hadoop2 1.8.2
org.apache.calcite calcite-avatica 1.2.0-incubating
org.apache.calcite calcite-core 1.2.0-incubating
org.apache.calcite calcite-linq4j 1.2.0-incubating
org.apache.commons commons-compress 1.8.1
org.apache.commons commons-crypto 1.0.0
org.apache.commons commons-lang3 3,5
org.apache.commons commons-math3 3.4.1
org.apache.curator curator-client 2.7.1
org.apache.curator curator-framework 2.7.1
org.apache.curator curator-recipes 2.7.1
org.apache.derby derby 10.12.1.1
org.apache.directory.api api-asn1-api 1.0.0-M20
org.apache.directory.api api-util 1.0.0-M20
org.apache.directory.server apacheds-i18n 2.0.0-M15
org.apache.directory.server apacheds-kerberos-codec 2.0.0-M15
org.apache.hadoop hadoop-annotations 2.7.3
org.apache.hadoop hadoop-auth 2.7.3
org.apache.hadoop hadoop-client 2.7.3
org.apache.hadoop hadoop-common 2.7.3
org.apache.hadoop hadoop-hdfs 2.7.3
org.apache.hadoop hadoop-mapreduce-client-app 2.7.3
org.apache.hadoop hadoop-mapreduce-client-common 2.7.3
org.apache.hadoop hadoop-mapreduce-client-core 2.7.3
org.apache.hadoop hadoop-mapreduce-client-jobclient 2.7.3
org.apache.hadoop hadoop-mapreduce-client-shuffle 2.7.3
org.apache.hadoop hadoop-yarn-api 2.7.3
org.apache.hadoop hadoop-yarn-client 2.7.3
org.apache.hadoop hadoop-yarn-common 2.7.3
org.apache.hadoop hadoop-yarn-server-common 2.7.3
org.apache.htrace htrace-core 3.1.0-incubating
org.apache.httpcomponents httpclient 4.5.4
org.apache.httpcomponents httpcore 4.4.8
org.apache.ivy ivy 2.4.0
org.apache.orc orc-core-nohive 1.5.2
org.apache.orc orc-mapreduce-nohive 1.5.2
org.apache.orc orc-shims 1.5.2
org.apache.parquet parquet-column 1.10.1.1-databricks3
org.apache.parquet parquet-common 1.10.1.1-databricks3
org.apache.parquet parquet-encoding 1.10.1.1-databricks3
org.apache.parquet parquet-format 2.4.0
org.apache.parquet parquet-hadoop 1.10.1.1-databricks3
org.apache.parquet parquet-jackson 1.10.1.1-databricks3
org.apache.thrift libfb303 0.9.3
org.apache.thrift libthrift 0.9.3
org.apache.xbean xbean-asm6-shaded 4.8
org.apache.zookeeper zookeeper 3.4.6
org.codehaus.jackson jackson-core-asl 1.9.13
org.codehaus.jackson jackson-jaxrs 1.9.13
org.codehaus.jackson jackson-mapper-asl 1.9.13
org.codehaus.jackson jackson-xc 1.9.13
org.codehaus.janino commons-compiler 3.0.10
org.codehaus.janino janino 3.0.10
org.datanucleus datanucleus-api-jdo 3.2.6
org.datanucleus datanucleus-core 3.2.10
org.datanucleus datanucleus-rdbms 3.2.9
org.eclipse.jetty jetty-client 9.3.20.v20170531
org.eclipse.jetty jetty-continuation 9.3.20.v20170531
org.eclipse.jetty jetty-http 9.3.20.v20170531
org.eclipse.jetty jetty-io 9.3.20.v20170531
org.eclipse.jetty jetty-jndi 9.3.20.v20170531
org.eclipse.jetty jetty-plus 9.3.20.v20170531
org.eclipse.jetty jetty-proxy 9.3.20.v20170531
org.eclipse.jetty jetty-security 9.3.20.v20170531
org.eclipse.jetty jetty-server 9.3.20.v20170531
org.eclipse.jetty jetty-servlet 9.3.20.v20170531
org.eclipse.jetty jetty-servlets 9.3.20.v20170531
org.eclipse.jetty jetty-util 9.3.20.v20170531
org.eclipse.jetty jetty-webapp 9.3.20.v20170531
org.eclipse.jetty jetty-xml 9.3.20.v20170531
org.fusesource.leveldbjni leveldbjni-all 1.8
org.glassfish.hk2 hk2-api 2.4.0-b34
org.glassfish.hk2 hk2-locator 2.4.0-b34
org.glassfish.hk2 hk2-utils 2.4.0-b34
org.glassfish.hk2 osgi-resource-locator 1.0.1
org.glassfish.hk2.external aopalliance-repackaged 2.4.0-b34
org.glassfish.hk2.external javax.inject 2.4.0-b34
org.glassfish.jersey.bundles.repackaged jersey-guava 2.22.2
org.glassfish.jersey.containers jersey-container-servlet 2.22.2
org.glassfish.jersey.containers jersey-container-servlet-core 2.22.2
org.glassfish.jersey.core jersey-client 2.22.2
org.glassfish.jersey.core jersey-common 2.22.2
org.glassfish.jersey.core jersey-server 2.22.2
org.glassfish.jersey.media jersey-media-jaxb 2.22.2
org.hibernate hibernate-validator 5.1.1.Final
org.iq80.snappy snappy 0,2
org.javassist javassist 3.18.1-GA
org.jboss.logging jboss-logging 3.1.3.GA
org.jdbi jdbi 2.63.1
org.joda joda-convert 1.7
org.jodd jodd-core 3.5.2
org.json4s json4s-ast_2.11 3.5.3
org.json4s json4s-core_2.11 3.5.3
org.json4s json4s-jackson_2.11 3.5.3
org.json4s json4s-scalap_2.11 3.5.3
org.lz4 lz4-java 1.4.0
org.mariadb.jdbc mariadb-java-client 2.1.2
org.mockito mockito-all 1.9.5
org.objenesis objenesis 2.5.1
org.postgresql postgresql 42.1.4
org.roaringbitmap RoaringBitmap 0.7.45
org.roaringbitmap shims 0.7.45
org.rocksdb rocksdbjni 5.2.1
org.rosuda.REngine REngine 2.1.0
org.scala-lang scala-compiler_2.11 2.11.12
org.scala-lang scala-library_2.11 2.11.12
org.scala-lang scala-reflect_2.11 2.11.12
org.scala-lang.modules scala-parser-combinators_2.11 1.1.0
org.scala-lang.modules scala-xml_2.11 1.0.5
org.scala-sbt test-interface 1,0
org.scalacheck scalacheck_2.11 1.12.5
org.scalactic scalactic_2.11 3.0.3
org.scalanlp breeze-macros_2.11 0.13.2
org.scalanlp breeze_2.11 0.13.2
org.scalatest scalatest_2.11 3.0.3
org.slf4j jcl-over-slf4j 1.7.16
org.slf4j jul-to-slf4j 1.7.16
org.slf4j slf4j-api 1.7.16
org.slf4j slf4j-log4j12 1.7.16
org.spark-project.hive hive-beeline 1.2.1.spark2
org.spark-project.hive hive-cli 1.2.1.spark2
org.spark-project.hive hive-jdbc 1.2.1.spark2
org.spark-project.hive hive-metastore 1.2.1.spark2
org.spark-project.spark unused 1.0.0
org.spire-math spire-macros_2.11 0.13.0
org.spire-math spire_2.11 0.13.0
org.springframework spring-core 4.1.4.RELEASE
org.springframework spring-test 4.1.4.RELEASE
org.tukaani xz 1.5
org.typelevel machinist_2.11 0.6.1
org.typelevel macro-compat_2.11 1.1.1
org.xerial sqlite-jdbc 3.8.11.2
org.xerial.snappy snappy-java 1.1.7.3
org.yaml snakeyaml 1.16
oro oro 2.0.8
software.amazon.ion ion-java 1.0.2
stax stax-api 1.0.1
xmlenc xmlenc 0,52