Databricks Runtime 12.1 (sin soporte técnico)

Artículo
03/01/2024

En las siguientes notas de la versión, se proporciona información sobre el componente Databricks Runtime 12.1, con tecnología de Apache Spark 3.3.1.

Databricks ha publicado estas imágenes en enero de 2023.

Nuevas características y mejoras

Características de tablas de Delta Lake compatibles con la administración de protocolos
La E/S predictiva para las actualizaciones está en versión preliminar pública
Explorador de catálogo ya está disponible para todos los roles
Compatibilidad con varios operadores con estado en una sola consulta de streaming
La compatibilidad con búferes de protocolo está en versión preliminar pública.
Compatibilidad con la autenticación del registro de esquema de Confluent
Compatibilidad con el historial de tablas compartidas con recursos compartidos de Delta Sharing
Compatibilidad de streaming con recursos compartidos de Delta Sharing
La versión de tabla que usa la marca de tiempo ahora se admite para las tablas de uso compartido de Delta en catálogos
Compatibilidad con WHEN NOT MATCHED BY SOURCE para MERGE INTO
Recopilación de estadísticas optimizada para CONVERT TO DELTA
Soporte de Unity Catalog para deshacer tablas

Características de tablas de Delta Lake compatibles con la administración de protocolos

Azure Databricks ha introducido la compatibilidad con las características de tabla de Delta Lake, que presentan marcas pormenorizadas que especifican qué características son compatibles con una tabla determinada. Consulte ¿Cómo administra Azure Databricks la compatibilidad de características de Delta Lake?.

La E/S predictiva para actualizaciones está en versión preliminar pública

La E/S predictiva ahora acelera las operaciones DELETE, MERGE y UPDATE para las tablas Delta con vectores de eliminación habilitados en el proceso habilitado para Photon. Consulte ¿Qué es la E/S predictiva?.

Explorador de catálogo ya está disponible para todos los roles

Explorador de catálogo ya está disponible para todos los roles de Azure Databricks al usar Databricks Runtime 7.3 LTS y versiones posteriores.

Compatibilidad con varios operadores con estado en una sola consulta de streaming

Los usuarios ahora pueden encadenar operadores con estado con el modo de anexión en consultas de streaming. No todos los operadores son totalmente compatibles. Conectar al intervalo de tiempo de secuencia-secuencia y flatMapGroupsWithState no permite que otros operadores con estado se encadenen.

La compatibilidad con búferes de protocolo está en versión preliminar pública.

Puede usar las funciones from_protobuf y to_protobuf para intercambiar datos entre tipos binarios y struct. Consulte Búferes de protocolo de lectura y escritura.

Compatibilidad con la autenticación del registro de esquema de Confluent

La integración de Azure Databricks con Confluent Schema Registry ahora admite direcciones externas del registro de esquema con autenticación. Esta característica está disponible para las funciones from_avro, to_avro, from_protobufy to_protobuf. Consulte Protobuf o Avro.

Ahora es posible compartir una tabla con historial completo mediante Delta Sharing, lo que permite a los destinatarios realizar consultas de viaje en el tiempo y consultar tablas mediante el flujo estructurado de Spark. WITH HISTORY se recomienda en lugar de CHANGE DATA FEED, aunque este último sigue siendo compatible. Consulte ALTER SHARE y Agregar tablas a un recurso compartido.

El flujo estructurado de Spark ahora funciona con el formato deltasharing en tablas Delta Sharing de origen que se hayan compartido mediante WITH HISTORY.

Ahora puede usar la sintaxis SQL TIMESTAMP AS OF en instrucciones SELECT para especificar la versión de una tabla Delta Sharing montada en un catálogo. Las tablas deben compartirse mediante WITH HISTORY.

Compatibilidad con WHEN NOT MATCHED BY SOURCE para MERGE INTO

Ahora puede agregar cláusulas WHEN NOT MATCHED BY SOURCE a MERGE INTO para actualizar o eliminar filas de la tabla elegida que no tienen coincidencias en la tabla de origen en función de la condición de combinación. La nueva cláusula está disponible en SQL, Python, Scala y Java. Consulte MERGE INTO.

Recopilación de estadísticas optimizada para CONVERT TO DELTA

La recopilación de estadísticas de la operación CONVERT TO DELTA ahora es mucho más rápida. Esto reduce el número de cargas de trabajo que pueden usar NO STATISTICS para mejorar la eficacia.

Soporte de Unity Catalog para deshacer tablas

Esta función se lanzó inicialmente en la versión preliminar pública. Es GA a partir del 25 de octubre de 2023.

Ahora puede no quitar una tabla externa o administrada eliminada en un esquema existente en un plazo de siete días después de quitarla. Consulte UNDROP TABLE y SHOW TABLES DROPPED.

Actualizaciones de bibliotecas

Bibliotecas de Python actualizadas:
- filelock: de 3.8.0 a 3.8.2
- platformdirs: de 2.5.4 a 2.6.0
- setuptools: de 58.0.4 a 61.2.0
Bibliotecas de R actualizadas:
Bibliotecas de Java actualizadas:
- io.delta.delta-sharing-spark_2.12: de 0.5.2 a 0.6.2
- org.apache.hive.hive-storage-api: de 2.7.2 a 2.8.1
- org.apache.parquet.parquet-column: de 1.12.3-databricks-0001 a 1.12.3-databricks-0002
- org.apache.parquet.parquet-common: de 1.12.3-databricks-0001 a 1.12.3-databricks-0002
- org.apache.parquet.parquet-encoding: de 1.12.3-databricks-0001 a 1.12.3-databricks-0002
- org.apache.parquet.parquet-format-structures: de 1.12.3-databricks-0001 a 1.12.3-databricks-0002
- org.apache.parquet.parquet-hadoop: de 1.12.3-databricks-0001 a 1.12.3-databricks-0002
- org.apache.parquet.parquet-jackson: de 1.12.3-databricks-0001 a 1.12.3-databricks-0002
- org.tukaani.xz: de 1.8 a 1.9

Apache Spark

Databricks Runtime 12.1 incluye Apache Spark 3.3.1. Esta versión incluye todas las mejoras y correcciones de Spark incluidas en Databricks Runtime 12.0 (sin soporte técnico), junto con las siguientes mejoras y correcciones de errores adicionales que se han realizado en Spark:

[SPARK-41405] [SC-119769][12.1.0] Revertir "[SC-119411][SQL] Centralizar la lógica de resolución de columnas" y "[SC-117170][SPARK-41338][SQL] Resolver referencias externas y columnas normales en el mismo lote del analizador"
[SPARK-41405] [SC-119411][SQL] Centralizar la lógica de resolución de columnas
[SPARK-41859] [SC-119514][SQL] CreateHiveTableAsSelectCommand debe establecer correctamente la marca de sobrescritura
[SPARK-41659] [SC-119526][CONNECT][12.X] Habilitar doctests en pyspark.sql.connect.readwriter
[SPARK-41858] [SC-119427][SQL] Corrección de la regresión de perf del lector ORC debido a la característica de valor DEFAULT
[SPARK-41807] [SC-119399][CORE] Quitar la clase de error no existente: UNSUPPORTED_FEATURE. DISTRIBUTE_BY
[SPARK-41578] [12.x][SC-119273][SQL] Asignar nombre a _LEGACY_ERROR_TEMP_2141
[SPARK-41571] [119362.x][SC-119273][SQL] Asignar nombre a _LEGACY_ERROR_TEMP_2310
[SPARK-41810] [SC-119373][CONNECT] Inferir nombres de una lista de diccionarios en SparkSession.createDataFrame
[SPARK-40993] [SC-119504][SPARK-41705][CONNECT][12.X] Traslado de documentación y script de Spark Connect a la documentación de desarrollo y Python
[SPARK-41534] [SC-119456][CONNECT][SQL][12.x] Instalación del módulo de cliente inicial para Spark Connect
[SPARK-41365] [SC-118498][UI][3.3] La página de interfaz de usuario de fases no se puede cargar para el proxy en un entorno específico de yarn
[SPARK-41481] [SC-118150][CORE][SQL] Reutilizar INVALID_TYPED_LITERAL en lugar de _LEGACY_ERROR_TEMP_0020
[SPARK-41049] [SC-119305][SQL] Volver a consultar el control de expresiones con estado
[SPARK-41726] [SC-119248][SQL] Quitar OptimizedCreateHiveTableAsSelectCommand
[SPARK-41271] [SC-118648][SC-118348][SQL] Admite consultas SQL parametrizadas por sql()
[SPARK-41066] [SC-119344][CONNECT][PYTHON] Implementar DataFrame.sampleBy y DataFrame.stat.sampleBy
[SPARK-41407] [SC-119402][SC-119012][SQL][ALL TESTS] Extraer escritura v1 en WriteFiles
[SPARK-41565] [SC-118868][SQL] Incorporación de la clase de error UNRESOLVED_ROUTINE
[SPARK-41668] [SC-118925][SQL] La función DECODE devuelve resultados incorrectos cuando se pasa NULL
[SPARK-41554] [ SC-119274] corregir el cambio de escala decimal cuando la escala disminuye en m...
[SPARK-41065] [SC-119324][CONNECT][PYTHON] Implementar DataFrame.freqItems y DataFrame.stat.freqItems
[SPARK-41742] [SC-119404][SPARK-41745][CONNECT][12.X] Volver a activar las pruebas documentales y añadir el alias de columna que falta al recuento()
[SPARK-41069] [SC-119310][CONNECT][PYTHON] Implementar DataFrame.approxQuantile y DataFrame.stat.approxQuantile
[SPARK-41809] [SC-119367][CONNECT][PYTHON] Hacer que la función from_json admita DataType Schema
[SPARK-41804] [SC-119382][SQL] Elija el tamaño correcto del elemento en InterpretedUnsafeProjection para la matriz de UDT
[SPARK-41786] [SC-119308][CONNECT][PYTHON] Desduplicar funciones auxiliares
[SPARK-41745] [SC-119378][SPARK-41789][12.X] Hacer que createDataFrame admita la lista de filas
[SPARK-41344] [SC-119217][SQL] Haga que el error sea más claro cuando la tabla no se encuentra en el catálogo SupportsCatalogOptions
[SPARK-41803] [SC-119380][CONNECT][PYTHON] Agregar función que falta log(arg1, arg2)
[SPARK-41808] [SC-119356][CONNECT][PYTHON] Hacer que las funciones JSON admitan opciones
[SPARK-41779] [SC-119275][SPARK-41771][CONNECT][PYTHON] Hacer que __getitem__ admita el filtro y seleccionar
[SPARK-41783] [SC-119288][SPARK-41770][CONNECT][PYTHON] Hacer que la columna op admita None
[SPARK-41440] [SC-119279][CONNECT][PYTHON] Evitar el operador de caché para el ejemplo general.
[SPARK-41785] [SC-119290][CONNECT][PYTHON] Implementar GroupedData.mean
[SPARK-41629] [SC-119276][CONNECT] Compatibilidad con extensiones de protocolo en relación y expresión
[SPARK-41417] [SC-118000][CORE][SQL] Cambiar el nombre _LEGACY_ERROR_TEMP_0019 a INVALID_TYPED_LITERAL
[SPARK-41533] [SC-119342][CONNECT][12.X] Control de errores adecuado para Spark Connect Server / Cliente
[SPARK-41292] [SC-119357][CONNECT][12.X] Ventana de compatibilidad en el espacio de nombres pyspark.sql.window
[SPARK-41493] [SC-119339][CONNECT][PYTHON] Hacer que las funciones csv admitan opciones
[SPARK-39591] [SC-118675][SS] Seguimiento de progreso asincrónico
[SPARK-41767] [SC-119337][CONNECT][PYTHON] [12.X] Implementar Column.{withField, dropFields}
[SPARK-41068] [SC-119268][CONNECT][PYTHON] Implementar DataFrame.stat.corr
[SPARK-41655] [SC-119323][CONNECT][12.X] Habilitar doctests en pyspark.sql.connect.column
[SPARK-41738] [SC-119170][CONNECT] Mezclar ClientId en caché SparkSession
[SPARK-41354] [SC-119194][CONNECT] Agregar RepartitionByExpression a proto
[SPARK-41784] [SC-119289][CONNECT][PYTHON] Agregar función que falta __rmod__ en Columna
[SPARK-41778] [SC-119262][SQL] Agregar un alias "reducir" a ArrayAggregate
[SPARK-41067] [SC-119171][CONNECT][PYTHON] Implementar DataFrame.stat.cov
[SPARK-41764] [SC-119216][CONNECT][PYTHON] Hacer que el nombre de operación de cadena interna sea coherente con FunctionRegistry
[SPARK-41734] [SC-119160][CONNECT] Agregar un mensaje primario para el catálogo
[SPARK-41742] [SC-119263] Admitir df.groupBy().agg({“*”:”count”})
[SPARK-41761] [SC-119213][CONNECT][PYTHON] Corrección de operaciones aritméticas: __neg__, __pow__, __rpow__
[SPARK-41062] [SC-118182][SQL] Cambiar el nombre UNSUPPORTED_CORRELATED_REFERENCE a CORRELATED_REFERENCE
[SPARK-41751] [SC-119211][CONNECT][PYTHON] Corregir Column.{isNull, isNotNull, eqNullSafe}
[SPARK-41728] [SC-119164][CONNECT][PYTHON] [12.X] Implementar la función unwrap_udt
[SPARK-41333] [SC-119195][SPARK-41737] Implementar GroupedData.{min, max, avg, sum}
[SPARK-41751] [SC-119206][CONNECT][PYTHON] Corregir Column.{bitwiseAND, bitwiseOR, bitwiseXOR}
[SPARK-41631] [SC-101081][SQL] Admite la resolución implícita de alias de columna lateral en Agregado
[SPARK-41529] [SC-119207][CONNECT][12.X] Implementar SparkSession.stop
[SPARK-41729] [SC-119205][CORE][SQL][12.X] Cambiar el nombre _LEGACY_ERROR_TEMP_0011 a UNSUPPORTED_FEATURE.COMBINATION_QUERY_RESULT_CLAUSES
[SPARK-41717] [SC-119078][CONNECT][12.X] Desduplicar impresión y repr_html en LogicalPlan
[SPARK-41740] [SC-119169][CONNECT][PYTHON] Implementar Column.name
[SPARK-41733] [SC-119163][SQL][SS] Aplicar la eliminación basada en patrones de árbol para la regla ResolveWindowTime
[SPARK-41732] [SC-119157][SQL][SS] Aplicar la eliminación basada en patrones de árbol para la regla SessionWindowing
[SPARK-41498] [SC-119018] Propagación de metadatos a través de Union
[SPARK-41731] [SC-119166][CONNECT][PYTHON][12.X] Implementar el descriptor de acceso de columna
[SPARK-41736] [SC-119161][CONNECT][PYTHON] pyspark_types_to_proto_types debe admitir ArrayType
[SPARK-41473] [SC-119092][CONNECT][PYTHON] Implementar la función format_number
[SPARK-41707] [SC-119141][CONNECT][12.X] Implementación de la API de catálogo en Spark Connect
[SPARK-41710] [SC-119062][CONNECT][PYTHON] Implementar Column.between
[SPARK-41235] [SC-119088][SQL][PYTHON]Función de orden superior: implementación de array_compact
[SPARK-41518] [SC-118453][SQL] Asignar un nombre a la clase de error _LEGACY_ERROR_TEMP_2422
[SPARK-41723] [SC-119091][CONNECT][PYTHON] Implementar la función sequence
[SPARK-41703] [SC-119060][CONNECT][PYTHON] Combine NullType y typed_null en literal
[SPARK-41722] [SC-119090][CONNECT][PYTHON] Implementar tres funciones de ventana de tiempo que faltan
[SPARK-41503] [SC-119043][CONNECT][PYTHON] Implementar funciones de transformación de partición
[SPARK-41413] [SC-118968][SQL] Evitar orden aleatorio en Storage-Partitioned Join cuando las claves de partición no coinciden, pero las expresiones de combinación son compatibles
[SPARK-41700] [SC-119046][CONNECT][PYTHON] Quitar FunctionBuilder
[SPARK-41706] [SC-119094][CONNECT][PYTHON] pyspark_types_to_proto_types debe admitir MapType
[SPARK-41702] [SC-119049][CONNECT][PYTHON] Agregar operaciones de columna no válidas
[SPARK-41660] [SC-118866][SQL] Solo propaga columnas de metadatos si se usan
[SPARK-41637] [SC-119003][SQL] ORDER BY ALL
[SPARK-41513] [SC-118945][SQL] Implementación de un acumulador para recopilar métricas de recuento de filas por asignador
[SPARK-41647] [SC-119064][CONNECT][12.X] Desduplicar docstrings en pyspark.sql.connect.functions
[SPARK-41701] [SC-119048][SPARK-41770][CONNECT][PYTHON] Hacer que la columna op admita decimal
[SPARK-41383] [SC-119015][SPARK-41692][SPARK-41693] Implementar rollup, cube y pivot
[SPARK-41635] [SC-118944][SQL] GROUP BY ALL
[SPARK-41645] [SC-119057][CONNECT][12.X] Desduplicar docstrings en pyspark.sql.connect.dataframe
[SPARK-41688] [SC-118951][CONNECT][PYTHON] Mover expresiones a expressions.py
[SPARK-41687] [SC-118949][CONNECT] Desduplicar docstrings en pyspark.sql.connect.group
[SPARK-41649] [SC-118950][CONNECT] Desduplicar docstrings en pyspark.sql.connect.window
[SPARK-41681] [SC-118939][CONNECT] Factor GroupedData out para group.py
[SPARK-41292] [SC-119038][SPARK-41640][SPARK-41641][CONNECT][PYTHON][12.X] Implementar funciones Window
[SPARK-41675] [SC-119031][SC-118934][CONNECT][PYTHON][12.X] Hacer que la columna op admita datetime
[SPARK-41672] [SC-118929][CONNECT][PYTHON] Habilitar las funciones en desuso
[SPARK-41673] [SC-118932][CONNECT][PYTHON] Implementar Column.astype
[SPARK-41364] [SC-118865][CONNECT][PYTHON] Implementar la función broadcast
[SPARK-41648] [SC-118914][CONNECT][12.X] Desduplicar docstrings en pyspark.sql.connect.readwriter
[SPARK-41646] [SC-118915][CONNECT][12.X] Desduplicar docstrings en pyspark.sql.connect.session
[SPARK-41643] [SC-118862][CONNECT][12.X] Desduplicar docstrings en pyspark.sql.connect.column
[SPARK-41663] [SC-118936][CONNECT][PYTHON][12.X] Implementar el resto de funciones lambda
[SPARK-41441] [SC-118557][SQL] Compatibilidad con generar sin ninguna salida secundaria necesaria para hospedar referencias externas
[SPARK-41669] [SC-118923][SQL] Eliminación temprana en canCollapseExpressions
[SPARK-41639] [SC-118927][SQL][PROTOBUF] : Quitar ScalaReflectionLock de SchemaConverters
[SPARK-41464] [SC-118861][CONNECT][PYTHON] Implementar DataFrame.to
[SPARK-41434] [SC-118857][CONNECT][PYTHON] Implementación inicial LambdaFunction
[SPARK-41539] [SC-118802][SQL] Reasignar estadísticas y restricciones frente a la salida en el plan lógico para LogicalRDD
[SPARK-41396] [SC-118786][SQL][PROTOBUF] Compatibilidad con campos OneOf y comprobaciones de recursividad
[SPARK-41528] [SC-118769][CONNECT][12.X] Combinar espacio de nombres de Spark Connect y PySpark API
[SPARK-41568] [118715.x][SC-119273][SQL] Asignar nombre a _LEGACY_ERROR_TEMP_1236
[SPARK-41440] [SC-118788][CONNECT][PYTHON] Implementar DataFrame.randomSplit
[SPARK-41583] [SC-118718][SC-118642][CONNECT][PROTOBUF] Agregar Spark Connect y protobuf en setup.py con la especificación de dependencias
[SPARK-27561] [SC-101081][12.x][SQL] Admite la resolución implícita de alias de columna lateral en Proyecto
[SPARK-41535] [SC-118645][SQL] Establecer null correctamente para los campos de intervalo de calendario en InterpretedUnsafeProjection y InterpretedMutableProjection
[SPARK-40687] [SC-118439][SQL] Compatibilidad con función integrada de enmascaramiento de datos 'mask'
[SPARK-41520] [SC-118440][SQL] Dividir AND_OR TreePattern para separar AND y OR TreePatterns
[SPARK-41349] [SC-118668][CONNECT][PYTHON] Implementar DataFrame.hint
[SPARK-41546] [SC-118541][CONNECT][PYTHON] pyspark_types_to_proto_types debe admitir StructType.
[SPARK-41334] [SC-118549][CONNECT][PYTHON] Traslado de proto SortOrder de relaciones a expresiones
[SPARK-41387] [SC-118450][SS] Aserción del desplazamiento final actual desde el origen de datos de Kafka para Trigger.AvailableNow
[SPARK-41508] [SC-118445][CORE][SQL] Cambiar el nombre _LEGACY_ERROR_TEMP_1180 a UNEXPECTED_INPUT_TYPE y quitar _LEGACY_ERROR_TEMP_1179
[SPARK-41319] [SC-118441][CONNECT][PYTHON] Implementar Column.{when, otherwise} y Function when con UnresolvedFunction
[SPARK-41541] [SC-118460][SQL] Corrección de la llamada al método secundario incorrecto en SQLShuffleWriteMetricsReporter.decRecordsWritten()
[SPARK-41453] [SC-118458][CONNECT][PYTHON] Implementar DataFrame.subtract
[SPARK-41248] [SC-118436][SC-118303][SQL] Agregue "spark.sql.json.enablePartialResults" para habilitar o deshabilitar resultados parciales JSON.
[SPARK-41437] Revertir "[SC-117601][SQL] No optimice la consulta de entrada dos veces para la reserva de escritura v1".
[SPARK-41472] [SC-118352][CONNECT][PYTHON] Implementación del resto de funciones binarias o de cadena
[SPARK-41526] [SC-118355][CONNECT][PYTHON] Implementar Column.isin
[SPARK-32170] [SC-118384] [CORE] Mejore la especulación mediante las métricas de tareas de fase.
[SPARK-41524] [SC-118399][SS] Diferenciar SQLConf y extraOptions en StateStoreConf para su uso en RocksDBConf
[SPARK-41465] [SC-118381][SQL] Asignar un nombre a la clase de error _LEGACY_ERROR_TEMP_1235
[SPARK-41511] [SC-118365][SQL] LongToUnsafeRowMap admite ignoresDuplicatedKey
[SPARK-41409] [SC-118302][CORE][SQL] Cambiar el nombre _LEGACY_ERROR_TEMP_1043 a WRONG_NUM_ARGS.WITHOUT_SUGGESTION
[SPARK-41438] [SC-118344][CONNECT][PYTHON] Implementar DataFrame.colRegex
[SPARK-41437] [SC-117601][SQL] No optimice la consulta de entrada dos veces para la reserva de escritura v1
[SPARK-41314] [SC-117172][SQL] Asignar un nombre a la clase de error _LEGACY_ERROR_TEMP_1094
[SPARK-41443] [SC-118004][SQL] Asignar un nombre a la clase de error _LEGACY_ERROR_TEMP_1061
[SPARK-41506] [SC-118241][CONNECT][PYTHON] Refactorizar LiteralExpression para admitir DataType
[SPARK-41448] [SC-118046] Convertir identificadores de trabajo de MR coherentes en FileBatchWriter y FileFormatWriter
[SPARK-41456] [SC-117970][SQL] Mejorar el rendimiento de try_cast
[SPARK-41495] [SC-118125][CONNECT][PYTHON] Implementar las funciones collection: P~Z
[SPARK-41478] [SC-118167][SQL] Asignar un nombre a la clase de error _LEGACY_ERROR_TEMP_1234
[SPARK-41406] [SC-118161][SQL] Mensaje de error de refactorización para NUM_COLUMNS_MISMATCH que sea más genérico
[SPARK-41404] [SC-118016][SQL] Refactorizar ColumnVectorUtils#toBatch para hacer que la prueba ColumnarBatchSuite#testRandomRows sea más primitiva dataType
[SPARK-41468] [SC-118044][SQL] Corregir el control PlanExpression en EquivalentExpressions
[SPARK-40775] [SC-118045][SQL] Corrección de entradas de descripción duplicadas para exámenes de archivos V2
[SPARK-41492] [SC-118042][CONNECT][PYTHON] Implementar las funciones MISC
[SPARK-41459] [SC-118005][SQL] La corrección de la salida del registro de operaciones del servidor thrift está vacía
[SPARK-41395] [SC-117899][SQL] InterpretedMutableProjection debe usar setDecimal para establecer valores NULL para decimales en una fila no segura
[SPARK-41376] [SC-117840][CORE][3.3] Corrección de la lógica de comprobación de Netty preferDirectBufs al iniciar el ejecutor
[SPARK-41484] [SC-118159][SC-118036][CONNECT][PYTHON][12.x] Implementar las funciones collection: E~M
[SPARK-41389] [SC-117426][CORE][SQL] Reutilizar WRONG_NUM_ARGS en lugar de _LEGACY_ERROR_TEMP_1044
[SPARK-41462] [SC-117920][SQL] El tipo de fecha y marca de tiempo puede convertirse a TimestampNTZ
[SPARK-41435] [SC-117810][SQL] Cambiar para llamar a invalidFunctionArgumentsError para curdate() cuando expressions no está vacío
[SPARK-41187] [SC-118030][CORE] LiveExecutor MemoryLeak en AppStatusListener cuando se produce ExecutorLost
[SPARK-41360] [SC-118083][CORE] Evitar el nuevo registro de BlockManager si se ha perdido el ejecutor
[SPARK-41378] [SC-117686][SQL] Admitir estadísticas de columna en DS v2
[SPARK-41402] [SC-117910][SQL][CONNECT][12.X] Invalidar prettyName de StringDecode
[SPARK-41414] [SC-118041][CONNECT][PYTHON][12.x] Implementar funciones de fecha/marca de tiempo
[SPARK-41329] [SC-117975][CONNECT] Resolver importaciones circulares en Spark Connect
[SPARK-41477] [SC-118025][CONNECT][PYTHON] Inferir correctamente el tipo de datos de enteros literales
[SPARK-41446] [SC-118024][CONNECT][PYTHON][12.x] Hacer que createDataFrame admita el esquema y más tipos de conjuntos de datos de entrada
[SPARK-41475] [SC-117997][CONNECT] Corregir error de comando lint-scala y error tipográfico
[SPARK-38277] [SC-117799][SS] Borrar lote de escritura después de la confirmación del almacén de estado de RocksDB
[SPARK-41375] [SC-117801][SS] Evitar que kafkaSourceOffset esté vacío
[SPARK-41412] [SC-118015][CONNECT] Implementar Column.cast
[SPARK-41439] [SC-117893][CONNECT][PYTHON] Implementar DataFrame.melt y DataFrame.unpivot
[SPARK-41399] [SC-118007][SC-117474][CONNECT] Refactorizar pruebas relacionadas con columnas para test_connect_column
[SPARK-41351] [SC-117957][SC-117412][CONNECT][12.x] Column debe admitir el operador !=
[SPARK-40697] [SC-117806][SC-112787][SQL] Agregar relleno de caracteres de lectura para cubrir archivos de datos externos
[SPARK-41349] [SC-117594][CONNECT][12.X] Implementar DataFrame.hint
[SPARK-41338] [SC-117170][SQL] Resolución de referencias externas y columnas normales en el mismo lote del analizador
[SPARK-41436] [SC-117805][CONNECT][PYTHON] Implementar las funciones collection: A~C
[SPARK-41445] [SC-117802][CONNECT] Implementar DataFrameReader.parquet
[SPARK-41452] [SC-117865][SQL] to_char debe devolver NULL cuando el formato sea NULL
[SPARK-41444] [SC-117796][CONNECT] Compatibilidad con read.json()
[SPARK-41398] [SC-117508][SQL] Relajar restricciones en Storage-Partitioned Join cuando las claves de partición después del filtrado en tiempo de ejecución no coinciden
[SPARK-41228] [SC-117169][SQL] Cambiar el nombre y mejorar el mensaje de error para COLUMN_NOT_IN_GROUP_BY_CLAUSE.
[SPARK-41381] [SC-117593][CONNECT][PYTHON] Implementar las funciones count_distinct y sum_distinct
[SPARK-41433] [SC-117596][CONNECT] Hacer configurable Max Arrow BatchSize
[SPARK-41397] [SC-117590][CONNECT][PYTHON] Implementar parte de las funciones binarias o de cadena
[SPARK-41382] [SC-117588][CONNECT][PYTHON] Implementar la función product
[SPARK-41403] [SC-117595][CONNECT][PYTHON] Implementar DataFrame.describe
[SPARK-41366] [ SC-117580][CONNECT] DF.groupby.agg() debe ser compatible
[SPARK-41369] [SC-117584][CONNECT] Agregar conexión comun a jar sombreado dle servidor
[SPARK-41411] [ SC-117562][SS] Corrección de errores de compatibilidad de marcas de agua del operador con varios estados
[SPARK-41176] [SC-116630][SQL] Asignar un nombre a la clase de error _LEGACY_ERROR_TEMP_1042
[SPARK-41380] [SC-117476][CONNECT][PYTHON][12.X] Implementar las funciones de agregación
[SPARK-41363] [SC-117470][CONNECT][PYTHON][12.X] Implementar las funciones normales
[SPARK-41305] [SC-117411][CONNECT] Mejorar la documentación para el proto del comando
[SPARK-41372] [SC-117427][CONNECT][PYTHON] Implementar DataFrame TempView
[SPARK-41379] [SC-117420][SS][PYTHON] Proporcionar una sesión de Spark clonada en DataFrame en la función de usuario para el receptor foreachBatch en PySpark
[SPARK-41373] [SC-117405][SQL][ERROR] Cambiar el nombre de CAST_WITH_FUN_SUGGESTION por CAST_WITH_FUNC_SUGGESTION
[SPARK-41358] [SC-117417][SQL] Refactorizar método ColumnVectorUtils#populate para usar PhysicalDataType en lugar de DataType
[SPARK-41355] [SC-117423][SQL] Solución del problema de validación del nombre de la tabla de subárbol
[SPARK-41390] [SC-117429][SQL] Actualizar el script usado para generar la función register en UDFRegistration
[SPARK-41206] [SC-117233][SC-116381][SQL] Cambiar el nombre de la clase de error _LEGACY_ERROR_TEMP_1233 a COLUMN_ALREADY_EXISTS
[SPARK-41357] [SC-117310][CONNECT][PYTHON][12.X] Implementar funciones matemáticas
[SPARK-40970] [SC-117308][CONNECT][PYTHON] Admitir List[Column] para Join's en argumento
[SPARK-41345] [SC-117178][CONNECT] Agregar sugerencia para conectar Proto
[SPARK-41226] [SC-117194][SQL][12.x] Refactorizar tipos de Spark mediante la introducción de tipos físicos
[SPARK-41317] [SC-116902][CONNECT][PYTHON][12.X] Agregar compatibilidad básica con DataFrameWriter
[SPARK-41347] [SC-117173][CONNECT] Agregar conversión a la expresión proto
[SPARK-41323] [SC-117128][SQL] Admitir current_schema
[SPARK-41339] [SC-117171][SQL] Cerrar y volver a crear el lote de escritura de RocksDB en lugar de simplemente borrar
[SPARK-41227] [SC-117165][CONNECT][PYTHON] Implementar combinación cruzada de DataFrame
[SPARK-41346] [SC-117176][CONNECT][PYTHON] Implementar las funciones asc y desc
[SPARK-41343] [SC-117166][CONNECT] Mover el análisis de FunctionName al lado servidor
[SPARK-41321] [SC-117163][CONNECT] Admitir campo de destino para UnresolvedStar
[SPARK-41237] [SC-117167][SQL] Reutilizar la clase de error UNSUPPORTED_DATATYPE para _LEGACY_ERROR_TEMP_0030
[SPARK-41309] [SC-116916][CORE][SQL] Reutilizar INVALID_SCHEMA.NON_STRING_LITERAL en lugar de _LEGACY_ERROR_TEMP_1093
[SPARK-41276] [SC-117136][SQL][ML][MLLIB][PROTOBUF][PYTHON][R][SS][AVRO] Optimizar el uso del constructor de StructType
[SPARK-41335] [SC-117135][CONNECT][PYTHON] Admitir IsNull e IsNotNull en columna
[SPARK-41332] [SC-117131][CONNECT][PYTHON] Corregir nullOrdering en SortOrder
[SPARK-41325] [SC-117132][CONNECT][12.X] Corregir la falta de avg() para GroupBy en DF
[SPARK-41327] [ SC-117137][CORE] Corregir SparkStatusTracker.getExecutorInfos por switch On/OffHeapStorageMemory info
[SPARK-41315] [SC-117129][CONNECT][PYTHON] Implementar DataFrame.replace y DataFrame.na.replace
[SPARK-41328] [SC-117125][CONNECT][PYTHON] Agregar API lógica y de cadena a columna
[SPARK-41331] [SC-117127][CONNECT][PYTHON] Agregar orderBy y drop_duplicates
[SPARK-40987] [SC-117124][CORE] BlockManager#removeBlockInternal debe asegurarse de que el bloqueo se desbloquee correctamente
[SPARK-41268] [SC-117102][SC-116970][CONNECT][PYTHON] Refactorización de "Columna" para compatibilidad con API
[SPARK-41312] [SC-116881][CONNECT][PYTHON][12.X] Implementar DataFrame.withColumnRenamed
[SPARK-41221] [SC-116607][SQL] Agregar la clase de error INVALID_FORMAT
[SPARK-41272] [SC-116742][SQL] Asignar un nombre a la clase de error _LEGACY_ERROR_TEMP_2019
[SPARK-41180] [SC-116760][SQL] Reutilizar INVALID_SCHEMA en lugar de _LEGACY_ERROR_TEMP_1227
[SPARK-41260] [SC-116880][PYTHON][SS][12.X] Convertir instancias NumPy a tipos primitivos Python en la actualización de GroupState
[SPARK-41174] [SC-116609][CORE][SQL] Propagar una clase de error a los usuarios para format no válido de to_binary()
[SPARK-41264] [SC-116971][CONNECT][PYTHON] Hacer que Literal admita más tipos de datos
[SPARK-41326] [SC-116972] [CONNECT] Falta entrada en corregir desduplicación
[SPARK-41316] [SC-116900][SQL] Habilitar tail-recursion siempre que sea posible
[SPARK-41297] [SC-116931] [CONNECT] [PYTHON] Admitir expresiones de cadena en el filtro.
[SPARK-41256] [SC-116932][SC-116883][CONNECT] Implementar DataFrame.withColumn(s)
[SPARK-41182] [SC-116632][SQL] Asignar un nombre a la clase de error _LEGACY_ERROR_TEMP_1102
[SPARK-41181] [SC-116680][SQL] Migrar los errores de las opciones de asignación a las clases de error
[SPARK-40940] [ SC-115993][12.x] Quitar comprobadores de operadores con estado múltiple para consultas de streaming.
[SPARK-41310] [SC-116885][CONNECT][PYTHON] Implementar DataFrame.toDF
[SPARK-41179] [SC-116631][SQL] Asignar un nombre a la clase de error _LEGACY_ERROR_TEMP_1092
[SPARK-41003] [SC-116741][SQL] BHJ LeftAnti no actualiza numOutputRows cuando codegen está deshabilitado
[SPARK-41148] [SC-116878][CONNECT][PYTHON] Implementar DataFrame.dropna y DataFrame.na.drop
[SPARK-41217] [SC-116380][SQL] Agregar la clase de error FAILED_FUNCTION_CALL
[SPARK-41308] [SC-116875][CONNECT][PYTHON] Mejorar DataFrame.count()
[SPARK-41301] [SC-116786] [CONNECT] Homogeneizar el comportamiento de SparkSession.range()
[SPARK-41306] [SC-116860][CONNECT] Mejorar la documentación proto de expresiones de Connect
[SPARK-41280] [SC-116733][CONNECT] Implementar DataFrame.tail
[SPARK-41300] [SC-116751] [CONNECT] El esquema sin establecer se interpreta como esquema
[SPARK-41255] [SC-116730][SC-116695] [CONNECT] Cambiar el nombre de RemoteSparkSession
[SPARK-41250] [SC-116788][SC-116633][CONNECT][PYTHON] DataFrame. toPandas no debe devolver dataframe de Pandas opcional
[SPARK-41291] [SC-116738][CONNECT][PYTHON] DataFrame.explain debe imprimir y devolver Ninguno
[SPARK-41278] [SC-116732][CONNECT] Limpiar QualifiedAttribute in Expression.proto sin utilizar
[SPARK-41097] [SC-116653][CORE][SQL][SS][PROTOBUF] Quitar la base de conversión de colección redundante en código de Scala 2.13
[SPARK-41261] [SC-116718][PYTHON][SS] Corregir el problema para applyInPandasWithState cuando las columnas de claves de agrupación no se colocan en orden desde el primer momento
[SPARK-40872] [SC-116717][3.3] Reserva al bloque aleatorio original cuando un fragmento aleatorio combinado de inserción es de tamaño cero
[SPARK-41114] [SC-116628][CONNECT] Admitir datos locales para LocalRelation
[SPARK-41216] [SC-116678][CONNECT][PYTHON] Implementar DataFrame.{isLocal, isStreaming, printSchema, inputFiles}
[SPARK-41238] [SC-116670][CONNECT][PYTHON] Admitir más tipos de datos integrados
[SPARK-41230] [SC-116674][CONNECT][PYTHON] Quitar str del tipo de expresión Aggregate
[SPARK-41224] [SC-116652][SPARK-41165][SPARK-41184][CONNECT] Implementación de recopilación optimizada basada en flechas para transmitir desde el servidor al cliente
[SPARK-41222] [SC-116625][CONNECT][PYTHON] Unificar las definiciones de escritura
[SPARK-41225] [SC-116623] [CONNECT] [PYTHON] Deshabilitar las funciones no admitidas.
[SPARK-41201] [SC-116526][CONNECT][PYTHON] Implementar DataFrame.SelectExpr en el cliente de Python
[SPARK-41203] [SC-116258] [CONNECT] Admitir Dataframe.tansform en el cliente de Python.
[SPARK-41213] [SC-116375][CONNECT][PYTHON] Implementar DataFrame.__repr__ y DataFrame.dtypes
[SPARK-41169] [SC-116378][CONNECT][PYTHON] Implementar DataFrame.drop
[SPARK-41172] [SC-116245][SQL] Migración del error de referencia ambiguo a una clase de error
[SPARK-41122] [SC-116141][CONNECT] Explain API puede admitir diferentes modos
[SPARK-41209] [SC-116584][SC-116376][PYTHON] Mejorar la inferencia de tipos PySpark en el método _merge_type
[SPARK-41196] [SC-116555][SC-116179] [CONNECT] Homogeneizar la versión protobuf en el servidor de conexión de Spark para usar la misma versión principal.
[SPARK-35531] [SC-116409][SQL] Actualizar estadísticas de subárbol sin convertir innecesariamente
[SPARK-41154] [SC-116289][SQL] Almacenamiento en caché de relaciones incorrecto para consultas con especificación de viaje en el tiempo
[SPARK-41212] [SC-116554][SC-116389][CONNECT][PYTHON] Implementar DataFrame.isEmpty
[SPARK-41135] [SC-116400][SQL] Cambiar el nombre UNSUPPORTED_EMPTY_LOCATION a INVALID_EMPTY_LOCATION
[SPARK-41183] [SC-116265][SQL] Agregar una API de extensión para planear la normalización del almacenamiento en caché
[SPARK-41054] [SC-116447][UI][CORE] Admite RocksDB como KVStore en la interfaz de usuario activa
[SPARK-38550] [SC-115223]Revert "[SQL][CORE] Usar un almacén basado en disco para guardar más información de depuración para la interfaz de usuario activa"
[SPARK-41173] [SC-116185][SQL] Sacar require() de los constructores de expresiones de cadena
[SPARK-41188] [SC-116242][CORE][ML] Establecer executorEnv OMP_NUM_THREADS como spark.task.cpus de forma predeterminada para los procesos JVM del ejecutor de Spark
[SPARK-41130] [SC-116155][SQL] Cambiar el nombre OUT_OF_DECIMAL_TYPE_RANGE a NUMERIC_OUT_OF_SUPPORTED_RANGE
[SPARK-41175] [SC-116238][SQL] Asignar un nombre a la clase de error _LEGACY_ERROR_TEMP_1078
[SPARK-41106] [SC-116073][SQL] Reducir la conversión de colección al crear AttributeMap
[SPARK-41139] [SC-115983][SQL] Mejorar la clase de error: PYTHON_UDF_IN_ON_CLAUSE
[SPARK-40657] [SC-115997][PROTOBUF] Requerir sombreado para jar de clase Java, mejorar el control de errores
[SPARK-40999] [ SC-116168] Propagar sugerencias a subconsultas
[SPARK-41017] [SC-116054][SQL] Admitir la eliminación de columnas con varios filtros no deterministas
[SPARK-40834] [SC-114773][SQL] Usar SparkListenerSQLExecutionEnd para realizar un seguimiento del estado final de SQL en la interfaz de usuario
[SPARK-41118] [SC-116027][SQL] to_number/try_to_number debe devolver null cuando el formato sea null
[SPARK-39799] [SC-115984][SQL] DataSourceV2: Vista de la interfaz del catálogo
[SPARK-40665] [SC-116210][SC-112300][CONNECT] Evitar insertar Spark Connect en la versión binaria de Apache Spark
[SPARK-41048] [SC-116043][SQL] Mejorar la creación de particiones de salida y la ordenación con caché de AQE
[SPARK-41198] [SC-116256][SS] Corrección de métricas en la consulta de streaming con origen de streaming CTE y DSv1
[SPARK-41199] [SC-116244][SS] Corrección del problema de métricas cuando el origen de streaming DSv1 y el origen de streaming DSv2 se usan conjuntamente
[SPARK-40957] [SC-116261][SC-114706] Agregar caché de memoria en HDFSMetadataLog
[SPARK-40940] [ SC-115993][12.x] Quitar comprobadores de operadores con estado múltiple para consultas de streaming
[SPARK-41090] [SC-116040][SQL] Iniciar excepción para db_name.view_name al crear una vista temporal por la API de conjunto de datos
[SPARK-41133] [SC-116085][SQL] Integrar UNSCALED_VALUE_TOO_LARGE_FOR_PRECISION en NUMERIC_VALUE_OUT_OF_RANGE
[SPARK-40557] [SC-116182][SC-111442][CONNECT] Confirmaciones del volcado de código 9
[SPARK-40448] [SC-114447][SC-111314][CONNECT] Compilación de Spark Connect como complemento del controlador con dependencias sombreadas
[SPARK-41096] [SC-115812][SQL] Admitir lectura de parquet de tipo FIXED_LEN_BYTE_ARRAY
[SPARK-41140] [SC-115879][SQL] Cambiar el nombre de la clase _LEGACY_ERROR_TEMP_2440 de error a INVALID_WHERE_CONDITION
[SPARK-40918] [SC-114438][SQL] Error de coincidencia entre FileSourceScanExec y Orc y ParquetFileFormat al generar la salida en columnas
[SPARK-41155] [SC-115991][SQL] Agregar mensaje de error a SchemaColumnConvertNotSupportedException
[SPARK-40940] [ SC-115993] Quitar comprobadores de operadores con estado múltiple para consultas de streaming.
[SPARK-41098] [SC-115790][SQL] Cambiar el nombre GROUP_BY_POS_REFERS_AGG_EXPR a GROUP_BY_POS_AGGREGATE
[SPARK-40755] [SC-115912][SQL] Migrar errores de comprobación de tipos de formato numérico a clases de error
[SPARK-41059] [SC-115658][SQL] Cambiar el nombre _LEGACY_ERROR_TEMP_2420 a NESTED_AGGREGATE_FUNCTION
[SPARK-41044] [SC-115662][SQL] Convertir DATATYPE_MISMATCH.UNSPECIFIED_FRAME a INTERNAL_ERROR
[SPARK-40973] [SC-115132][SQL] Cambiar el nombre _LEGACY_ERROR_TEMP_0055 a UNCLOSED_BRACKETED_COMMENT

Actualizaciones de mantenimiento

Consulte las actualizaciones de mantenimiento de Databricks Runtime 12.1.

Entorno del sistema

Sistema operativo: Ubuntu 20.04.5 LTS
Java: Zulu 8.64.0.19-CA-linux64
Scala: 2.12.14
Python: 3.9.5
R: 4.2.2
Delta Lake: 2.2.0

Bibliotecas de Python instaladas

Biblioteca	Versión	Biblioteca	Versión	Biblioteca	Versión
argon2-cffi	21.3.0	argon2-cffi-bindings	21.2.0	asttokens	2.0.5
attrs	21.4.0	backcall	0.2.0	backports.entry-points-selectable	1.2.0
beautifulsoup4	4.11.1	black	22.3.0	bleach	4.1.0
boto3	1.21.32	botocore	1.24.32	certifi	2021.10.8
cffi	1.15.0	chardet	4.0.0	charset-normalizer	2.0.4
click	8.0.4	criptografía	3.4.8	cycler	0.11.0
Cython	0.29.28	dbus-python	1.2.16	debugpy	1.5.1
decorator	5.1.1	defusedxml	0.7.1	distlib	0.3.6
docstring-to-markdown	0,11	entrypoints	0,4	executing	0.8.3
facets-overview	1.0.0	fastjsonschema	2.16.2	filelock	3.8.2
fonttools	4.25.0	idna	3.3	ipykernel	6.15.3
ipython	8.5.0	ipython-genutils	0.2.0	ipywidgets	7.7.2
jedi	0.18.1	Jinja2	2.11.3	jmespath	0.10.0
joblib	1.1.0	jsonschema	4.4.0	jupyter-client	6.1.12
jupyter_core	4.11.2	jupyterlab-pygments	0.1.2	jupyterlab-widgets	1.0.0
kiwisolver	1.3.2	MarkupSafe	2.0.1	matplotlib	3.5.1
matplotlib-inline	0.1.2	mccabe	0.7.0	mistune	0.8.4
mypy-extensions	0.4.3	nbclient	0.5.13	nbconvert	6.4.4
nbformat	5.3.0	nest-asyncio	1.5.5	nodeenv	1.7.0
notebook	6.4.8	numpy	1.21.5	empaquetado	21,3
pandas	1.4.2	pandocfilters	1.5.0	parso	0.8.3
pathspec	0.9.0	patsy	0.5.2	pexpect	4.8.0
pickleshare	0.7.5	Pillow	9.0.1	pip	21.2.4
platformdirs	2.6.0	plotly	5.6.0	pluggy	1.0.0
prometheus-client	0.13.1	prompt-toolkit	3.0.20	protobuf	3.19.4
psutil	5.8.0	psycopg2	2.9.3	ptyprocess	0.7.0
pure-eval	0.2.2	pyarrow	7.0.0	pycparser	2.21
pyflakes	2.5.0	Pygments	2.11.2	PyGObject	3.36.0
pyodbc	4.0.32	pyparsing	3.0.4	pyright	1.1.283
pyrsistent	0.18.0	Python-dateutil	2.8.2	python-lsp-jsonrpc	1.0.0
python-lsp-server	1.6.0	pytz	2021.3	pyzmq	22.3.0
Solicitudes	2.27.1	requests-unixsocket	0.2.0	rope	0.22.0
s3transfer	0.5.0	scikit-learn	1.0.2	scipy	1.7.3
seaborn	0.11.2	Send2Trash	1.8.0	setuptools	61.2.0
six (seis)	1.16.0	soupsieve	2.3.1	ssh-import-id	5.10
stack-data	0.2.0	statsmodels	0.13.2	tenacity	8.0.1
terminado	0.13.1	testpath	0.5.0	threadpoolctl	2.2.0
tokenize-rt	4.2.1	tomli	1.2.2	tornado	6.1
traitlets	5.1.1	typing_extensions	4.1.1	ujson	5.1.0
unattended-upgrades	0,1	urllib3	1.26.9	virtualenv	20.8.0
wcwidth	0.2.5	webencodings	0.5.1	whatthepatch	1.0.3
wheel	0.37.0	widgetsnbextension	3.6.1	yapf	0.31.0

Bibliotecas de R instaladas

Las bibliotecas de R se instalan desde la instantánea de Microsoft CRAN desde el 11-11-2022.

Biblioteca	Versión	Biblioteca	Versión	Biblioteca	Versión
arrow	10.0.0	askpass	1.1	assertthat	0.2.1
backports	1.4.1	base	4.2.2	base64enc	0.1-3
bit	4.0.4	bit64	4.0.5	blob	1.2.3
boot	1.3-28	brew	1,0 - 8	brio	1.1.3
broom	1.0.1	bslib	0.4.1	cachem	1.0.6
callr	3.7.3	caret	6.0-93	cellranger	1.1.0
chron	2.3-58	clase	7.3-20	cli	3.4.1
clipr	0.8.0	clock	0.6.1	cluster	2.1.4
codetools	0.2-18	colorspace	2.0-3	commonmark	1.8.1
compiler	4.2.2	config	0.3.1	cpp11	0.4.3
crayon	1.5.2	credentials	1.3.2	curl	4.3.3
data.table	1.14.4	conjuntos de datos	4.2.2	DBI	1.1.3
dbplyr	2.2.1	desc	1.4.2	devtools	2.4.5
diffobj	0.3.5	digest	0.6.30	downlit	0.4.2
dplyr	1.0.10	dtplyr	1.2.2	e1071	1.7-12
ellipsis	0.3.2	evaluate	0,18	fansi	1.0.3
farver	2.1.1	fastmap	1.1.0	fontawesome	0.4.0
forcats	0.5.2	foreach	1.5.2	foreign	0.8-82
forge	0.2.0	fs	1.5.2	future	1.29.0
future.apply	1.10.0	gargle	1.2.1	generics	0.1.3
gert	1.9.1	ggplot2	3.4.0	gh	1.3.1
gitcreds	0.1.2	glmnet	4.1-4	globals	0.16.1
glue	1.6.2	googledrive	2.0.0	googlesheets4	1.0.1
gower	1.0.0	elementos gráficos	4.2.2	grDevices	4.2.2
grid	4.2.2	gridExtra	2.3	gsubfn	0.7
gtable	0.3.1	hardhat	1.2.0	haven	2.5.1
highr	0.9	hms	1.1.2	htmltools	0.5.3
htmlwidgets	1.5.4	httpuv	1.6.6	httr	1.4.4
ids	1.0.1	ini	0.3.1	ipred	0.9-13
isoband	0.2.6	iterators	1.0.14	jquerylib	0.1.4
jsonlite	1.8.3	KernSmooth	2.23-20	knitr	1.40
labeling	0.4.2	later	1.3.0	lattice	0.20-45
lava	1.7.0	ciclo de vida	1.0.3	listenv	0.8.0
lubridate	1.9.0	magrittr	2.0.3	markdown	1.3
MASS	7.3-58	Matriz	1.5-1	memoise	2.0.1
methods	4.2.2	mgcv	1.8-41	mime	0,12
miniUI	0.1.1.1	ModelMetrics	1.2.2.2	modelr	0.1.9
munsell	0.5.0	nlme	3.1-160	nnet	7.3-18
numDeriv	2016.8-1.1	openssl	2.0.4	parallel	4.2.2
parallelly	1.32.1	pillar	1.8.1	pkgbuild	1.3.1
pkgconfig	2.0.3	pkgdown	2.0.6	pkgload	1.3.1
plogr	0.2.0	plyr	1.8.7	praise	1.0.0
prettyunits	1.1.1	pROC	1.18.0	processx	3.8.0
prodlim	2019.11.13	profvis	0.3.7	progreso	1.2.2
progressr	0.11.0	promises	1.2.0.1	proto	1.0.0
proxy	0.4-27	ps	1.7.2	purrr	0.3.5
r2d3	0.2.6	R6	2.5.1	ragg	1.2.4
randomForest	4.7-1.1	rappdirs	0.3.3	rcmdcheck	1.4.0
RColorBrewer	1.1-3	Rcpp	1.0.9	RcppEigen	0.3.3.9.3
readr	2.1.3	readxl	1.4.1	recipes	1.0.3
rematch	1.0.1	rematch2	2.1.2	remotes	2.4.2
reprex	2.0.2	reshape2	1.4.4	rlang	1.0.6
rmarkdown	2,18	RODBC	1.3-19	roxygen2	7.2.1
rpart	4.1.19	rprojroot	2.0.3	Rserve	1.8-11
RSQLite	2.2.18	rstudioapi	0.14	rversions	2.1.2
rvest	1.0.3	sass	0.4.2	scales	1.2.1
selectr	0.4-2	sessioninfo	1.2.2	shape	1.4.6
shiny	1.7.3	sourcetools	0.1.7	sparklyr	1.7.8
SparkR	3.3.1	spatial	7.3-11	splines	4.2.2
sqldf	0.4-11	SQUAREM	2021.1	stats	4.2.2
stats4	4.2.2	stringi	1.7.8	stringr	1.4.1
survival	3.4-0	sys	3.4.1	systemfonts	1.0.4
tcltk	4.2.2	testthat	3.1.5	textshaping	0.3.6
tibble	3.1.8	tidyr	1.2.1	tidyselect	1.2.0
tidyverse	1.3.2	timechange	0.1.1	timeDate	4021.106
tinytex	0,42	tools	4.2.2	tzdb	0.3.0
urlchecker	1.0.1	usethis	2.1.6	utf8	1.2.2
utils	4.2.2	uuid	1.1-0	vctrs	0.5.0
viridisLite	0.4.1	vroom	1.6.0	waldo	0.4.0
whisker	0,4	withr	2.5.0	xfun	0.34
xml2	1.3.3	xopen	1.0.0	xtable	1.8-4
yaml	2.3.6	zip	2.2.2

Bibliotecas de Java y Scala instaladas (versión de clúster de Scala 2.12)

Identificador de grupo	Identificador de artefacto	Versión
antlr	antlr	2.7.7
com.amazonaws	amazon-kinesis-client	1.12.0
com.amazonaws	aws-java-sdk-autoscaling	1.12.189
com.amazonaws	aws-java-sdk-cloudformation	1.12.189
com.amazonaws	aws-java-sdk-cloudfront	1.12.189
com.amazonaws	aws-java-sdk-cloudhsm	1.12.189
com.amazonaws	aws-java-sdk-cloudsearch	1.12.189
com.amazonaws	aws-java-sdk-cloudtrail	1.12.189
com.amazonaws	aws-java-sdk-cloudwatch	1.12.189
com.amazonaws	aws-java-sdk-cloudwatchmetrics	1.12.189
com.amazonaws	aws-java-sdk-codedeploy	1.12.189
com.amazonaws	aws-java-sdk-cognitoidentity	1.12.189
com.amazonaws	aws-java-sdk-cognitosync	1.12.189
com.amazonaws	aws-java-sdk-config	1.12.189
com.amazonaws	aws-java-sdk-core	1.12.189
com.amazonaws	aws-java-sdk-datapipeline	1.12.189
com.amazonaws	aws-java-sdk-directconnect	1.12.189
com.amazonaws	aws-java-sdk-directory	1.12.189
com.amazonaws	aws-java-sdk-dynamodb	1.12.189
com.amazonaws	aws-java-sdk-ec2	1.12.189
com.amazonaws	aws-java-sdk-ecs	1.12.189
com.amazonaws	aws-java-sdk-efs	1.12.189
com.amazonaws	aws-java-sdk-elasticache	1.12.189
com.amazonaws	aws-java-sdk-elasticbeanstalk	1.12.189
com.amazonaws	aws-java-sdk-elasticloadbalancing	1.12.189
com.amazonaws	aws-java-sdk-elastictranscoder	1.12.189
com.amazonaws	aws-java-sdk-emr	1.12.189
com.amazonaws	aws-java-sdk-glacier	1.12.189
com.amazonaws	aws-java-sdk-glue	1.12.189
com.amazonaws	aws-java-sdk-iam	1.12.189
com.amazonaws	aws-java-sdk-importexport	1.12.189
com.amazonaws	aws-java-sdk-kinesis	1.12.189
com.amazonaws	aws-java-sdk-kms	1.12.189
com.amazonaws	aws-java-sdk-lambda	1.12.189
com.amazonaws	aws-java-sdk-logs	1.12.189
com.amazonaws	aws-java-sdk-machinelearning	1.12.189
com.amazonaws	aws-java-sdk-opsworks	1.12.189
com.amazonaws	aws-java-sdk-rds	1.12.189
com.amazonaws	aws-java-sdk-redshift	1.12.189
com.amazonaws	aws-java-sdk-route53	1.12.189
com.amazonaws	aws-java-sdk-s3	1.12.189
com.amazonaws	aws-java-sdk-ses	1.12.189
com.amazonaws	aws-java-sdk-simpledb	1.12.189
com.amazonaws	aws-java-sdk-simpleworkflow	1.12.189
com.amazonaws	aws-java-sdk-sns	1.12.189
com.amazonaws	aws-java-sdk-sqs	1.12.189
com.amazonaws	aws-java-sdk-ssm	1.12.189
com.amazonaws	aws-java-sdk-storagegateway	1.12.189
com.amazonaws	aws-java-sdk-sts	1.12.189
com.amazonaws	aws-java-sdk-support	1.12.189
com.amazonaws	aws-java-sdk-swf-libraries	1.11.22
com.amazonaws	aws-java-sdk-workspaces	1.12.189
com.amazonaws	jmespath-java	1.12.189
com.chuusai	shapeless_2.12	2.3.3
com.clearspring.analytics	flujo	2.9.6
com.databricks	Rserve	1.8-3
com.databricks	jets3t	0.7.1-0
com.databricks.scalapb	compilerplugin_2.12	0.4.15-10
com.databricks.scalapb	scalapb-runtime_2.12	0.4.15-10
com.esotericsoftware	kryo-shaded	4.0.2
com.esotericsoftware	minlog	1.3.0
com.fasterxml	classmate	1.3.4
com.fasterxml.jackson.core	jackson-annotations	2.13.4
com.fasterxml.jackson.core	jackson-core	2.13.4
com.fasterxml.jackson.core	jackson-databind	2.13.4.2
com.fasterxml.jackson.dataformat	jackson-dataformat-cbor	2.13.4
com.fasterxml.jackson.datatype	jackson-datatype-joda	2.13.4
com.fasterxml.jackson.datatype	jackson-datatype-jsr310	2.13.4
com.fasterxml.jackson.module	jackson-module-paranamer	2.13.4
com.fasterxml.jackson.module	jackson-module-scala_2.12	2.13.4
com.github.ben-manes.caffeine	caffeine	2.3.4
com.github.fommil	jniloader	1.1
com.github.fommil.netlib	core	1.1.2
com.github.fommil.netlib	native_ref-java	1.1
com.github.fommil.netlib	native_ref-java-natives	1.1
com.github.fommil.netlib	native_system-java	1.1
com.github.fommil.netlib	native_system-java-natives	1.1
com.github.fommil.netlib	netlib-native_ref-linux-x86_64-natives	1.1
com.github.fommil.netlib	netlib-native_system-linux-x86_64-natives	1.1
com.github.luben	zstd-jni	1.5.2-1
com.github.wendykierp	JTransforms	3.1
com.google.code.findbugs	jsr305	3.0.0
com.google.code.gson	gson	2.8.6
com.google.crypto.tink	tink	1.6.1
com.google.flatbuffers	flatbuffers-java	1.12.0
com.google.guava	guava	15.0
com.google.protobuf	protobuf-java	2.6.1
com.h2database	h2	2.0.204
com.helger	profiler	1.1.1
com.jcraft	jsch	0.1.50
com.jolbox	bonecp	0.8.0.RELEASE
com.lihaoyi	sourcecode_2.12	0.1.9
com.microsoft.azure	azure-data-lake-store-sdk	2.3.9
com.ning	compress-lzf	1.1
com.sun.mail	javax.mail	1.5.2
com.tdunning	json	1.8
com.thoughtworks.paranamer	paranamer	2.8
com.trueaccord.lenses	lenses_2.12	0.4.12
com.twitter	chill-java	0.10.0
com.twitter	chill_2.12	0.10.0
com.twitter	util-app_2.12	7.1.0
com.twitter	util-core_2.12	7.1.0
com.twitter	util-function_2.12	7.1.0
com.twitter	util-jvm_2.12	7.1.0
com.twitter	util-lint_2.12	7.1.0
com.twitter	util-registry_2.12	7.1.0
com.twitter	util-stats_2.12	7.1.0
com.typesafe	config	1.2.1
com.typesafe.scala-logging	scala-logging_2.12	3.7.2
com.uber	h3	3.7.0
com.univocity	univocity-parsers	2.9.1
com.zaxxer	HikariCP	4.0.3
commons-cli	commons-cli	1.5.0
commons-codec	commons-codec	1.15
commons-collections	commons-collections	3.2.2
commons-dbcp	commons-dbcp	1.4
commons-fileupload	commons-fileupload	1.3.3
commons-httpclient	commons-httpclient	3.1
commons-io	commons-io	2.11.0
commons-lang	commons-lang	2.6
commons-logging	commons-logging	1.1.3
commons-pool	commons-pool	1.5.4
dev.ludovic.netlib	arpack	2.2.1
dev.ludovic.netlib	blas	2.2.1
dev.ludovic.netlib	lapack	2.2.1
info.ganglia.gmetric4j	gmetric4j	1.0.10
io.airlift	aircompressor	0,21
io.delta	delta-sharing-spark_2.12	0.6.2
io.dropwizard.metrics	metrics-core	4.1.1
io.dropwizard.metrics	metrics-graphite	4.1.1
io.dropwizard.metrics	metrics-healthchecks	4.1.1
io.dropwizard.metrics	metrics-jetty9	4.1.1
io.dropwizard.metrics	metrics-jmx	4.1.1
io.dropwizard.metrics	metrics-json	4.1.1
io.dropwizard.metrics	metrics-jvm	4.1.1
io.dropwizard.metrics	metrics-servlets	4.1.1
io.netty	netty-all	4.1.74.Final
io.netty	netty-buffer	4.1.74.Final
io.netty	netty-codec	4.1.74.Final
io.netty	netty-common	4.1.74.Final
io.netty	netty-handler	4.1.74.Final
io.netty	netty-resolver	4.1.74.Final
io.netty	netty-tcnative-classes	2.0.48.Final
io.netty	netty-transport	4.1.74.Final
io.netty	netty-transport-classes-epoll	4.1.74.Final
io.netty	netty-transport-classes-kqueue	4.1.74.Final
io.netty	netty-transport-native-epoll-linux-aarch_64	4.1.74.Final
io.netty	netty-transport-native-epoll-linux-x86_64	4.1.74.Final
io.netty	netty-transport-native-kqueue-osx-aarch_64	4.1.74.Final
io.netty	netty-transport-native-kqueue-osx-x86_64	4.1.74.Final
io.netty	netty-transport-native-unix-common	4.1.74.Final
io.prometheus	simpleclient	0.7.0
io.prometheus	simpleclient_common	0.7.0
io.prometheus	simpleclient_dropwizard	0.7.0
io.prometheus	simpleclient_pushgateway	0.7.0
io.prometheus	simpleclient_servlet	0.7.0
io.prometheus.jmx	recopilador	0.12.0
jakarta.annotation	jakarta.annotation-api	1.3.5
jakarta.servlet	jakarta.servlet-api	4.0.3
jakarta.validation	jakarta.validation-api	2.0.2
jakarta.ws.rs	jakarta.ws.rs-api	2.1.6
javax.activation	activation	1.1.1
javax.el	javax.el-api	2.2.4
javax.jdo	jdo-api	3.0.1
javax.transaction	jta	1.1
javax.transaction	transaction-api	1.1
javax.xml.bind	jaxb-api	2.2.11
javolution	javolution	5.5.1
jline	jline	2.14.6
joda-time	joda-time	2.10.13
net.java.dev.jna	jna	5.8.0
net.razorvine	pickle	1.2
net.sf.jpam	jpam	1.1
net.sf.opencsv	opencsv	2.3
net.sf.supercsv	super-csv	2.2.0
net.snowflake	snowflake-ingest-sdk	0.9.6
net.snowflake	snowflake-jdbc	3.13.22
net.sourceforge.f2j	arpack_combined_all	0,1
org.acplt.remotetea	remotetea-oncrpc	1.1.2
org.antlr	ST4	4.0.4
org.antlr	antlr-runtime	3.5.2
org.antlr	antlr4-runtime	4.8
org.antlr	stringtemplate	3.2.1
org.apache.ant	ant	1.9.2
org.apache.ant	ant-jsch	1.9.2
org.apache.ant	ant-launcher	1.9.2
org.apache.arrow	arrow-format	7.0.0
org.apache.arrow	arrow-memory-core	7.0.0
org.apache.arrow	arrow-memory-netty	7.0.0
org.apache.arrow	arrow-vector	7.0.0
org.apache.avro	avro	1.11.0
org.apache.avro	avro-ipc	1.11.0
org.apache.avro	avro-mapred	1.11.0
org.apache.commons	commons-collections4	4.4.
org.apache.commons	commons-compress	1.21
org.apache.commons	commons-crypto	1.1.0
org.apache.commons	commons-lang3	3.12.0
org.apache.commons	commons-math3	3.6.1
org.apache.commons	commons-text	1.10.0
org.apache.curator	curator-client	2.13.0
org.apache.curator	curator-framework	2.13.0
org.apache.curator	curator-recipes	2.13.0
org.apache.derby	derby	10.14.2.0
org.apache.hadoop	hadoop-client-api	3.3.4-databricks
org.apache.hadoop	hadoop-client-runtime	3.3.4
org.apache.hive	hive-beeline	2.3.9
org.apache.hive	hive-cli	2.3.9
org.apache.hive	hive-jdbc	2.3.9
org.apache.hive	hive-llap-client	2.3.9
org.apache.hive	hive-llap-common	2.3.9
org.apache.hive	hive-serde	2.3.9
org.apache.hive	hive-shims	2.3.9
org.apache.hive	hive-storage-api	2.8.1
org.apache.hive.shims	hive-shims-0.23	2.3.9
org.apache.hive.shims	hive-shims-common	2.3.9
org.apache.hive.shims	hive-shims-scheduler	2.3.9
org.apache.httpcomponents	httpclient	4.5.13
org.apache.httpcomponents	httpcore	4.4.14
org.apache.ivy	ivy	2.5.0
org.apache.logging.log4j	log4j-1.2-api	2.18.0
org.apache.logging.log4j	log4j-api	2.18.0
org.apache.logging.log4j	log4j-core	2.18.0
org.apache.logging.log4j	log4j-slf4j-impl	2.18.0
org.apache.mesos	mesos-shaded-protobuf	1.4.0
org.apache.orc	orc-core	1.7.6
org.apache.orc	orc-mapreduce	1.7.6
org.apache.orc	orc-shims	1.7.6
org.apache.parquet	parquet-column	1.12.3-databricks-0002
org.apache.parquet	parquet-common	1.12.3-databricks-0002
org.apache.parquet	parquet-encoding	1.12.3-databricks-0002
org.apache.parquet	parquet-format-structures	1.12.3-databricks-0002
org.apache.parquet	parquet-hadoop	1.12.3-databricks-0002
org.apache.parquet	parquet-jackson	1.12.3-databricks-0002
org.apache.thrift	libfb303	0.9.3
org.apache.thrift	libthrift	0.12.0
org.apache.xbean	xbean-asm9-shaded	4.20
org.apache.yetus	audience-annotations	0.13.0
org.apache.zookeeper	zookeeper	3.6.2
org.apache.zookeeper	zookeeper-jute	3.6.2
org.checkerframework	checker-qual	3.5.0
org.codehaus.jackson	jackson-core-asl	1.9.13
org.codehaus.jackson	jackson-mapper-asl	1.9.13
org.codehaus.janino	commons-compiler	3.0.16
org.codehaus.janino	janino	3.0.16
org.datanucleus	datanucleus-api-jdo	4.2.4
org.datanucleus	datanucleus-core	4.1.17
org.datanucleus	datanucleus-rdbms	4.1.19
org.datanucleus	javax.jdo	3.2.0-m3
org.eclipse.jetty	jetty-client	9.4.46.v20220331
org.eclipse.jetty	jetty-continuation	9.4.46.v20220331
org.eclipse.jetty	jetty-http	9.4.46.v20220331
org.eclipse.jetty	jetty-io	9.4.46.v20220331
org.eclipse.jetty	jetty-jndi	9.4.46.v20220331
org.eclipse.jetty	jetty-plus	9.4.46.v20220331
org.eclipse.jetty	jetty-proxy	9.4.46.v20220331
org.eclipse.jetty	jetty-security	9.4.46.v20220331
org.eclipse.jetty	jetty-server	9.4.46.v20220331
org.eclipse.jetty	jetty-servlet	9.4.46.v20220331
org.eclipse.jetty	jetty-servlets	9.4.46.v20220331
org.eclipse.jetty	jetty-util	9.4.46.v20220331
org.eclipse.jetty	jetty-util-ajax	9.4.46.v20220331
org.eclipse.jetty	jetty-webapp	9.4.46.v20220331
org.eclipse.jetty	jetty-xml	9.4.46.v20220331
org.eclipse.jetty.websocket	websocket-api	9.4.46.v20220331
org.eclipse.jetty.websocket	websocket-client	9.4.46.v20220331
org.eclipse.jetty.websocket	websocket-common	9.4.46.v20220331
org.eclipse.jetty.websocket	websocket-server	9.4.46.v20220331
org.eclipse.jetty.websocket	websocket-servlet	9.4.46.v20220331
org.fusesource.leveldbjni	leveldbjni-all	1.8
org.glassfish.hk2	hk2-api	2.6.1
org.glassfish.hk2	hk2-locator	2.6.1
org.glassfish.hk2	hk2-utils	2.6.1
org.glassfish.hk2	osgi-resource-locator	1.0.3
org.glassfish.hk2.external	aopalliance-repackaged	2.6.1
org.glassfish.hk2.external	jakarta.inject	2.6.1
org.glassfish.jersey.containers	jersey-container-servlet	2,36
org.glassfish.jersey.containers	jersey-container-servlet-core	2,36
org.glassfish.jersey.core	jersey-client	2,36
org.glassfish.jersey.core	jersey-common	2,36
org.glassfish.jersey.core	jersey-server	2,36
org.glassfish.jersey.inject	jersey-hk2	2,36
org.hibernate.validator	hibernate-validator	6.1.0.Final
org.javassist	javassist	3.25.0-GA
org.jboss.logging	jboss-logging	3.3.2.Final
org.jdbi	jdbi	2.63.1
org.jetbrains	annotations	17.0.0
org.joda	joda-convert	1.7
org.jodd	jodd-core	3.5.2
org.json4s	json4s-ast_2.12	3.7.0-M11
org.json4s	json4s-core_2.12	3.7.0-M11
org.json4s	json4s-jackson_2.12	3.7.0-M11
org.json4s	json4s-scalap_2.12	3.7.0-M11
org.lz4	lz4-java	1.8.0
org.mariadb.jdbc	mariadb-java-client	2.7.4
org.mlflow	mlflow-spark	1.27.0
org.objenesis	objenesis	2.5.1
org.postgresql	postgresql	42.3.3
org.roaringbitmap	RoaringBitmap	0.9.25
org.roaringbitmap	shims	0.9.25
org.rocksdb	rocksdbjni	6.24.2
org.rosuda.REngine	REngine	2.1.0
org.scala-lang	scala-compiler_2.12	2.12.14
org.scala-lang	scala-library_2.12	2.12.14
org.scala-lang	scala-reflect_2.12	2.12.14
org.scala-lang.modules	scala-collection-compat_2.12	2.4.3
org.scala-lang.modules	scala-parser-combinators_2.12	1.1.2
org.scala-lang.modules	scala-xml_2.12	1.2.0
org.scala-sbt	test-interface	1,0
org.scalacheck	scalacheck_2.12	1.14.2
org.scalactic	scalactic_2.12	3.0.8
org.scalanlp	breeze-macros_2.12	1.2
org.scalanlp	breeze_2.12	1.2
org.scalatest	scalatest_2.12	3.0.8
org.slf4j	jcl-over-slf4j	1.7.36
org.slf4j	jul-to-slf4j	1.7.36
org.slf4j	slf4j-api	1.7.36
org.spark-project.spark	unused	1.0.0
org.threeten	threeten-extra	1.5.0
org.tukaani	xz	1.9
org.typelevel	algebra_2.12	2.0.1
org.typelevel	cats-kernel_2.12	2.1.1
org.typelevel	macro-compat_2.12	1.1.1
org.typelevel	spire-macros_2.12	0.17.0
org.typelevel	spire-platform_2.12	0.17.0
org.typelevel	spire-util_2.12	0.17.0
org.typelevel	spire_2.12	0.17.0
org.wildfly.openssl	wildfly-openssl	1.0.7.Final
org.xerial	sqlite-jdbc	3.8.11.2
org.xerial.snappy	snappy-java	1.1.8.4
org.yaml	snakeyaml	1.24
oro	oro	2.0.8
pl.edu.icm	JLargeArrays	1.5
software.amazon.ion	ion-java	1.0.2
stax	stax-api	1.0.1