다음을 통해 공유


2020년 2월

이러한 기능 및 Azure Databricks 플랫폼 개선 사항은 2020년 2월에 릴리스되었습니다.

참고 항목

릴리스가 준비되었습니다. Azure Databricks 계정은 최초 릴리스 날짜 이후 최대 일주일까지 업데이트되지 않을 수 있습니다.

Genomics GA용 Databricks Runtime 6.4

2020년 2월 26일

Genomics용 Databricks Runtime 6.4는 Databricks Runtime 6.4를 기반으로 빌드됩니다. 여기에는 Genomics용 Databricks Runtime 6.3의 많은 개선 사항 및 업그레이드가 포함되어 있습니다.

주요 기능은 다음과 같습니다.

  • 이제 DNASeq 파이프라인 사용자가 읽기 맞춤, 변형 호출 및 변형 주석 단계의 합법적인 조합을 선택적으로 사용하지 않도록 설정할 수 있습니다. 사용자는 단일 엔드 읽기 맞춤을 수행할 수도 있습니다.
  • Genomics용 Databricks Runtime 6.4에 포함된 Glow 버전은 이젠 이전에 SQL 식을 통해서만 노출된 함수에 대해 Python 및 Scala API를 제공합니다. 이러한 함수는 DataFrame 작업에 사용할 수 있으므로 컴파일 시간 안전성을 개선할 수 있습니다.

Databricks Runtime 6.4 ML GA

2020년 2월 26일

Databricks Runtime 6.4 ML GA는 다음을 포함하여 라이브러리 업그레이드를 제공합니다.

  • PyTorch: 1.3.1~1.4.0
  • Horovod: 0.18.2~1.19.0

자세한 내용은 ML용 전체 Databricks Runtime 6.4(지원되지 않는) 릴리스 정보를 참조하세요.

Databricks Runtime 6.4 GA

2020년 2월 26일

Databricks Runtime 6.4 GA는 새로운 기능, 향상된 기능 및 많은 버그 수정을 제공합니다.

  • 자동 로더(공개 미리 보기)를 사용하여 새 데이터 파일을 증분 방식으로 처리합니다. 자동 로더는 ETL 동안 클라우드 Blob 저장소에 도착하는 새 데이터 파일을 증분 방식으로 처리하는 보다 효율적인 방법을 제공합니다. 이는 클라우드 디렉터리를 반복적으로 나열하고 본 파일을 추적하여 새 파일을 식별하는 파일 기반 구조적 스트리밍에 비해 개선되었으며 디렉터리가 커질수록 매우 비효율적일 수 있습니다.
  • idempotent 재시도(공개 미리 보기)를 사용하여 Delta Lake에 데이터를 로드합니다. COPY INTO SQL 명령을 사용하면 idempotent 재시도(공개 미리 보기)를 통해 데이터를 Delta Lake로 로드할 수 있습니다. 현재 Delta Lake에 데이터를 로드하려면 Apache Spark DataFrame API를 사용해야 합니다. 로드 중 오류가 발생하면 이를 효과적으로 처리해야 합니다.
  • Delta 테이블의 모든 쓰기, 업데이트 및 삭제에 대한 작업 메트릭이 이젠 테이블 기록에 표시됩니다.
  • 이제 Azure Databricks Notebooks(공개 미리 보기)에서 인라인 Matplotlib 수치가 기본적으로 사용하도록 설정되었습니다.

자세한 내용은 전체 Databricks Runtime 6.4(지원되지 않는) 릴리스 정보를 참조하세요.

새로운 대화형 차트는 풍부한 클라이언트 쪽 상호 작용을 제공합니다.

2019년 2월 25일 - 3월 3일: 버전 3.14

이 릴리스에서는 가로 막대형 차트와 꺾은선형 차트 구현을 대체하는 두 가지 새로운 대화형 차트 유형을 소개합니다. 기존 차트 기능 외에도 꺾은선형 차트에는 Y축 범위 설정, 표식 표시 또는 숨기기, Y축에 로그 스케일링 적용 등 몇 가지 새로운 사용자 지정 플롯 옵션이 있습니다. 두 차트에는 다양한 클라이언트 측 상호 작용을 지원하는 도구 모음이 내장되어 있습니다.

차트 도구 모음

기존 차트 구현을 사용하려는 경우 레거시 차트 드롭다운 메뉴에서 선택할 수 있습니다. 기존 차트는 이전에 사용 가능한 구현을 계속 사용합니다.

레거시 차트 종류

새 데이터 수집 네트워크는 Delta Lake와 파트너 통합을 추가합니다(공개 미리 보기).

2020년 2월 24일

이제 수백 개의 데이터 원본에서 Delta Lake로 데이터 웨어하우스를 사용하여 일반적으로 가져오는 데이터 구조 및 데이터 관리 기능의 종류에 의해 강화된 데이터 레이크인 "lakehouse"를 쉽게 채울 수 있습니다. 이 네트워크의 핵심은 작업 영역에서 액세스할 수 있는 새로운 파트너 통합 갤러리이며 파트너인 Fivetran, Qlik, Infoworks, StreamSets 및 Syncsort를 통해 방대한 데이터 원본 네트워크에 액세스할 수 있습니다.

파트너 통합 포털

개요는 블로그를 참조하세요. 자세한 내용은 기술 파트너를 참조 하세요.

Azure Databricks 관리자로 자동으로 추가된 작업 영역 작성자

2020년 2월 24일

2020년 2월 24일 이전에 Azure Databricks 작업 영역을 만든 사용자는 Azure Portal에서 작업 영역 시작 단추를 클릭하거나 작업 영역에서 이미 관리 사용자인 사용자가 관리자로 추가한 경우에만 작업 영역에 대한 관리 사용자로 추가됩니다(작업 영역 시작 단추를 클릭한 구독에 대한 모든 Azure 기여자는 작업 영역에서 관리 사용자로 만들어짐). 이제 작업 영역을 만드는 사용자가 작업 영역 관리자로 자동으로 추가됩니다.

작업 영역 만들기 및 시작에 대한 자세한 내용은 구독 관리를 참조하세요.

작업 영역 보안 및 Notebook 기능을 관리하는 플래그를 사용할 수 있습니다.

2020년 2월 4~11일: 버전 3.12

이 릴리스에서는 작업 영역에 대한 공격을 방지하기 위해 전송되는 보안 헤더를 관리하기 위한 새로운 플래그와 Notebook 결과 다운로드 및 Git 버전 관리에 대한 액세스를 소개합니다. 이러한 모든 관리 옵션은 기본적으로 사용하도록 설정됩니다.