이벤트
3월 31일 오후 11시 - 4월 2일 오후 11시
궁극적인 Microsoft Fabric, Power BI, SQL 및 AI 커뮤니티 주도 이벤트입니다. 2025년 3월 31일부터 4월 2일까지.
지금 등록참고
이 문서에서는 Databricks Runtime 13.3 LTS 이상에 대한 Databricks Connect에 대해 설명합니다.
이 문서에서는 Python 및 PyCharm을 사용하여 Databricks Connect를 빠르게 시작하는 방법을 보여 줍니다.
Databricks Connect를 사용하면 PyCharm, Notebook 서버 및 기타 사용자 지정 애플리케이션과 같은 인기 있는 IDE를 Azure Databricks 클러스터에 연결할 수 있습니다. Databricks Connect란?을 참조하세요.
이 자습서를 건너뛰고 다른 IDE를 대신 사용하려면 다음 단계를 참조 하세요.
이 자습서를 완료하려면 다음 요구 사항을 충족해야 합니다.
clusters
와 configuration
긴 문자 문자열을 복사합니다.이 자습서에서는 Azure Databricks 작업 영역에 인증하기 위해 Azure Databricks OAuth U2M(사용자-컴퓨터) 인증 및 Azure Databricks 구성 프로필을 사용합니다. 다른 인증 유형을 사용하려면 연결 속성 구성을 참조 하세요.
OAuth U2M 인증을 구성하려면 Databricks CLI가 필요합니다. Databricks CLI 설치에 대한 자세한 내용은 Databricks CLI 설치 또는 업데이트를 참조하세요.
다음과 같이 OAuth U2M 인증을 시작합니다.
Databricks CLI를 사용하여 각 대상 작업 영역에 대해 다음 명령을 실행하고 OAuth 토큰 관리를 로컬로 시작합니다.
다음 명령에서 <workspace-url>
를 Azure Databricks 작업 영역 URL로 바꿉니다(예: https://adb-1234567890123456.7.azuredatabricks.net
).
databricks auth login --configure-cluster --host <workspace-url>
팁
Databricks Connect에서 서버리스 컴퓨팅을 사용하려면 서버리스 컴퓨팅에 대한 연결 구성을 참조 하세요.
Databricks CLI는 Azure Databricks 구성 프로필로 입력한 정보를 저장하라는 메시지를 표시합니다. Enter
를 눌러 제안된 프로필 이름을 수락하거나 새 프로필 또는 기존 프로필의 이름을 입력합니다. 이름이 같은 기존 프로필은 입력한 정보로 덮어쓰여집니다. 프로필을 사용하여 여러 작업 영역에서 인증 컨텍스트를 빠르게 전환할 수 있습니다.
기존 프로필 목록을 얻으려면 별도의 터미널 또는 명령 프롬프트에서 Databricks CLI를 사용하여 databricks auth profiles
명령을 실행합니다. 특정 프로필의 기존 설정을 보려면 databricks auth env --profile <profile-name>
명령을 실행합니다.
웹 브라우저에서 화면상의 지침을 완료하여 Azure Databricks 작업 영역에 로그인합니다.
터미널 또는 명령 프롬프트에 표시되는 사용 가능한 클러스터 목록에서 위쪽 화살표 키와 아래쪽 화살표 키를 사용하여 작업 영역에서 대상 Azure Databricks 클러스터를 선택한 다음 누릅니 Enter
다. 클러스터 표시 이름의 일부를 입력하여 사용 가능한 클러스터 목록을 필터링할 수도 있습니다.
프로필의 현재 OAuth 토큰 값과 토큰의 예정된 만료 타임스탬프를 보려면 다음 명령 중 하나를 실행합니다.
databricks auth token --host <workspace-url>
databricks auth token -p <profile-name>
databricks auth token --host <workspace-url> -p <profile-name>
동일한 --host
값을 가진 프로필이 여러 개 있는 경우, Databricks CLI가 올바르게 일치하는 OAuth 토큰 정보를 찾을 수 있도록 --host
및 -p
옵션을 함께 지정해야 할 수 있습니다.
databricks-connect
를 입력합니다.프로젝트 도구 창에서 프로젝트의 루트 폴더를 마우스 오른쪽 단추로 클릭하고 새 > Python 파일을 클릭합니다.
Python 파일을 입력 main.py
하고 두 번 클릭합니다.
다음 코드를 파일에 입력한 다음 구성 프로필의 이름에 따라 파일을 저장합니다.
1단계의 구성 프로필 이름이 지정된 DEFAULT
경우 다음 코드를 파일에 입력한 다음 파일을 저장합니다.
from databricks.connect import DatabricksSession
spark = DatabricksSession.builder.getOrCreate()
df = spark.read.table("samples.nyctaxi.trips")
df.show(5)
1단계의 구성 프로필 이름이 지정 DEFAULT
되지 않은 경우 파일에 다음 코드를 대신 입력합니다. 자리 표시자를 <profile-name>
1단계의 구성 프로필 이름으로 바꾼 다음 파일을 저장합니다.
from databricks.connect import DatabricksSession
spark = DatabricksSession.builder.profile("<profile-name>").getOrCreate()
df = spark.read.table("samples.nyctaxi.trips")
df.show(5)
samples.nyctaxi.trips
나타납니다.df.show(5)
의 여백을 클릭하여 중단점을 설정합니다.df
및 spark
변수에 대한 정보를 찾습니다.samples.nyctaxi.trips
나타납니다.Databricks Connect에 대한 자세한 내용은 다음과 같은 문서를 참조하세요.
이벤트
3월 31일 오후 11시 - 4월 2일 오후 11시
궁극적인 Microsoft Fabric, Power BI, SQL 및 AI 커뮤니티 주도 이벤트입니다. 2025년 3월 31일부터 4월 2일까지.
지금 등록학습
인증
Microsoft Certified: Azure Data Scientist Associate - Certifications
Python, Azure Machine Learning 및 MLflow를 사용하여 데이터 수집 및 준비, 모델 학습 및 배포, 기계 학습 솔루션 모니터링을 관리합니다.