Microsoft Fabric Notebook을 사용하는 방법

Microsoft Fabric Notebook은 Apache Spark 작업 및 기계 학습 실험을 개발하기 위한 기본 코드 항목입니다. 데이터 과학자와 데이터 엔지니어가 풍부한 시각화 및 Markdown 텍스트를 활용하는 코드를 작성하는 데 사용하는 웹 기반 대화형 화면입니다. 데이터 엔지니어는 데이터 수집, 데이터 준비 및 데이터 변환을 위한 코드를 작성합니다. 또한 데이터 과학자는 Notebook을 사용하여 실험 및 모델 만들기, 모델 추적 및 배포를 비롯한 기계 학습 솔루션을 빌드합니다.

Fabric Notebook을 사용하면 다음을 수행할 수 있습니다.

  • 0 설정 작업을 시작합니다.
  • 직관적인 로우 코드 환경으로 데이터를 쉽게 탐색하고 처리합니다.
  • 기본 제공 엔터프라이즈 보안 기능으로 데이터 보안을 유지합니다.
  • 강력한 Spark 기능을 사용하여 원시 형식(CSV, txt, JSON 등), 처리된 파일 형식(parquet, Delta Lake 등)에서 데이터를 분석합니다.
  • 향상된 제작 기능 및 기본 제공 데이터 시각화를 통해 생산성을 높일 수 있습니다.

이 문서에서는 데이터 과학 및 데이터 엔지니어링 환경에서 Notebook을 사용하는 방법을 설명합니다.

Notebook 만들기

새 Notebook을 만들거나 기존 Notebook을 가져올 수 있습니다.

새 Notebook 만들기

다른 표준 패브릭 항목 만들기 프로세스와 마찬가지로 패브릭 데이터 엔지니어 홈페이지, 작업 영역 새로 만들기 옵션 또는 허브 만들기에서 새 Notebook을 쉽게 만들 수 있습니다.

기존 Notebook 가져오기

로컬 컴퓨터에서 패브릭 작업 영역으로 데이터 엔지니어 또는 데이터 과학 홈페이지에서 하나 이상의 기존 Notebook을 가져올 수 있습니다. 패브릭 Notebook은 표준 Jupyter Notebook .ipynb 파일 및 .py, .scala 및 .sql과 같은 소스 파일을 인식하고 그에 따라 새 Notebook 항목을 만듭니다.

Screenshot showing where to find notebook options on the New menu.

Notebook 내보내기

전자 필기장을 다른 표준 형식으로 내보낼 수 있습니다. Synapse Notebook을 다음으로 내보낼 수 있습니다.

  • Jupyter Notebook에 사용되는 표준 Notebook 파일(.ipynb)입니다.
  • 브라우저에서 직접 열 수 있는 HTML 파일(.html)입니다.
  • Python 파일(.py)입니다.
  • Latex 파일(.tex)입니다.

Screenshot showing where to export notebook.

Notebook 저장

Fabric에서는 전자 필기장을 열고 편집한 후 기본적으로 자동으로 저장됩니다. 코드 변경 내용이 손실되는 것에 대해 걱정할 필요가 없습니다. 복사본 저장을 사용하여 현재 작업 영역 또는 다른 작업 영역에 다른 복사본을 복제할 수도 있습니다.

Screenshot showing where to save a copy.

전자 필기장을 수동으로 저장하려는 경우 수동 저장 옵션으로 전환하여 전자 필기장 항목의 로컬 분기를 지정한 다음 저장 또는 Ctrl+s를 사용하여 변경 내용을 저장할 수 있습니다.

Screenshot showing where to switch manual save.

편집 -저장 옵션 ->>수동을선택하여 수동 저장 모드로 전환할 수도 있습니다. 전자 필기장의 로컬 분기를 켜고 수동으로 저장하려면 저장을 선택하거나 Ctrl+의 바로 가기 키를 사용합니다.

레이크하우스 및 노트북 커넥트

패브릭 Notebook은 이제 레이크하우스와의 긴밀한 상호 작용을 지원합니다. 레이크하우스 탐색기에서 새 레이크하우스 또는 기존 레이크하우스를 쉽게 추가할 수 있습니다.

레이크하우스 탐색기에서 다른 레이크하우스로 이동하여 하나의 레이크하우스를 고정하여 기본값으로 설정할 수 있습니다. 그러면 기본값이 런타임 작업 디렉터리에 탑재되고 로컬 경로를 사용하여 기본 레이크하우스를 읽거나 쓸 수 있습니다.

Screenshot showing where to pin a default lakehouse.

참고 항목

새 레이크하우스를 고정하거나 기본 레이크하우스의 이름을 변경한 후 세션을 다시 시작해야 합니다.

레이크하우스 추가 또는 제거

레이크하우스 이름 옆에 있는 X 아이콘을 선택하면 전자 필기장 탭에서 제거되지만 레이크하우스 항목은 여전히 작업 영역에 있습니다.

레이크하우스 추가를 선택하여 기존 레이크하우스 를 추가하거나 새 레이크하우스를 만들어 노트북에 더 많은 레이크하우스를 추가합니다.

레이크하우스 파일 탐색

Lake 보기의 테이블 및 파일 섹션 아래에 있는 하위 폴더와 파일은 Lakehouse 목록과 Notebook 콘텐츠 사이의 콘텐츠 영역에 표시됩니다. 테이블파일 섹션에서 다른 폴더를 선택하여 콘텐츠 영역을 새로 고칩니다.

폴더 및 파일 작업

마우스 오른쪽 단추를 클릭하여 파일(.csv, .parquet, .txt, .jpg, .png 등)을 선택하는 경우 Spark 또는 Pandas API를 사용하여 데이터를 로드할 수 있습니다. 포커스 셀 아래에 새 코드 셀이 생성되고 삽입됩니다.

선택 파일 또는 폴더와 다른 형식의 경로를 쉽게 복사하고 코드에서 해당 경로를 사용할 수 있습니다.

Screenshot showing context menu of files in lakehouse.

Notebook 리소스

Notebook 리소스 탐색기는 폴더 및 파일을 관리하는 데 도움이 되는 Unix와 유사한 파일 시스템을 제공합니다. 코드 모듈, 의미 체계 모델 및 이미지와 같은 작은 크기의 파일을 저장할 수 있는 쓰기 가능한 파일 시스템 공간을 제공합니다. 로컬 파일 시스템에서 작업하는 것처럼 Notebook의 코드로 쉽게 액세스할 수 있습니다.

Animated GIF of notebook resources.

이 기본 제공 폴더는 각 Notebook 인스턴스에 대해 미리 정의된 시스템 폴더입니다. 현재 Notebook의 종속성을 저장하기 위해 최대 500MB 의 스토리지를 유지합니다. Notebook 리소스의 주요 기능은 다음과 같습니다.

  • UI를 통해 만들기/삭제, 업로드/다운로드, 끌어서 놓기, 이름 바꾸기, 복제 및 검색과 같은 일반적인 작업을 사용할 수 있습니다.
  • 빠른 탐색과 같은 builtin/YourData.txt 상대 경로를 사용할 수 있습니다. 이 메서드는 mssparkutils.nbResPath 전체 경로를 작성하는 데 도움이 됩니다.
  • 레이크하우스에 쓰기 옵션을 통해 유효성이 검사된 데이터를 레이크하우스 로 쉽게 이동할 수 있습니다. Fabric에는 빠르게 시작하는 데 도움이 되는 일반적인 파일 형식에 대한 풍부한 코드 조각이 포함되어 있습니다.
  • 이러한 리소스는 다음을 통해 mssparkutils.notebook.run()참조 Notebook 실행 사례에서도 사용할 수 있습니다.

참고 항목

  • 현재 Fabric은 .py, .whl, .jar, .txt, .json, .yml, .xml, .csv, .html, .png, .jpg.xlsx 파일을 포함하여 UI를 통해 특정 파일 형식 업로드를 지원합니다. 코드를 통해 목록에 없는 파일 형식을 사용하여 기본 제공 폴더에 쓸 수 있지만 Fabric Notebook은 지원되지 않는 파일 형식에 대한 코드 조각 생성을 지원하지 않습니다.
  • 각 파일 크기는 50MB 미만이어야 하며 기본 제공 폴더는 총 100개의 파일/폴더 인스턴스를 허용합니다.
  • 사용하는 mssparkutils.notebook.run()경우 명령을 사용하여 mssparkutils.nbResPath 대상 Notebook 리소스에 액세스합니다. 상대 경로 "builtin/"은 항상 루트 Notebook의 기본 제공 폴더를 가리킵니다.

Notebook에서 공동 작업

Fabric Notebook은 여러 사용자가 동일한 전자 필기장을 편집할 수 있도록 지원하는 공동 작업 항목입니다.

전자 필기장을 열면 기본적으로 공동 편집 모드로 전환되고 모든 전자 필기장 편집이 자동으로 저장됩니다. 동료가 같은 전자 필기장을 동시에 열면 프로필, 실행 출력, 커서 표시기, 선택 표시기 및 편집 추적이 표시됩니다. 공동 작업 기능을 사용하면 쌍 프로그래밍, 원격 디버깅 및 튜터링 시나리오를 쉽게 수행할 수 있습니다.

Screenshot showing a code cell with another user editing.

전자 필기장 공유

전자 필기장을 공유하는 것은 팀 구성원과 공동 작업하는 편리한 방법입니다. 권한 있는 작업 영역 역할은 기본적으로 Notebook을 보거나 편집/실행할 수 있습니다. 지정된 사용 권한이 부여된 전자 필기장을 공유할 수 있습니다.

  1. Notebook 도구 모음에서 공유를 선택합니다.

    Screenshot showing where to select Share.

  2. 이 전자 필기장을 볼 수 있는 사람의 해당 범주를 선택합니다. 받는 사람에 대한 공유, 편집 또는 실행 권한을 선택할 수 있습니다.

    Screenshot showing where to select permissions.

  3. 적용을 선택한 후 전자 필기장을 직접 보내거나 링크를 다른 사람에게 복사할 수 있습니다. 그러면 받는 사람이 사용 권한 수준에서 부여한 해당 보기로 전자 필기장을 열 수 있습니다.

    Screenshot showing where to create and send link.

  4. Notebook 권한을 추가로 관리하려면 작업 영역 항목 목록>추가 옵션을 선택한 다음, 권한 관리를 선택합니다. 해당 화면에서 기존 Notebook 액세스 및 권한을 업데이트할 수 있습니다.

    Screenshot showing where to manage permissions in workspace.

코드 셀 주석 달기

주석 처리는 공동 작업 시나리오에 유용한 또 다른 기능입니다. 현재 Fabric은 셀 수준 주석 추가를 지원합니다.

  1. 전자 필기장 도구 모음 또는 셀 메모 표시기에서 메모 단추를 선택하여 메모 창을 엽니다.

    Screenshot showing where to select Comment.

  2. 코드 셀에서 코드를 선택하고, 메모 창에서 새로 만들기를 선택하고, 메모를 추가한 다음, 메모 게시를 선택하여 저장합니다.

    Screenshot showing where to select New.

  3. 필요한 경우 메모 옆에 있는 자세히 옵션을 선택하여 메모 편집, 스레드 해결 및 스레드 삭제 옵션을 찾습니다.

Notebook 모드 전환

패브릭 Notebook은 쉽게 전환 할 수 있는 두 가지 모드인 편집 모드와 보기 모드를 지원합니다.

Screenshot showing where switch modes.

  • 편집 모드: 셀을 편집 및 실행하고 전자 필기장에서 다른 사용자와 공동 작업할 수 있습니다.
  • 보기 모드: Notebook의 셀 내용, 출력 및 메모만 볼 수 있습니다. Notebook을 변경하는 모든 작업은 사용하지 않도록 설정됩니다.