Bagikan melalui


core Paket

Berisi fungsi inti untuk alur Azure Machine Learning, yang merupakan alur kerja pembelajaran mesin yang dapat dikonfigurasi.

Alur Azure Machine Learning memungkinkan Anda membuat alur kerja pembelajaran mesin yang dapat digunakan kembali dan dapat digunakan sebagai templat untuk skenario pembelajaran mesin Anda. Paket ini berisi fungsionalitas inti untuk bekerja dengan alur AML dan biasanya digunakan bersama dengan kelas dalam paket steps.

Alur pembelajaran mesin ditunjukkan dengan kumpulan objek PipelineStep yang dapat diurutkan dan disejajarkan, atau dibuat dengan dependensi eksplisit di antara langkah-langkah. Langkah-langkah alur digunakan untuk menentukan objek Pipeline yang menunjukkan alur kerja yang akan dijalankan. Anda dapat membuat dan bekerja dengan alur di Jupyter Notebook atau IDE lainnya dengan SDK AML yang terpasang.

Alur AML memungkinkan Anda untuk fokus pada pembelajaran mesin daripada infrastruktur. Untuk mulai membangun alur, lihat https://aka.ms/pl-first-pipeline.

Untuk informasi selengkapnya tentang keuntungan Alur Azure Machine Learning dan bagaimana kaitannya dengan alur lain yang ditawarkan oleh Azure, lihat Apa itu alur ML dalam Azure Machine Learning service?

Modul

builder

Menentukan kelas untuk membangun alur Azure Machine Learning.

Grafik alur terdiri dari langkah-langkah alur (PipelineStep), data alur opsional (PipelineData) diproduksi atau dikonsumsi di setiap langkah, dan urutan eksekusi langkah opsional (StepSequence).

graph

Menentukan kelas untuk membangun grafik alur Azure Machine Learning.

Grafik alur Azure Machine Learning dibuat untuk objek Pipeline, saat Anda menggunakan objek PipelineStep (dan kelas turunan), PipelineData, dan PipelineData. Dalam kasus penggunaan biasa, Anda tidak perlu langsung menggunakan kelas dalam modul ini.

Grafik jalur pipa terdiri dari node modul yang menunjukkan unit dasar seperti sumber data atau langkah. Simpul dapat memiliki port input dan port output, dan parameter terkait. Edge menentukan hubungan antara dua port simpul dalam grafik.

module

Berisi kelas untuk membuat dan mengelola pelajaran komputasi yang dapat digunakan kembali dari alur Azure Machine Learning.

Modul memungkinkan Anda untuk membuat pelajaran komputasi dalam Pipeline, yang dapat memiliki input, output, dan bergantung pada parameter dan konfigurasi lingkungan untuk beroperasi. Modul dapat berversi dan digunakan dalam berbagai alur Azure Machine Learning, tidak seperti PipelineStep (dan kelas turunan) yang digunakan dalam satu Alur.

Modul dirancang untuk digunakan kembali dalam beberapa alur dan dapat berevolusi untuk mengadaptasi logika komputasi tertentu untuk kasus penggunaan yang berbeda. Sebuah langkah dalam alur dapat digunakan dalam perulangan cepat untuk memperbaiki algoritma, dan setelah tujuan tercapai, algoritma biasanya diterbitkan sebagai modul untuk mengaktifkan penggunaan kembali.

module_step_base

Berisi fungsionalitas untuk menambahkan langkah ke alur menggunakan versi Module.

pipeline

Menentukan kelas untuk membuat alur kerja Azure Machine Learning yang dapat digunakan kembali.

pipeline_draft

Menentukan kelas untuk mengelola alur yang dapat diubah.

pipeline_endpoint

Menentukan kelas untuk mengelola alur, termasuk penerapan versi dan titik akhir.

pipeline_output_dataset

Berisi fungsionalitas untuk mempromosikan output perantara ke Himpunan Data Azure Machine Learning.

Data perantara (output) dalam alur secara default tidak akan menjadi Himpunan Data Azure Machine Learning. Untuk mempromosikan data perantara ke Himpunan Data Azure Machine Learning, panggil metode as_dataset di kelas PipelineData untuk mengembalikan objek PipelineOutputFileDataset. Dari objek PipelineOutputFileDataset, Anda kemudian dapat membuat objek PipelineOutputTabularDataset.

run

Menentukan kelas untuk alur yang dikirimkan, termasuk kelas untuk memeriksa status dan mengambil detail eksekusi.

schedule

Tentukan kelas untuk menjadwalkan pengiriman Alur Azure Machine Learning.

Kelas

InputPortBinding

Menentukan pengikatan data dari sumber ke input langkah alur.

InputPortBinding dapat digunakan sebagai input untuk suatu langkah. Sumber dapat berupa PipelineData, PortDataReference, DataReference, PipelineDataset, atau OutputPortBinding.

InputPortBinding berguna untuk menentukan nama input langkah, jika harus berbeda dari nama objek pengikatan (yaitu untuk menghindari duplikat nama input/output atau karena skrip langkah memerlukan input untuk memiliki nama tertentu). Ini juga dapat digunakan untuk menentukan bind_mode untuk input PythonScriptStep.

Menginisialisasi InputPortBinding.

Module

Menunjukkan pelajaran komputasi yang digunakan dalam alur Azure Machine Learning.

Modul adalah kumpulan file yang akan berjalan pada target komputasi dan deskripsi antarmuka. Kumpulan file dapat berupa skrip, biner, atau file lain yang diperlukan untuk dijalankan pada target komputasi. Antarmuka modul menjelaskan input, output, dan definisi parameter. Itu tidak mengikatnya ke nilai atau data tertentu. Modul memiliki snapshot yang terkait dengannya, yang mengambil koleksi file yang ditentukan untuk modul.

Inisialisasi Modul.

ModuleVersion

Mewakili unit komputasi aktual dalam Module.

Anda tidak boleh menggunakan kelas ini secara langsung. Sebagai gantinya, gunakan salah satu metode publikasi kelas Module.

Menginisialisasi ModuleVersion.

ModuleVersionDescriptor

Menentukan versi dan ID dari ModuleVersion.

Menginisialisasi ModuleVersionDescriptor.

OutputPortBinding

Mendefinisikan output bernama dari langkah alur.

OutputPortBinding dapat digunakan untuk menentukan jenis data yang akan dibuat oleh langkah dan bagaimana data akan dibuat. Ini dapat digunakan dengan InputPortBinding untuk menentukan bahwa output langkah adalah input yang diperlukan dari langkah lain.

Menginisialisasi OutputPortBinding.

Pipeline

Mewakili kumpulan langkah-langkah yang dapat dijalankan sebagai alur kerja Azure Machine Learning yang dapat digunakan kembali.

Gunakan Alur untuk membuat dan mengelola alur kerja yang merangkai berbagai fase pembelajaran mesin. Setiap fase pembelajaran mesin, seperti penyiapan data dan pelatihan model, dapat terdiri dari satu atau lebih langkah dalam Alur.

Untuk gambaran umum tentang mengapa dan kapan harus menggunakan Alur, lihat https://aka.ms/pl-concept.

Untuk gambaran umum tentang membangun Alur, lihat https://aka.ms/pl-first-pipeline.

Menginisialisasi Alur.

PipelineData

Mewakili data perantara dalam alur Azure Machine Learning.

Data yang digunakan dalam alur dapat dihasilkan dengan satu langkah dan dikonsumsi dalam langkah lain dengan menyediakan objek PipelineData sebagai output dari satu langkah dan input dari satu atau lebih langkah selanjutnya.

Catatan jika Anda menggunakan data alur, pastikan direktori yang digunakan tersedia.

Contoh python untuk memastikan direktori tersedia, misalnya Anda memiliki port output bernama output_folder dalam satu langkah alur, Anda ingin menulis beberapa data ke jalur relatif di folder ini.


   import os
   os.makedirs(args.output_folder, exist_ok=True)
   f = open(args.output_folder + '/relative_path/file_name', 'w+')

PipelineData menggunakan DataReference yang mendasarinya yang bukan lagi merupakan pendekatan yang disarankan untuk akses dan pengiriman data, silakan gunakan OutputFileDatasetConfig sebagai gantinya, Anda dapat menemukan sampel di sini: Alur menggunakan OutputFileDatasetConfig.

Menginisialisasi PipelineData.

PipelineDataset

Bertindak sebagai adapter untuk Himpunan Data dan Alur.

Catatan

Kelas ini tidak digunakan lagi. Pelajari cara menggunakan himpunan data dengan alur, lihat https://aka.ms/pipeline-with-dataset.

Ini adalah kelas internal. Anda tidak boleh membuat kelas ini secara langsung melainkan memanggil metode instans as_* pada kelas Himpunan Data atau OutputDatasetConfig.

Bertindak sebagai adaptor untuk Himpunan Data dan Alur.

Ini adalah kelas internal. Anda tidak boleh membuat kelas ini secara langsung melainkan memanggil metode instans as_* pada kelas Himpunan Data atau OutputDatasetConfig.

PipelineDraft

Mewakili alur yang dapat berubah yang dapat digunakan untuk mengirimkan eksekusi dan membuat Alur yang Diterbitkan.

Gunakan PipelineDrafts untuk melakukan perulangan pada Alur. PipelineDrafts dapat dibuat dari awal, PipelineDraft lain, atau alur yang ada: Pipeline, PublishedPipeline, atau PipelineRun.

Menginisialisasi PipelineDraft.

PipelineEndpoint

Mewakili alur kerja Pipeline yang dapat dipicu dari URL titik akhir yang unik.

PipelineEndpoints dapat digunakan untuk membuat versi baru PublishedPipeline sekaligus mempertahankan titik akhir yang sama. PipelineEndpoints diberi nama unik di dalam ruang kerja.

Dengan menggunakan atribut titik akhir pada objek PipelineEndpoint, Anda dapat memicu alur baru berjalan dari aplikasi eksternal dengan panggilan REST. Untuk informasi tentang cara mengautentikasi saat memanggil titik akhir REST, lihat https://aka.ms/pl-restep-auth.

Untuk informasi selengkapnya tentang membuat dan menjalankan alur pembelajaran mesin, lihat https://aka.ms/pl-first-pipeline.

Menginisialisasi PipelineEndpoint.

PipelineParameter

Menentukan parameter dalam eksekusi alur.

Gunakan PipelineParameters untuk membangun Alur serbaguna yang dapat dikirim ulang nanti dengan nilai parameter yang bervariasi.

Menginisialisasi parameter alur.

PipelineRun

Mewakili eksekusi dari Pipeline.

Kelas ini dapat digunakan untuk mengelola, memeriksa status, dan mengambil detail eksekusi setelah alur dijalankan. Gunakan get_steps untuk mengambil objek StepRun yang dibuat oleh alur yang dijalankan. Kegunaan lain termasuk mengambil objek Graph yang terkait dengan eksekusi alur, mengambil status eksekusi alur, dan menunggu penyelesaian eksekusi.

Menginisialisasi eksekusi Alur.

PipelineStep

Menunjukkan langkah eksekusi dalam alur Azure Machine Learning.

Alur dibangun dari beberapa langkah alur, yang merupakan unit komputasi berbeda di dalam alur. Setiap langkah dapat berjalan secara independen dan menggunakan sumber daya komputasi yang terisolasi. Setiap langkah biasanya memiliki input, output, dan parameternya dengan namanya sendiri.

Kelas PipelineStep adalah kelas dasar yang diwarisi kelas langkah bawaan lainnya yang dirancang untuk skenario umum, seperti PythonScriptStep, DataTransferStep, dan HyperDriveStep.

Untuk gambaran umum tentang hubungan Alur dan PipelineSteps, lihat Apa itu Alur Azure Machine Learning.

Menginisialisasi PipelineStep.

PortDataReference

Model data yang terkait dengan output dari StepRun yang telah selesai.

Objek PortDataReference dapat digunakan untuk mengunduh data output yang dibuat oleh StepRun. Ini juga dapat digunakan sebagai input langkah di Alur masa mendatang.

Menginisialisasi PortDataReference.

PublishedPipeline

Mewakili Alur yang akan dikirimkan tanpa kode Python yang membuatnya.

Selain itu, PublishedPipeline dapat digunakan untuk mengirim ulang Pipeline dengan nilai dan input PipelineParameter yang berbeda.

Menginisialisasi PublishedPipeline.

:p aram URL titik akhir REST untuk mengirimkan eksekusi alur untuk alur ini. :type endpoint: str :p aram total_run_steps: Jumlah langkah dalam alur ini :type total_run_steps: int :p aram workspace: Ruang kerja alur yang diterbitkan. :type workspace: azureml.core.Workspace :p aram continue_on_step_failure: Apakah akan melanjutkan eksekusi langkah-langkah lain di PipelineRun

jika langkah gagal, defaultnya adalah false.

Schedule

Tentukan jadwal untuk mengirimkan alur.

Setelah Alur diterbitkan, Jadwal dapat digunakan untuk mengirimkan Alur pada interval tertentu atau saat perubahan pada lokasi penyimpanan Blob terdeteksi.

Menginisialisasi Jadwal.

ScheduleRecurrence

Menentukan frekuensi, interval, dan waktu mulai dari alur Schedule.

ScheduleRecurrence juga memungkinkan Anda untuk menentukan zona waktu dan jam atau menit atau minggu hari untuk pengulangan.

Menginisialisasi pengulangan jadwal.

Ini juga memungkinkan untuk menentukan zona waktu dan jam atau menit atau hari minggu untuk pengulangan.

StepRun

Sebuah eksekusi dari langkah di dalam Pipeline.

Kelas ini dapat digunakan untuk mengelola, memeriksa status, dan mengambil detail eksekusi setelah alur induk dijalankan dan alur telah mengirimkan langkah yang dijalankan.

Menginisialisasi StepRun.

StepRunOutput

Menunjukkan output yang dibuat oleh StepRun dalam Alur.

StepRunOutput dapat digunakan untuk mengakses PortDataReference yang dibuat oleh langkah tersebut.

Inisialisasi StepRunOutput.

StepSequence

Mewakili daftar langkah-langkah dalam Pipeline dan urutan dijalankannya.

Gunakan StepSequence saat menginisialisasi alur untuk membuat alur kerja yang berisi langkah-langkah untuk dijalankan dalam urutan tertentu.

Inisialisasi StepSequence.

TrainingOutput

Menentukan output khusus dari PipelineSteps tertentu untuk digunakan dalam alur.

TrainingOutput memungkinkan metrik atau model pembelajaran mesin otomatis tersedia sebagai output langkah untuk digunakan oleh langkah lain dalam Alur Azure Machine Learning. Dapat digunakan dengan AutoMLStep atau HyperDriveStep.

Menginisialisasi TrainingOutput.

param model_file: File model tertentu yang akan disertakan dalam output. Hanya untuk HyperDriveStep.

Enum

TimeZone

Menghitung zona waktu yang valid untuk pengulangan Schedule.