Datasets - Create
Mengunggah dan membuat himpunan data baru dengan mendapatkan data dari URL tertentu atau mulai menunggu blok data diunggah.
POST {endpoint}/speechtotext/v3.2-preview.2/datasets
Parameter URI
Nama | Dalam | Diperlukan | Jenis | Deskripsi |
---|---|---|---|---|
endpoint
|
path | True |
string |
Titik akhir Cognitive Services yang didukung (protokol dan nama host, misalnya: https://westus.api.cognitive.microsoft.com). |
Isi Permintaan
Nama | Diperlukan | Jenis | Deskripsi |
---|---|---|---|
displayName | True |
string |
Nama tampilan objek. |
kind | True |
DatasetKind |
|
locale | True |
string |
Lokal data yang terkandung. |
contentUrl |
string |
URL data untuk himpunan data. |
|
customProperties |
object |
Properti kustom entitas ini. Panjang kunci maksimum yang diizinkan adalah 64 karakter, panjang nilai maksimum yang diizinkan adalah 256 karakter dan jumlah entri yang diizinkan adalah 10. |
|
description |
string |
Deskripsi objek . |
|
project |
EntityReference |
||
properties |
DatasetProperties |
Respons
Nama | Jenis | Deskripsi |
---|---|---|
201 Created |
Respons berisi informasi tentang entitas sebagai payload dan lokasinya sebagai header. Headers Location: string |
|
Other Status Codes |
Terjadi kesalahan. |
Keamanan
Ocp-Apim-Subscription-Key
Berikan kunci akun layanan kognitif Anda di sini.
Type:
apiKey
In:
header
Authorization
Berikan token akses dari JWT yang dikembalikan oleh STS wilayah ini. Pastikan untuk menambahkan cakupan manajemen ke token dengan menambahkan string kueri berikut ke URL STS: ?scope=speechservicesmanagement
Type:
apiKey
In:
header
Contoh
Create a dataset with content url |
Create dataset from data blocks |
Create a dataset with content url
Sample Request
POST {endpoint}/speechtotext/v3.2-preview.2/datasets
{
"kind": "Acoustic",
"contentUrl": "https://contoso.com/location",
"locale": "en-US",
"displayName": "My speech dataset name",
"description": "My speech dataset description"
}
Sample Response
Location: https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1
{
"self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
"kind": "Acoustic",
"contentUrl": "https://www.contoso.com/acousticdata/sourcelocation",
"links": {
"files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files"
},
"properties": {
"textNormalizationKind": "Default",
"acceptedLineCount": 11,
"rejectedLineCount": 2,
"duration": "PT4M12S"
},
"lastActionDateTime": "2019-01-07T11:36:07Z",
"status": "Succeeded",
"createdDateTime": "2019-01-07T11:34:12Z",
"locale": "en-US",
"displayName": "Acoustic dataset"
}
Create dataset from data blocks
Sample Request
POST {endpoint}/speechtotext/v3.2-preview.2/datasets
{
"kind": "Acoustic",
"locale": "en-US",
"displayName": "My speech dataset name",
"description": "My speech dataset description"
}
Sample Response
{
"self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
"kind": "Acoustic",
"links": {
"files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files",
"commitBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks:commit",
"listBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks",
"uploadBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks"
},
"lastActionDateTime": "2019-01-07T11:36:07Z",
"status": "NotStarted",
"createdDateTime": "2019-01-07T11:34:12Z",
"locale": "en-US",
"displayName": "Acoustic dataset"
}
Definisi
Nama | Deskripsi |
---|---|
Dataset |
Himpunan Data |
Dataset |
DatasetKind |
Dataset |
DatasetLinks |
Dataset |
DatasetProperties |
Detailed |
DetailedErrorCode |
Entity |
EntityError |
Entity |
EntityReference |
Error |
Kesalahan |
Error |
ErrorCode |
Inner |
InnerError |
Status |
Status |
Text |
TextNormalizationKind |
Dataset
Himpunan Data
Nama | Jenis | Deskripsi |
---|---|---|
contentUrl |
string |
URL data untuk himpunan data. |
createdDateTime |
string |
Stempel waktu saat objek dibuat. Stempel waktu dikodekan sebagai format tanggal dan waktu ISO 8601 ("YYYY-MM-DDThh:mm:ssZ", lihat https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations). |
customProperties |
object |
Properti kustom entitas ini. Panjang kunci maksimum yang diizinkan adalah 64 karakter, panjang nilai maksimum yang diizinkan adalah 256 karakter dan jumlah entri yang diizinkan adalah 10. |
description |
string |
Deskripsi objek . |
displayName |
string |
Nama tampilan objek. |
kind |
DatasetKind |
|
lastActionDateTime |
string |
Stempel waktu ketika status saat ini dimasukkan. Stempel waktu dikodekan sebagai format tanggal dan waktu ISO 8601 ("YYYY-MM-DDThh:mm:ssZ", lihat https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations). |
links |
DatasetLinks |
|
locale |
string |
Lokal data yang terkandung. |
project |
EntityReference |
|
properties |
DatasetProperties |
|
self |
string |
Lokasi entitas ini. |
status |
Status |
DatasetKind
DatasetKind
Nama | Jenis | Deskripsi |
---|---|---|
Acoustic |
string |
Himpunan data akustik. |
AudioFiles |
string |
Himpunan data file audio. |
Language |
string |
Himpunan data bahasa. |
LanguageMarkdown |
string |
Himpunan data markdown bahasa. |
OutputFormatting |
string |
Himpunan data yang berisi aturan untuk menyesuaikan normalisasi teks terbalik, kapitalisasi, reformulasi, kata-kata tidak senonoh, dan juga mendefinisikan pengujian untuk validasi himpunan data |
Pronunciation |
string |
Himpunan data pengucapan. |
DatasetLinks
DatasetLinks
Nama | Jenis | Deskripsi |
---|---|---|
commitBlocks |
string |
Lokasi untuk menerapkan daftar blok saat mengunggah himpunan data menggunakan blok. Lihat operasi "Datasets_CommitBlocks" untuk detail selengkapnya. |
files |
string |
Lokasi untuk mendapatkan semua file entitas ini. Lihat operasi "Datasets_ListFiles" untuk detail selengkapnya. |
listBlocks |
string |
Lokasi untuk mencantumkan blok entitas ini yang sudah diunggah saat mengunggah himpunan data menggunakan blok. Lihat operasi "Datasets_GetBlocks" untuk detail selengkapnya. |
uploadBlocks |
string |
Lokasi untuk mengunggah blok ke saat mengunggah himpunan data menggunakan blok. Lihat operasi "Datasets_UploadBlock" untuk detail selengkapnya. |
DatasetProperties
DatasetProperties
Nama | Jenis | Deskripsi |
---|---|---|
acceptedLineCount |
integer |
Jumlah baris yang diterima untuk himpunan data ini. |
duration |
string |
Total durasi himpunan data jika berisi file audio. Durasi dikodekan sebagai durasi ISO 8601 ("PnYnMnDTnHnMnS", lihat https://en.wikipedia.org/wiki/ISO_8601#Durations). |
string |
Alamat email untuk mengirim pemberitahuan email jika operasi selesai. Nilai akan dihapus setelah berhasil mengirim email. |
|
error |
EntityError |
|
rejectedLineCount |
integer |
Jumlah baris yang ditolak untuk himpunan data ini. |
textNormalizationKind |
TextNormalizationKind |
DetailedErrorCode
DetailedErrorCode
Nama | Jenis | Deskripsi |
---|---|---|
DataImportFailed |
string |
Impor data gagal. |
DeleteNotAllowed |
string |
Hapus tidak diperbolehkan. |
DeployNotAllowed |
string |
Penyebaran tidak diperbolehkan. |
DeployingFailedModel |
string |
Menyebarkan model yang gagal. |
EmptyRequest |
string |
Permintaan Kosong. |
EndpointCannotBeDefault |
string |
Titik akhir tidak boleh default. |
EndpointNotUpdatable |
string |
Titik akhir tidak dapat diperbarui. |
EndpointWithoutLogging |
string |
Titik akhir tanpa pengelogan. |
ExceededNumberOfRecordingsUris |
string |
Melebihi jumlah uri rekaman. |
FailedDataset |
string |
Himpunan data yang gagal. |
Forbidden |
string |
Terlarang. |
InUseViolation |
string |
Dalam pelanggaran penggunaan. |
InaccessibleCustomerStorage |
string |
Penyimpanan pelanggan yang tidak dapat diakses. |
InvalidAdaptationMapping |
string |
Pemetaan adaptasi tidak valid. |
InvalidBaseModel |
string |
Model dasar tidak valid. |
InvalidCallbackUri |
string |
Uri panggilan balik tidak valid. |
InvalidCollection |
string |
Koleksi tidak valid. |
InvalidDataset |
string |
Himpunan data tidak valid. |
InvalidDocument |
string |
Dokumen Tidak Valid. |
InvalidDocumentBatch |
string |
Batch Dokumen Tidak Valid. |
InvalidLocale |
string |
Lokal tidak valid. |
InvalidLogDate |
string |
Tanggal log tidak valid. |
InvalidLogEndTime |
string |
Waktu akhir log tidak valid. |
InvalidLogId |
string |
Id log tidak valid. |
InvalidLogStartTime |
string |
Waktu mulai log tidak valid. |
InvalidModel |
string |
Model tidak valid. |
InvalidModelUri |
string |
Uri model tidak valid. |
InvalidParameter |
string |
Parameter tidak valid. |
InvalidParameterValue |
string |
Nilai parameter tidak valid. |
InvalidPayload |
string |
Payload tidak valid. |
InvalidPermissions |
string |
Izin tidak valid. |
InvalidPrerequisite |
string |
Prasyarat tidak valid. |
InvalidProductId |
string |
Id produk tidak valid. |
InvalidProject |
string |
Proyek tidak valid. |
InvalidProjectKind |
string |
Jenis proyek tidak valid. |
InvalidRecordingsUri |
string |
Rekaman uri tidak valid. |
InvalidRequestBodyFormat |
string |
Format isi permintaan tidak valid. |
InvalidSasValidityDuration |
string |
Durasi validitas sas tidak valid. |
InvalidSkipTokenForLogs |
string |
Lewati token untuk log tidak valid. |
InvalidSourceAzureResourceId |
string |
ID sumber daya Azure sumber tidak valid. |
InvalidSubscription |
string |
Langganan tidak valid. |
InvalidTest |
string |
Tes tidak valid. |
InvalidTimeToLive |
string |
Waktu hidup tidak valid. |
InvalidTopForLogs |
string |
Atas tidak valid untuk log. |
InvalidTranscription |
string |
Transkripsi tidak valid. |
InvalidWebHookEventKind |
string |
Jenis peristiwa webhook tidak valid. |
MissingInputRecords |
string |
Rekaman Input hilang. |
ModelCopyOperationExists |
string |
Operasi penyalinan model ada. |
ModelDeploymentNotCompleteState |
string |
Status penyebaran model tidak selesai. |
ModelDeprecated |
string |
Model tidak digunakan lagi. |
ModelExists |
string |
Model ada. |
ModelMismatch |
string |
Model tidak cocok. |
ModelNotDeployable |
string |
Model tidak dapat disebarkan. |
ModelVersionIncorrect |
string |
Versi Model Salah. |
NoUtf8WithBom |
string |
Tidak ada utf8 dengan bom. |
OnlyOneOfUrlsOrContainerOrDataset |
string |
Hanya salah satu url atau kontainer atau himpunan data. |
ProjectGenderMismatch |
string |
Ketidakcocokan jenis kelamin proyek. |
QuotaViolation |
string |
Pelanggaran kuota. |
SingleDefaultEndpoint |
string |
Titik akhir default tunggal. |
SkuLimitsExist |
string |
Batas Sku ada. |
SubscriptionNotFound |
string |
Langganan tidak ditemukan. |
UnexpectedError |
string |
Kesalahan tak terduga. |
UnsupportedClassBasedAdaptation |
string |
Adaptasi berbasis kelas yang tidak didukung. |
UnsupportedDelta |
string |
Delta yang tidak didukung. |
UnsupportedDynamicConfiguration |
string |
Konfigurasi dinamis yang tidak didukung. |
UnsupportedFilter |
string |
Filter yang tidak didukung. |
UnsupportedLanguageCode |
string |
Kode bahasa tidak didukung. |
UnsupportedOrderBy |
string |
Urutan tidak didukung oleh. |
UnsupportedPagination |
string |
Penomoran halaman yang tidak didukung. |
UnsupportedTimeRange |
string |
Rentang waktu yang tidak didukung. |
EntityError
EntityError
Nama | Jenis | Deskripsi |
---|---|---|
code |
string |
Kode kesalahan ini. |
message |
string |
Pesan untuk kesalahan ini. |
EntityReference
EntityReference
Nama | Jenis | Deskripsi |
---|---|---|
self |
string |
Lokasi entitas yang dirujuk. |
Error
Kesalahan
Nama | Jenis | Deskripsi |
---|---|---|
code |
ErrorCode |
|
details |
Error[] |
Detail dukungan tambahan mengenai kesalahan dan/atau kebijakan yang diharapkan. |
innerError |
InnerError |
|
message |
string |
Pesan kesalahan tingkat tinggi. |
target |
string |
Sumber kesalahan. Misalnya "dokumen" atau "id dokumen" jika dokumen tidak valid. |
ErrorCode
ErrorCode
Nama | Jenis | Deskripsi |
---|---|---|
Conflict |
string |
Mewakili kode kesalahan konflik. |
Forbidden |
string |
Mewakili kode kesalahan terlarang. |
InternalCommunicationFailed |
string |
Mewakili kode kesalahan komunikasi internal yang gagal. |
InternalServerError |
string |
Mewakili kode kesalahan server internal. |
InvalidArgument |
string |
Mewakili kode kesalahan argumen yang tidak valid. |
InvalidRequest |
string |
Mewakili kode kesalahan permintaan yang tidak valid. |
NotAllowed |
string |
Mewakili kode kesalahan yang tidak diizinkan. |
NotFound |
string |
Mewakili kode kesalahan yang tidak ditemukan. |
PipelineError |
string |
Mewakili kode kesalahan kesalahan alur. |
ServiceUnavailable |
string |
Mewakili kode kesalahan layanan yang tidak tersedia. |
TooManyRequests |
string |
Mewakili kode kesalahan terlalu banyak permintaan. |
Unauthorized |
string |
Mewakili kode kesalahan yang tidak sah. |
UnprocessableEntity |
string |
Mewakili kode kesalahan entitas yang tidak dapat diolah. |
UnsupportedMediaType |
string |
Mewakili kode kesalahan jenis media yang tidak didukung. |
InnerError
InnerError
Nama | Jenis | Deskripsi |
---|---|---|
code |
DetailedErrorCode |
|
details |
object |
Detail dukungan tambahan mengenai kesalahan dan/atau kebijakan yang diharapkan. |
innerError |
InnerError |
|
message |
string |
Pesan kesalahan tingkat tinggi. |
target |
string |
Sumber kesalahan. Misalnya "dokumen" atau "id dokumen" jika dokumen tidak valid. |
Status
Status
Nama | Jenis | Deskripsi |
---|---|---|
Failed |
string |
Operasi yang berjalan lama telah gagal. |
NotStarted |
string |
Operasi jangka panjang belum dimulai. |
Running |
string |
Operasi jangka panjang saat ini sedang diproses. |
Succeeded |
string |
Operasi jangka panjang telah berhasil diselesaikan. |
TextNormalizationKind
TextNormalizationKind
Nama | Jenis | Deskripsi |
---|---|---|
Default |
string |
Normalisasi teks default (misalnya '2 hingga 3' digantikan oleh 'dua hingga tiga' di en-US). |
None |
string |
Tidak ada normalisasi teks yang akan diterapkan ke teks input. Ini adalah opsi ambil alih yang hanya boleh digunakan saat teks dinormalisasi sebelum unggahan. |