Toplu transkripsiyon için ses dosyalarını bulma

Depolamadaki büyük miktarda ses verilerinin dökümünü almak için toplu transkripsiyonu kullanın. Toplu transkripsiyon, ses dosyalarına Azure'ın içinden veya dışından erişebilir.

Kaynak ses dosyalarını Azure dışında depoladığınızda, hizmet bunlara genel bir URI (örneğin https://crbn.us/hello.wav) aracılığıyla erişebilir. Dosyalara doğrudan erişebildiğinizden emin olun: Hizmet, dosyaya erişilmeden önce kimlik doğrulaması gerektiren veya etkileşimli betikleri çağıran URI'leri desteklemez.

Azure Blob depolamada depolanan ses dosyalarına iki yöntemden biriyle erişin:

Transkripsiyon oluştururken bir veya birden çok ses dosyası belirtin. İstek başına birden çok dosya sağlayın veya dökümü yapılan ses dosyalarıyla bir Azure Blob depolama kapsayıcısına işaret edin. Toplu transkripsiyon hizmeti çok sayıda gönderilen transkripsiyonu işleyebilir. Hizmet, dosyaların dökümünü eşzamanlı olarak alır ve bu da geri dönüş süresini kısaltır.

Desteklenen giriş biçimleri ve codec bileşenleri

Toplu transkripsiyon API'si ve hızlı transkripsiyon API'si aşağıdakiler gibi birden çok biçimi ve codec'i destekler:

  • WAV
  • MP3
  • OPUS/OGG
  • FLAC (Kayıpsız Ses Kodlayıcı)
  • WMA
  • AAC (İleri Ses Kodlayıcı)
  • WAV kapsayıcısında ALAW
  • WAV kapsayıcısında MULAW
  • Antimikrobiyal Direnç (AMR)
  • WebM
  • SPEEX

Not

Batch transkripsiyon hizmeti GStreamer'ı tümleştirir ve hata döndürmeden daha fazla biçim ve codec'i kabul edebilir. En iyi transkripsiyon kalitesini sağlamak için WAV (PCM kodlaması) ve FLAC gibi kayıpsız biçimleri kullanın.

Azure Blob Depolama'ya yükleme

Ses dosyaları bir Azure Blob Depolama hesabındayken, tek tek ses dosyalarının veya Azure Blob Depolama kapsayıcısının tamamının dökümünü isteyebilirsiniz. Transkripsiyon sonuçlarını bir Blob kapsayıcısına da yazabilirsiniz.

Not

Blob ve kapsayıcı sınırları için bkz Toplu Transkripsiyon Kotaları ve Sınırları.

Depolama hesabı oluşturmak ve WAV dosyalarını yerel dizininizden yeni bir kapsayıcıya yüklemek için bu adımları izleyin.

  1. Azure portalına gidin ve Azure hesabınızla oturum açın.
  2. Azure portalında bir Depolama hesabı kaynağı oluşturun. Konuşma kaynağınızla aynı aboneliği ve kaynak grubunu kullanın.
  3. Depolama hesabını seçin.
  4. Sol bölmedeki Veri depolama grubunda Kapsayıcılar'ı seçin.
  5. + Kapsayıcı'yı seçin.
  6. Yeni kapsayıcı için bir ad girin ve Oluştur'u seçin.
  7. Yeni kapsayıcıyı seçin.
  8. Yükle'yi seçin.
  9. Yüklemek için dosyaları seçin ve Yükle'yi tıklayın.

Güvenilen Azure hizmetleri güvenlik mekanizması

Bu bölümde , güvenilen Azure hizmetleri güvenlik mekanizmasını kullanarak bir Azure Depolama hesabındaki toplu transkripsiyon kaynak ses dosyalarınıza erişimin nasıl ayarlanacağı ve sınırlanacağı açıklanmaktadır.

Not

Güvenilen Azure hizmetleri güvenlik mekanizmasını kullanarak ses dosyalarını depolamak için Azure Blob depolama kullanmanız gerekir. Azure Dosyalar'ın kullanımı desteklenmez.

Bu bölümdeki tüm eylemleri gerçekleştirirseniz Depolama hesabınız aşağıdaki gibi yapılandırılır:

  • Tüm dış ağ trafiğine erişim yasaktır.
  • Depolama hesabı anahtarını kullanarak Depolama hesabına erişim yasaktır.
  • Paylaşılan erişim imzalarını (SAS) kullanarak Depolama hesabı blob depolamasına erişim yasaktır.
  • Seçilen Konuşma kaynağına erişime, kaynak sistemi tarafından atanan yönetilen kimlik kullanılarak izin verilir.

Aslında, Depolama hesabınız tamamen kilitlenir ve yeni yapılandırma uygulandığında zaten mevcut olan ses dosyalarının transkribe edilmesi dışında hiçbir senaryoda kullanılamaz. Bu yapılandırmayı ses verilerinizin güvenliği için bir model olarak düşünün ve ihtiyaçlarınıza göre özelleştirin.

Örneğin, seçilen genel IP adreslerinden ve Azure Sanal ağlarından gelen trafiğe izin vekleyebilirsiniz. Depolama hesabınıza erişimi özel uç noktaları kullanarak da ayarlayabilirsiniz ( bu öğreticiye bakın), Depolama hesabı anahtarını kullanarak erişimi yeniden etkinleştirebilir, diğer Azure güvenilen hizmetlerine erişime izin verebilir vb.

Not

Depolama hesabının güvenliğini sağlamak için Konuşma için özel uç noktaların kullanılması gerekmez. Kaynak ses dosyalarına güvenli bir depolama hesabından erişirken veya tersine, toplu transkripsiyon API istekleri için özel bir uç nokta kullanabilirsiniz.

Bu bölümdeki adımları izleyerek depolama hesabına erişimi ciddi şekilde kısıtlarsınız. Ardından Konuşma hizmeti kaynağının yönetilen kimliği için Depolama hesabına erişmek üzere gereken en düşük izinleri atarsınız.

Konuşma kaynağı için sistem tarafından atanan yönetilen kimliği etkinleştirme

Toplu transkripsiyon için kullandığınız Konuşma kaynağı için sistem tarafından atanan yönetilen kimliği etkinleştirmek için bu adımları izleyin.

  1. Azure portalına gidin ve Azure hesabınızla oturum açın.

  2. Konuşma kaynağını seçin.

  3. Sol bölmedeki Kaynak Yönetimi grubunda Kimlik'i seçin.

  4. Sistem tarafından atanan sekmesinde, durumu Açık olarak seçin.

    Önemli

    Kullanıcı tarafından atanan yönetilen kimlik, toplu transkripsiyon depolama hesabı senaryosunun gereksinimlerini karşılamıyor. Sistem tarafından atanan yönetilen kimliği etkinleştirdiğinizden emin olun.

  5. Kaydet'i seçin.

Artık Konuşma kaynağınızın yönetilen kimliğini depolama hesabınıza atayabilirsiniz.

Depolama hesabına erişimi kısıtlama

Depolama hesabına erişimi kısıtlamak için bu adımları izleyin.

Önemli

Depolama hesabı erişimini kilit altına almadan önce blob kapsayıcısına ses dosyalarını yükleyin.

  1. Azure portalına gidin ve Azure hesabınızla oturum açın.
  2. Depolama hesabını seçin.
  3. Sol bölmedeki Ayarlar grubunda Yapılandırma'yı seçin.
  4. Blob anonim erişimine izin ver için Devre Dışı seçin.
  5. Depolama hesabı anahtarı erişimine izin ver için Devre Dışı seçin.
  6. Kaydet'i seçin.

Daha fazla bilgi için bkz . Kapsayıcılara ve bloblara anonim genel okuma erişimini engelleme ve Azure Depolama hesabı için Paylaşılan Anahtar yetkilendirmesini engelleme.

Azure Depolama güvenlik duvarını yapılandırma

Depolama hesabına erişimi kısıtladıktan sonra, belirli yönetilen kimliklere erişim verin. Konuşma kaynağına erişim eklemek için bu adımları izleyin.

  1. Azure portalına gidin ve Azure hesabınızla oturum açın.

  2. Depolama hesabını seçin.

  3. Sol bölmedeki Güvenlik + ağ grubunda Ağ'ı seçin.

  4. Güvenlik duvarları ve sanal ağlar sekmesinde Seçili sanal ağlardan ve IP adreslerinden etkinleştirildi'yi seçin.

  5. Tüm onay kutularının seçimini kaldırın.

  6. Microsoft ağ yönlendirmesi'nin seçili olduğundan emin olun.

  7. Kaynak örnekleri bölümünde kaynak türü olarak Microsoft.CognitiveServices/accounts öğesini seçin ve örnek adı olarak Konuşma kaynağınızı seçin.

  8. Kaydet'i seçin.

    Not

    Ağ değişikliklerinin yayılması beş dakika kadar sürebilir.

Ağ erişimine artık izin verilse de Konuşma kaynağı henüz Depolama hesabındaki verilere erişemiyor. Konuşma kaynağı için yönetilen kimliğe belirli bir erişim rolü atamanız gerekir.

Kaynak erişim rolü atama

Depolama Blobu Veri Okuyucusu rolünü Konuşma kaynağınızın yönetilen kimliğine atamak için bu adımları izleyin.

Önemli

Sonraki adımlarda işlemi gerçekleştirmek için Depolama hesabının Sahip rolüne veya daha yüksek bir kapsama (Abonelik gibi) atanmalısınız. Bu gereksinim, yalnızca Sahip rolünün başkalarına rol atayabilmesinden kaynaklanabilir. Ayrıntılar için buraya bakın.

  1. Azure portalına gidin ve Azure hesabınızla oturum açın.

  2. Depolama hesabını seçin.

  3. Sol bölmede Erişim Denetimi (IAM) menüsünü seçin.

  4. Bu kaynağa erişim izni ver kutucuğunda Rol ataması ekle'yi seçin.

  5. Rol altında Depolama Blobu Veri Okuyucusu'nu seçin ve ardından İleri'yi seçin.

  6. Üyeler altında Yönetilen kimlik'i seçin, ardından >.

  7. Konuşma kaynağınızın yönetilen kimliğini atayın ve Gözden geçir + ata'yı seçin.

    Yönetilen rol ataması gözden geçirmesinin ekran görüntüsü.

  8. Ayarları onayladıktan sonra Gözden geçir + ata seçin.

Konuşma kaynağına ait yönetilen kimlik artık Depolama hesabına erişime sahip ve bu sayede toplu transkripsiyon için ses dosyalarına erişebilir.

Sistem tarafından atanan yönetilen kimlikle, toplu transkripsiyon isteği oluştururken düz bir Depolama Hesabı URL'si (SAS veya başka eklemeler olmadan) kullanın. Örneğin:

{
    "contentContainerUrl": "https://<storage_account_name>.blob.core.windows.net/<container_name>"
}

Aksi takdirde kapsayıcıda tek tek dosyalar belirtebilirsiniz. Örneğin:

{
    "contentUrls": [
        "https://<storage_account_name>.blob.core.windows.net/<container_name>/<file_name_1>",
        "https://<storage_account_name>.blob.core.windows.net/<container_name>/<file_name_2>"
    ]
}

Toplu transkripsiyon için SAS URL'si

Paylaşılan erişim imzası (SAS), Azure Depolama kapsayıcısına kısıtlı erişim sağlayan bir URI'dir. Depolama hesabı anahtarınızı paylaşmadan belirli bir zaman aralığı için toplu transkripsiyon dosyalarınıza erişim vermek istediğinizde bunu kullanın.

İpucu

Konuşma kaynağınızın toplu transkripsiyon kaynak dosyalarıyla kapsayıcıya erişmesini istiyorsanız, bunun yerine güvenilen Azure hizmetleri güvenlik mekanizmasını kullanın.

Toplu transkripsiyonlar için kullanabileceğiniz bir SAS URL'si oluşturmak için bu adımları izleyin.

  1. Azure Blob Depolama yükleme adımlarını tamamlayarak depolama hesabı oluşturun ve ses dosyalarını yeni bir kapsayıcıya yükleyin.

  2. Yeni kapsayıcıyı seçin.

  3. Sol bölmedeki Ayarlar grubunda Paylaşılan erişim belirteçleri'ni seçin.

    Not

    Kapsayıcıya önce gidin, böylece Paylaşılan erişim belirteçleriniaçmadan önce belirtecin bu kapsayıcı için kapsamlandığından emin olun.

  4. İzinler için Oku ve Listele'yi seçin.

    Kapsayıcı SAS URI izinlerinin ekran görüntüsü.

  5. SAS URI'sinin başlangıç ve bitiş saatlerini girin veya varsayılan değerleri değiştirmeyin.

  6. SAS belirteci ve URL oluştur'u seçin.

Toplu transkripsiyon isteği oluştururken SAS URL'sini kullanırsınız. Örneğin:

{
    "contentContainerUrl": "https://<storage_account_name>.blob.core.windows.net/<container_name>?SAS_TOKEN"
}

Aksi takdirde kapsayıcıda tek tek dosyalar belirtebilirsiniz. Her dosya için okuma (r) izinlerine sahip farklı bir SAS URL'si oluşturmanız ve kullanmanız gerekir. Örneğin:

{
    "contentUrls": [
        "https://<storage_account_name>.blob.core.windows.net/<container_name>/<file_name_1>?SAS_TOKEN_1",
        "https://<storage_account_name>.blob.core.windows.net/<container_name>/<file_name_2>?SAS_TOKEN_2"
    ]
}