Aracılığıyla paylaş


AssemblyAI (Önizleme)

AssemblyAI'nin Konuşma yapay zekasını kullanarak sesten veri dökümü alın ve ayıklayın.

Bu bağlayıcı aşağıdaki ürün ve bölgelerde kullanılabilir:

Hizmet Class Bölgeler
Copilot Studio Premium Aşağıdakiler dışında tüm Power Automate bölgeleri :
     - ABD Kamu (GCC)
     - US Government (GCC High)
     - 21Vianet tarafından işletilen Çin Bulutu
     - ABD Savunma Bakanlığı (DoD)
Logic Apps Standart Aşağıdakiler dışında tüm Logic Apps bölgeleri :
     - Azure Kamu bölgeleri
     - Azure Çin bölgeleri
     - ABD Savunma Bakanlığı (DoD)
Power Apps Premium Aşağıdakiler dışında tüm Power Apps bölgeleri :
     - ABD Kamu (GCC)
     - US Government (GCC High)
     - 21Vianet tarafından işletilen Çin Bulutu
     - ABD Savunma Bakanlığı (DoD)
Power Automate Premium Aşağıdakiler dışında tüm Power Automate bölgeleri :
     - ABD Kamu (GCC)
     - US Government (GCC High)
     - 21Vianet tarafından işletilen Çin Bulutu
     - ABD Savunma Bakanlığı (DoD)
İletişim
İsim Support
URL https://www.assemblyai.com/docs/
E-posta support@assemblyai.com
Bağlayıcı Meta Verileri
Publisher AssemblyAI
Web sitesi https://www.assemblyai.com
Gizlilik ilkesi https://www.assemblyai.com/legal/privacy-policy
Kategoriler AI

AssemblyAI Bağlayıcısı ile, ses verilerini konuşma tanıma modelleri ile transkribe ederek, ses zekası modelleriyle analiz ederek ve LLM'lerle bunun üzerinde üretken özellikler oluşturarak ses verilerini işlemek için AssemblyAI'nin modellerini kullanabilirsiniz.

  • Konuşmacıyı dağıtma, özel yazım denetimi, özel sözlük gibi birçok yapılandırılabilir özelliği içeren Konuşmayı Metne Dönüştürme.
  • Ses Zekası Modelleri , transkripsiyon yapılandırması aracılığıyla kullanılabilen ve yapılandırılan ek yapay zeka modelleridir.
  • LeMUR , çok büyük transkriptler için kendi RAG altyapınızı oluşturmanıza gerek kalmadan transkriptlerinize çeşitli LLM modelleri uygulamanızı sağlar.

Önkoşullar

Devam etmek için aşağıdakilere ihtiyacınız olacaktır:

Kimlik bilgilerini alma

Bir hesaba kaydolupapi anahtarını panodan kopyalayarak AssemblyAI API anahtarını ücretsiz alabilirsiniz.

Bağlayıcınızı kullanmaya başlama

AssemblyAI bağlayıcısını kullanarak ses dökümünü almak için bu adımları izleyin.

Bir Dosya Yükle

AssemblyAI kullanarak bir ses dosyasının dökümünü almak için dosyanın AssemblyAI tarafından erişilebilir olması gerekir. Ses dosyanıza zaten bir URL üzerinden erişilebilir durumdaysa mevcut URL'nizi kullanabilirsiniz.

Aksi takdirde, bir dosyayı AssemblyAI'ye yüklemek için eylemi kullanabilirsiniz Upload a File . Dosyanız için yalnızca API anahtarınızı kullanarak döküm oluşturmak için kullanılabilecek bir URL alırsınız. Dosyanın dökümünü aldıktan sonra, dosya AssemblyAI'nin sunucularından kaldırılır.

Ses Dökümü

Sesinizin dökümünü almak için ses dosyası URL'nizi kullanarak parametresini yapılandırın Audio URL . Ardından, daha fazla Konuşma Tanıma özelliği ve Ses Zekası modeli etkinleştirmek için ek parametreleri yapılandırın.

Transcribe Audio eyleminin sonucu, hemen işlenmeye başlayacak kuyruğa alınmış bir transkripttir. Tamamlanan transkripti almak için iki seçeneğiniz vardır:

  1. Transkript Hazır Web Kancasını İşleme
  2. Transkript Durumunu Yoklama

Transkript Hazır Web Kancasını İşleme

Logic Apps veya Power Automate kullanarak web kancasını işlemek istemiyorsanız, eyleminizde Transcribe Audio parametresini yapılandırın Webhook URL ve AssemblyAI'nin web kancası belgelerini izleyerek web kancanızı uygulayın.

Logic Apps veya Power Automate kullanarak web kancasını işlemek için şu adımları izleyin:

  1. Ayrı bir Mantıksal Uygulama veya Power Automate Akışı oluşturma

  2. Tetikleyici olarak yapılandırın When an HTTP request is received :

    • Who Can Trigger The Flow? seçeneğini Anyone olarak ayarlayın
    • Şu şekilde ayarlayın Request Body JSON Schema :
      {
        "type": "object",
        "properties": {
          "transcript_id": {
            "type": "string"
          },
          "status": {
            "type": "string"
          }
        }
      }
      
    • Method seçeneğini POST olarak ayarlayın
  3. tetikleyicisinden Transcript ID parametresine transcript_id geçirerek bir AssemblyAI Get Transcript eylemi ekleyin.

  4. Başka bir şey yapmadan önce veya olup olmadığını Statuscompletederrordenetlemeniz gerekir. Çıkıştan erroröğesinin Get Transcript olup olmadığını Status denetleen bir Condition eylem ekleyin:

    • Dalda True bir Terminate eylem ekleyin
      • öğesini şu şekilde ayarlayın:StatusFailed
      • öğesini şu şekilde ayarlayın:CodeTranscript Error
      • çıkıştan ErrorGet Transcript parametresine geçirin Message .
    • Dalı False boş bırakabilirsiniz.

    Artık transkript durumunun olduğunu completedbildikten sonra Condition herhangi bir eylem ekleyebilir ve eylemin çıkış özelliklerinden Get Transcript herhangi birini alabilirsiniz.

  5. Mantıksal Uygulamanızı veya Flow'unuzu kaydedin. HTTP URL tetikleyicisi When an HTTP request is received için oluşturulur. HTTP URL öğesini kopyalayın ve özgün Mantıksal Uygulamanıza veya Flow'unuza dönün.

  6. Özgün Mantıksal Uygulamanızda veya Flow'unuzda eylemi güncelleştirin Transcribe Audio . HTTP URL Daha önce kopyaladığınız öğesini parametresine yapıştırın Webhook URL ve kaydedin.

Transkript durumu veya errorolduğundacompleted, AssemblyAI web kancası URL'sine bir HTTP POST isteği gönderir ve bu istek diğer Mantıksal Uygulamanız veya Flow'unuz tarafından işlenir.

Web kancasını kullanmaya alternatif olarak, sonraki bölümde açıklandığı gibi transkript durumunu yoklayabilirsiniz.

Transkript Durumunu Yoklama

Aşağıdaki adımları kullanarak transkript durumunu yoklayabilirsiniz:

  • Initialize variable Eylem ekleme

    • Name seçeneğini transcript_status olarak ayarlayın
    • Type seçeneğini String olarak ayarlayın
    • Status çıkıştan Transcribe Audio parametresine depolayın Value
  • Do until Eylem ekleme

    • parametresini Loop Until aşağıdaki Fx koduyla yapılandırın:
      or(equals(variables('transcript_status'), 'completed'), equals(variables('transcript_status'), 'error'))
      
      Bu kod değişkenin transcript_statuscompleted veya errorolup olmadığını denetler.
    • parametresini şu şekilde Count yapılandırın: 86400
    • parametresini şu şekilde Timeout yapılandırın: PT24H

    Eylemin Do until içine aşağıdaki eylemleri ekleyin:

    • Bir saniye bekleyen bir Delay eylem ekleme
    • Bir Get Transcript eylem ekleyin ve çıkıştan Transcribe Audio parametresine Transcript ID geçirinID.
    • Set variable Eylem ekleme
      • Name seçeneğini transcript_status olarak ayarlayın
      • Çıkışını StatusGet Transcript parametresine Value geçirme

    Transkript Do until tamamlanana veya bir hata oluşana kadar döngü devam eder.

  • Daha önce olduğu gibi başka bir Get Transcript eylem ekleyin, ancak çıktısının eylemin Do until kapsamı dışında kullanılabilir duruma gelmesi için döngüden Do until sonra ekleyin.

Başka bir şey yapmadan önce, transkriptinin Statuscompleted veya errorolup olmadığını denetlemeniz gerekir. öğesinin olup errorolmadığını transcript_status denetleen bir Condition eylem ekleyin:

  • Dalda True bir Terminate eylem ekleyin
    • Status seçeneğini Failed olarak ayarlayın
    • Code seçeneğini Transcript Error olarak ayarlayın
    • çıkıştan ErrorGet Transcript parametresine geçirin Message .
  • Dalı False boş bırakabilirsiniz.

Artık transkript durumunun olduğunu completedbildikten sonra Condition herhangi bir eylem ekleyebilir ve eylemin çıkış özelliklerinden Get Transcript herhangi birini alabilirsiniz.

Daha fazla eylem ekleme

Artık transkripsiyonu tamamladığınıza göre, transkriptten ID geçen diğer birçok eylemi kullanabilirsiniz, örneğin

  • Get Sentences of Transcript
  • Get Paragraphs of Transcript
  • Get Subtitles of Transcript
  • Get Redacted Audio
  • Search Transcript for Words
  • Run a Task using LeMUR

Bilinen sorunlar ve sınırlamalar

Şu anda bilinen bir sorun yok. Özel Bağlayıcıları kullanmak mümkün olmadığından Konuşma AkışınıTo-Text (gerçek zamanlı) desteklemiyoruz.

Yaygın hatalar ve çözümler

Hatalar hakkında daha fazla bilgiyi AssemblyAI belgelerinde bulabilirsiniz.

FAQ

Sık sorulan soruları belgelerimizde bulabilirsiniz.

Bağlantı oluşturma

Bağlayıcı aşağıdaki kimlik doğrulama türlerini destekler:

Varsayılan Bağlantı oluşturmak için parametreler. Tüm bölgeler Paylaşılamaz

Temerrüt

Geçerli: Tüm bölgeler

Bağlantı oluşturmak için parametreler.

Bu, paylaşılabilir bir bağlantı değildir. Power app başka bir kullanıcıyla paylaşılıyorsa, başka bir kullanıcıdan açıkça yeni bağlantı oluşturması istenir.

İsim Türü Description Gerekli
AssemblyAI API Anahtarı securestring AssemblyAI API'sinin kimliğini doğrulamak için AssemblyAI API Anahtarı. Doğru

Azaltma Sınırları

Name Çağrılar Yenileme Dönemi
Bağlantı başına API çağrıları 100 60 saniye

Eylemler

Dökümleri Listele

Oluşturduğunuz dökümlerin listesini alın. Transkriptler en yeniden en eskiye sıralanır. Önceki URL her zaman daha eski transkriptleri olan bir sayfaya işaret eder.

Dökümü Sil

Dökümü silin. Silme işlemi kaynağın kendisini silmez, ancak verileri kaynaktan kaldırır ve silindi olarak işaretler.

LeMUR İstek Verilerini Temizleme

Daha önce gönderilen leMUR isteğinin verilerini silin. LLM yanıt verileri ve özgün istekte sağlanan tüm bağlamlar kaldırılır.

LeMUR Kullanarak Görev Çalıştırma

Kendi LLM isteminizi giriş yapmak için LeMUR görev uç noktasını kullanın.

LeMUR Yanıtlarını Alma

Daha önce oluşturulmuş bir LeMUR yanıtı alın.

Medya Dosyasını Karşıya Yükleme

AssemblyAI'nin sunucularına bir medya dosyası yükleyin.

Ses Dökümü

URL aracılığıyla erişilebilen bir medya dosyasından transkript oluşturun.

Transkript için Alt Yazıları Alma

Transkriptinizi SRT veya VTT biçiminde dışarı aktararak alt yazılar ve kapalı açıklamalı alt yazılar için video oynatıcıyla birlikte kullanın.

Transkripti Alma

Transkript kaynağını alın. "Durum" "tamamlandı" olduğunda transkript hazır olur.

Transkriptteki Cümleleri Alma

Dökümü cümlelere bölün. API, daha okuyucu dostu transkriptler oluşturmak için transkripti tümcelere ayırmaya çalışır.

Transkriptteki Paragrafları Alma

Dökümü paragraflara göre böler. API, daha okuyucu dostu transkriptler oluşturmak için transkriptinizi paragraflara ayırmaya çalışır.

Transkriptteki Sözcükleri Arama

Anahtar sözcükler için transkriptte arama yapın. En fazla beş sözcük veya sayı içeren tek tek sözcükleri, sayıları veya tümcecikleri arayabilirsiniz.

Yeniden İşlenmiş Ses Alma

Yeniden işlem yapılan sesin durumunu ve URL'sini içeren yeniden işlem yapılmış ses nesnesini alın.

Dökümleri Listele

Oluşturduğunuz dökümlerin listesini alın. Transkriptler en yeniden en eskiye sıralanır. Önceki URL her zaman daha eski transkriptleri olan bir sayfaya işaret eder.

Parametreler

Name Anahtar Gerekli Tür Description
Sınır
limit integer

Alınacak maksimum transkript miktarı

Statü
status string

Transkriptinizin durumu. Olası değerler kuyruğa alınır, işlenir, tamamlanır veya hata oluşur.

Oluşturulma Tarihi
created_on date

Yalnızca bu tarihte oluşturulan dökümleri al

Kimlik Öncesi
before_id uuid

Bu transkript kimliği öncesinde oluşturulan transkriptleri alma

Kimlik Sonrası
after_id uuid

Bu transkript kimliği sonrasında oluşturulan transkriptleri alma

Yalnızca Kısıtlanmış
throttled_only boolean

Yalnızca kısıtlanmış transkriptleri al, durum filtresini geçersiz kılar

Döndürülenler

Dökümlerin listesi. Transkriptler en yeniden en eskiye sıralanır. Önceki URL her zaman daha eski transkriptleri olan bir sayfaya işaret eder.

Dökümü Sil

Dökümü silin. Silme işlemi kaynağın kendisini silmez, ancak verileri kaynaktan kaldırır ve silindi olarak işaretler.

Parametreler

Name Anahtar Gerekli Tür Description
Transkript Kimliği
transcript_id True string

Transkriptin kimliği

Döndürülenler

Transkript nesnesi

Body
Transcript

LeMUR İstek Verilerini Temizleme

Daha önce gönderilen leMUR isteğinin verilerini silin. LLM yanıt verileri ve özgün istekte sağlanan tüm bağlamlar kaldırılır.

Parametreler

Name Anahtar Gerekli Tür Description
LeMUR İstek Kimliği
request_id True string

Verilerini silmek istediğiniz LeMUR isteğinin kimliği. Bu, özgün isteğin yanıtında bulunur.

Döndürülenler

LeMUR Kullanarak Görev Çalıştırma

Kendi LLM isteminizi giriş yapmak için LeMUR görev uç noktasını kullanın.

Parametreler

Name Anahtar Gerekli Tür Description
Uyarı
prompt True string

Modele geçirmek istediğiniz bağlam dahil olmak üzere modelin istenen çıkışı oluşturmasını isteyen metniniz.

Transkript Kimlikleri
transcript_ids array of uuid

Metin içeren tamamlanmış transkriptlerin listesi. En fazla 100 dosya veya 100 saat (hangisi daha düşükse) kadar. LeMUR'a giriş olarak transcript_ids veya input_text kullanın.

Metin Girişi
input_text string

Özel biçimlendirilmiş transkript verileri. Boyut üst sınırı, varsayılan olarak 100000 olan seçili modelin bağlam sınırıdır. LeMUR'a giriş olarak transcript_ids veya input_text kullanın.

Context
context string

Modeli sağlamak için bağlam. Bu bir dize veya serbest biçimli bir JSON değeri olabilir.

Son Model
final_model string

Sıkıştırma gerçekleştirildikten sonra son istem için kullanılan model.

En Büyük Çıkış Boyutu
max_output_size integer

En fazla 4000 belirteç çıkış boyutu

Sıcaklık
temperature float

Model için kullanılacak sıcaklık. Daha yüksek değerler daha yaratıcı yanıtlara neden olur, daha düşük değerler daha muhafazakardır. 0,0 ile 1,0 (dahil) arasında herhangi bir değer olabilir.

Döndürülenler

LeMUR Yanıtlarını Alma

Daha önce oluşturulmuş bir LeMUR yanıtı alın.

Parametreler

Name Anahtar Gerekli Tür Description
LeMUR İstek Kimliği
request_id True string

Daha önce yaptığınız LeMUR isteğinin kimliği. Bu, özgün isteğin yanıtında bulunur.

Döndürülenler

Medya Dosyasını Karşıya Yükleme

AssemblyAI'nin sunucularına bir medya dosyası yükleyin.

Parametreler

Name Anahtar Gerekli Tür Description
Dosya İçeriği
file True binary

Karşıya yüklenecek dosya.

Döndürülenler

Ses Dökümü

URL aracılığıyla erişilebilen bir medya dosyasından transkript oluşturun.

Parametreler

Name Anahtar Gerekli Tür Description
Ses URL'si
audio_url True string

Dökümü yapılan ses veya video dosyasının URL'si.

Dil Kodu
language_code string

Ses dosyanızın dili. Olası değerler Desteklenen Diller'de bulunur. Varsayılan değer :'en_us'.

Language Detection
language_detection boolean

True veya false olarak otomatik dil algılamayı etkinleştirin.

Konuşma Modeli
speech_model string

Transkripsiyon için kullanılacak konuşma modeli.

Noktalama İşareti
punctuate boolean

Otomatik Noktalamayı Etkinleştir, true veya false olabilir

Metni Biçimlendir
format_text boolean

Metin Biçimlendirmesini Etkinleştir, doğru veya yanlış olabilir

İzinsizlikler
disfluencies boolean

Medya dosyanızda "um" gibi Dolgu Sözcüklerinin dökümünü oluşturma; true veya false olabilir

İkili Kanal
dual_channel boolean

İkili Kanal transkripsiyonu etkinleştir, doğru veya yanlış olabilir.

Web Kancası URL'si
webhook_url string

Web kancası istekleri gönderdiğimiz URL. İki farklı türde web kancası isteği göndeririz. Transkript tamamlandığında veya başarısız olduğunda bir istek ve redact_pii_audio etkinleştirildiğinde yeniden uygulanan ses hazır olduğunda bir istek.

Web Kancası Kimlik Doğrulaması Üst Bilgi Adı
webhook_auth_header_name string

Transkript tamamlanmış veya başarısız web kancası istekleriyle gönderilecek üst bilgi adı

Web Kancası Kimlik Doğrulaması Üst Bilgi Değeri
webhook_auth_header_value string

Döküm tamamlandı veya ek güvenlik için başarısız web kancası istekleriyle geri gönderilecek üst bilgi değeri

Anahtar İfadeler
auto_highlights boolean

Anahtar tümcecikleri (true veya false) etkinleştirme

Ses Başlangıç
audio_start_from integer

Medya dosyanızda dönüştürmeye başlamanın milisaniye cinsinden zamanı

Ses Bitişi
audio_end_at integer

Medya dosyanızda dönüştürmeyi durdurmanın milisaniye cinsinden zamanı

Word Boost
word_boost array of string

Transkripsiyon olasılığını artırmak için özel sözlük listesi

Sözcük Yükseltme Düzeyi
boost_param string

Belirtilen sözcüklerin ne kadar artırılması gerekiyor?

Filtre Küfürleri
filter_profanity boolean

Dökümü alınmış metindeki küfürleri filtrele, doğru veya yanlış olabilir

Redact PII
redact_pii boolean

Redact PII modelini kullanarak transkripte edilen metinden redact PII değeri doğru veya yanlış olabilir

Redact PII Audio
redact_pii_audio boolean

Konuşulan PII "bip sesi" çıkarılmış özgün medya dosyasının bir kopyasını oluşturun, doğru veya yanlış olabilir. Daha fazla ayrıntı için bkz. PII redaction.

Redact PII Ses Kalitesi
redact_pii_audio_quality string

redact_pii_audio tarafından oluşturulan sesin dosya türünü denetler. Şu anda mp3 (varsayılan) ve wav'ı destekler. Daha fazla ayrıntı için bkz. PII redaction.

PiI İlkelerini Yeniden Düzenleme
redact_pii_policies array of string

Etkinleştirileceği PII Redaction ilkelerinin listesi. Daha fazla ayrıntı için bkz. PII redaction.

Redact PII Değiştirme
redact_pii_sub string

Algılanan PII için değiştirme mantığı "entity_name" veya "karma" olabilir. Daha fazla ayrıntı için bkz. PII redaction.

Konuşmacı Etiketleri
speaker_labels boolean

Konuşmacı diarizasyonu etkinleştir, doğru veya yanlış olabilir

Konuşmacılar Bekleniyor
speakers_expected integer

Konuşmacı etiketi modeline, 10'a kadar tanımlamayı denemesi gereken konuşmacı sayısını bildirir. Daha fazla ayrıntı için bkz. Konuşmacıyı dillere ayırma.

İçerik Moderasyonu
content_safety boolean

İçerik Moderasyonu'nu etkinleştir, doğru veya yanlış olabilir

İçerik Denetimi Güvenilirliği
content_safety_confidence integer

İçerik Moderasyonu modeli için güvenilirlik eşiği. Değerler 25 ile 100 arasında olmalıdır.

Konu Algılama
iab_categories boolean

Konu Algılamayı Etkinleştir, doğru veya yanlış olabilir

Kaynak
from True array of string

Değiştirilmeye değer sözcükler veya tümcecikler

İçin
to True string

Yerine geçecek sözcük veya tümcecik

Sentiment Analysis
sentiment_analysis boolean

Yaklaşım Analizini Etkinleştir, doğru veya yanlış olabilir

Otomatik Bölümler
auto_chapters boolean

Otomatik Bölümleri Etkinleştir, doğru veya yanlış olabilir

Varlık Algılama
entity_detection boolean

Varlık Algılamayı Etkinleştir, doğru veya yanlış olabilir

Konuşma Eşiği
speech_threshold float

Bu konuşma kesirinden daha azını içeren ses dosyalarını reddedin. Geçerli değerler [0, 1] (dahil) aralığındadır.

Özetlemeyi Etkinleştir
summarization boolean

Özetlemeyi etkinleştir, doğru veya yanlış olabilir

Özet Model
summary_model string

Transkripti özetlemek için model

Özet Türü
summary_type string

Özet türü

Özel Konuları Etkinleştirme
custom_topics boolean

Özel konuları (true veya false) etkinleştirme

Özel Konular
topics array of string

Özel konuların listesi

Döndürülenler

Transkript nesnesi

Body
Transcript

Transkript için Alt Yazıları Alma

Transkriptinizi SRT veya VTT biçiminde dışarı aktararak alt yazılar ve kapalı açıklamalı alt yazılar için video oynatıcıyla birlikte kullanın.

Parametreler

Name Anahtar Gerekli Tür Description
Transkript Kimliği
transcript_id True string

Transkriptin kimliği

Alt Başlık Biçimi
subtitle_format True string

Alt yazıların biçimi

Resim Yazısı Başına Karakter Sayısı
chars_per_caption integer

Resim yazısı başına en fazla karakter sayısı

Döndürülenler

response
string

Transkripti Alma

Transkript kaynağını alın. "Durum" "tamamlandı" olduğunda transkript hazır olur.

Parametreler

Name Anahtar Gerekli Tür Description
Transkript Kimliği
transcript_id True string

Transkriptin kimliği

Döndürülenler

Transkript nesnesi

Body
Transcript

Transkriptteki Cümleleri Alma

Dökümü cümlelere bölün. API, daha okuyucu dostu transkriptler oluşturmak için transkripti tümcelere ayırmaya çalışır.

Parametreler

Name Anahtar Gerekli Tür Description
Transkript Kimliği
transcript_id True string

Transkriptin kimliği

Döndürülenler

Transkriptteki Paragrafları Alma

Dökümü paragraflara göre böler. API, daha okuyucu dostu transkriptler oluşturmak için transkriptinizi paragraflara ayırmaya çalışır.

Parametreler

Name Anahtar Gerekli Tür Description
Transkript Kimliği
transcript_id True string

Transkriptin kimliği

Döndürülenler

Transkriptteki Sözcükleri Arama

Anahtar sözcükler için transkriptte arama yapın. En fazla beş sözcük veya sayı içeren tek tek sözcükleri, sayıları veya tümcecikleri arayabilirsiniz.

Parametreler

Name Anahtar Gerekli Tür Description
Transkript Kimliği
transcript_id True string

Transkriptin kimliği

Kelime
words True array

Aranacak anahtar sözcükler

Döndürülenler

Yeniden İşlenmiş Ses Alma

Yeniden işlem yapılan sesin durumunu ve URL'sini içeren yeniden işlem yapılmış ses nesnesini alın.

Parametreler

Name Anahtar Gerekli Tür Description
Transkript Kimliği
transcript_id True string

Transkriptin kimliği

Döndürülenler

Tanımlar

RedactedAudioResponse

Name Yol Tür Description
Statü
status string

Yeniden işlem yapılan sesin durumu

Yeniden İşlenen Ses URL'si
redacted_audio_url string

Yeniden işlem yapılan ses dosyasının URL'si

WordSearchResponse

Name Yol Tür Description
Transkript Kimliği
id uuid

Transkriptin kimliği

Toplam Eşleşme Sayısı
total_count integer

Eşleşen tüm örneklerin toplam sayısı. Örneğin, 1 sözcüğü 2 kez ve 2 sözcüğü 3 kez eşleştirildiğinde, total_count 5'e eşit olur.

Eşleşir
matches array of object

Aramanın eşleşmeleri

Metin
matches.text string

Eşleşen sözcük

Sayı
matches.count integer

Sözcüğün transkriptteki toplam sayısı

Zaman damga -ları
matches.timestamps array of array

Zaman damgaları dizisi

Zaman Damgası
matches.timestamps array of integer

Milisaniye cinsinden [start_time, end_time] olarak yapılandırılmış zaman damgaları dizisi

Indexes
matches.indexes array of integer

Tamamlanan transkriptinin sözcükler dizisi içinde söz dizisini içeren tüm dizin konumları dizisi

Döküm

Transkript nesnesi

Name Yol Tür Description
Kimlik
id uuid

Transkriptinizin benzersiz tanımlayıcısı

Ses URL'si
audio_url string

Dökümü alınan medyanın URL'si

Statü
status string

Transkriptinizin durumu. Olası değerler kuyruğa alınır, işlenir, tamamlanır veya hata oluşur.

Dil Kodu
language_code string

Ses dosyanızın dili. Olası değerler Desteklenen Diller'de bulunur. Varsayılan değer :'en_us'.

Language Detection
language_detection boolean

Otomatik dil algılamanın etkinleştirilip etkinleştirilmediği(true veya false)

Konuşma Modeli
speech_model string

Transkripsiyon için kullanılacak konuşma modeli.

Metin
text string

Medya dosyanızın metinsel transkripti

Kelime
words array of object

Transkriptteki her sözcük için bir tane olmak üzere, zamansal olarak sıralı sözcük nesneleri dizisi. Daha fazla bilgi için bkz. Konuşma tanıma.

Güven
words.confidence double
Start
words.start integer
End
words.end integer
Metin
words.text string
Hoparlör
words.speaker string

Konuşmacı Diarizasyonu etkinse cümlenin konuşmacısı, aksi takdirde null

Konuşmalar
utterances array of object

dual_channel veya speaker_labels etkinleştirildiğinde, sıralı konuşma nesnelerinin listesi. Daha fazla bilgi için bkz. Konuşmacı diarizasyonu.

Güven
utterances.confidence double

Bu konuşmanın transkripti için güvenilirlik puanı

Start
utterances.start integer

Ses dosyasındaki konuşmanın başlangıç saati (milisaniye cinsinden)

End
utterances.end integer

Ses dosyasındaki konuşmanın milisaniye cinsinden bitiş saati

Metin
utterances.text string

Bu konuşmanın metni

Kelime
utterances.words array of object

Konuşmadaki sözcükler.

Güven
utterances.words.confidence double
Start
utterances.words.start integer
End
utterances.words.end integer
Metin
utterances.words.text string
Hoparlör
utterances.words.speaker string

Konuşmacı Diarizasyonu etkinse cümlenin konuşmacısı, aksi takdirde null

Hoparlör
utterances.speaker string

Her konuşmacıya sıralı bir büyük harf atandığı bu konuşmanın konuşmacısı; örneğin, Konuşmacı A için "A", Konuşmacı B için "B" vb.

Güven
confidence double

Transkript için 0,0 (düşük güvenilirlik) ile 1,0 (yüksek güvenilirlik) arasında güvenilirlik puanı

Ses Süresi
audio_duration integer

Bu transkript nesnesinin medya dosyasının süresi (saniye cinsinden)

Noktalama İşareti
punctuate boolean

Otomatik Noktalama'nın etkin olup olmadığı, true veya false

Metni Biçimlendir
format_text boolean

Metin Biçimlendirme'nin etkinleştirilip etkinleştirilmediği( true veya false)

İzinsizlikler
disfluencies boolean

Medya dosyanızda "um" gibi Dolgu Sözcüklerinin dökümünü oluşturma; true veya false olabilir

İkili Kanal
dual_channel boolean

Transkripsiyon isteğinde çift kanallı transkripsiyonun etkinleştirilip etkinleştirilmediği (true veya false)

Web Kancası URL'si
webhook_url string

Web kancası istekleri gönderdiğimiz URL. İki farklı türde web kancası isteği göndeririz. Transkript tamamlandığında veya başarısız olduğunda bir istek ve redact_pii_audio etkinleştirildiğinde yeniden uygulanan ses hazır olduğunda bir istek.

Web Kancası HTTP Durum Kodu
webhook_status_code integer

Web kancası URL'si sağlandıysa, transkript tamamlandı veya başarısız web kancası isteğini teslim ederken sunucunuzdan aldığımız durum kodu

Web Kancası Kimlik Doğrulaması Etkin
webhook_auth boolean

Web kancası kimlik doğrulaması ayrıntılarının sağlanıp sağlanmadığı

Web Kancası Kimlik Doğrulaması Üst Bilgi Adı
webhook_auth_header_name string

Transkript tamamlanmış veya başarısız web kancası istekleriyle gönderilecek üst bilgi adı

Hız Artışı
speed_boost boolean

Hız artırmanın etkinleştirilip etkinleştirilmediği

Anahtar İfadeler
auto_highlights boolean

Anahtar İfadelerin etkinleştirilip etkinleştirilmediği( true veya false)

Statü
auto_highlights_result.status string

Modelin başarısız olduğu nadir durumlarda başarılı veya kullanılamaz

Results
auto_highlights_result.results array of object

Anahtar İfadelerin zamansal olarak sıralı dizisi

Sayı
auto_highlights_result.results.count integer

Anahtar tümceciğin ses dosyasında toplam görüntülenme sayısı

Sıralama
auto_highlights_result.results.rank float

Bu anahtar tümceciğin genel ses dosyasının toplam ilgisi - daha büyük bir sayı daha ilgili anlamına gelir

Metin
auto_highlights_result.results.text string

Anahtar tümceciğin metninin kendisi

Zaman damga -ları
auto_highlights_result.results.timestamps array of object

Anahtar ifadenin zaman damgası

Start
auto_highlights_result.results.timestamps.start integer

Milisaniye cinsinden başlangıç zamanı

End
auto_highlights_result.results.timestamps.end integer

Milisaniye cinsinden bitiş zamanı

Ses Başlangıç
audio_start_from integer

Transkripsiyonun başlatıldığı dosyada milisaniye cinsinden zaman noktası

Ses Bitişi
audio_end_at integer

Transkripsiyonun sonlandırıldığı dosyadaki milisaniye cinsinden zaman noktası

Word Boost
word_boost array of string

Transkripsiyon olasılığını artırmak için özel sözlük listesi

Artırmak
boost_param string

Parametre değerini artırma sözcüğü

Filtre Küfürleri
filter_profanity boolean

Küfür Filtreleme'nin etkinleştirilip etkinleştirilmediği( true veya false)

Redact PII
redact_pii boolean

PII Redaction'ın etkin olup olmadığı( true veya false)

Redact PII Audio
redact_pii_audio boolean

Ses dosyasının yeniden oluşturulmuş bir sürümünün doğru mu yoksa yanlış mı oluşturulduğu. Daha fazla bilgi için bkz. PII redaction.

Redact PII Ses Kalitesi
redact_pii_audio_quality string

redact_pii_audio tarafından oluşturulan sesin dosya türünü denetler. Şu anda mp3 (varsayılan) ve wav'ı destekler. Daha fazla ayrıntı için bkz. PII redaction.

PiI İlkelerini Yeniden Düzenleme
redact_pii_policies array of string

PII Redaction etkinse, etkinleştirilen PII Redaction ilkelerinin listesi. Daha fazla bilgi için bkz. PII redaction.

Redact PII Değiştirme
redact_pii_sub string

Algılanan PII için değiştirme mantığı "entity_name" veya "karma" olabilir. Daha fazla ayrıntı için bkz. PII redaction.

Konuşmacı Etiketleri
speaker_labels boolean

Konuşmacı diarizasyonun etkinleştirilip etkinleştirilmediği doğru veya yanlış olabilir

Konuşmacılar Bekleniyor
speakers_expected integer

Konuşmacı etiketi modeline tanımlamayı denemesi gereken konuşmacı sayısını (en fazla 10) söyleyin. Daha fazla ayrıntı için bkz. Konuşmacıyı dillere ayırma.

İçerik Moderasyonu
content_safety boolean

İçerik Denetimi'nin etkinleştirilip etkinleştirilmediği doğru veya yanlış olabilir

Statü
content_safety_labels.status string

Modelin başarısız olduğu nadir durumlarda başarılı veya kullanılamaz

Results
content_safety_labels.results array of object
Metin
content_safety_labels.results.text string

content Moderation modeli tarafından bayrak eklenmiş bölümün transkripti

Etiketler
content_safety_labels.results.labels array of object

Bölümünde algılanan hassas konu başına bir güvenlik etiketi dizisi

Etiket
content_safety_labels.results.labels.label string

Hassas konunun etiketi

Güven
content_safety_labels.results.labels.confidence double

Tartışılan konu için 0 ile 1 arasından güvenilirlik puanı

Severity
content_safety_labels.results.labels.severity double

0'dan 1'e kadar olan bölümde konu ne kadar ciddi bir şekilde ele alınmıştır?

Cümle Dizini Başlangıcı
content_safety_labels.results.sentences_idx_start integer

Bölümün başladığı cümle dizini

Cümle Dizini Sonu
content_safety_labels.results.sentences_idx_end integer

Bölümün sona erdiği cümle dizini

Start
content_safety_labels.results.timestamp.start integer

Milisaniye cinsinden başlangıç zamanı

End
content_safety_labels.results.timestamp.end integer

Milisaniye cinsinden bitiş zamanı

Özet
content_safety_labels.summary object

Ses dosyasının tamamı için İçerik Denetimi güvenilirlik sonuçlarının özeti

Önem Derecesi Puanı Özeti
content_safety_labels.severity_score_summary object

Ses dosyasının tamamı için İçerik Moderasyonu önem derecesi sonuçlarının özeti

Konu Algılama
iab_categories boolean

Konu Algılama'nın etkinleştirilip etkinleştirilmediği doğru veya yanlış olabilir

Statü
iab_categories_result.status string

Modelin başarısız olduğu nadir durumlarda başarılı veya kullanılamaz

Results
iab_categories_result.results array of object

Konu Algılama modeli için bir sonuç dizisi

Metin
iab_categories_result.results.text string

Algılanan bir konunun oluştuğu transkriptteki metin

Etiketler
iab_categories_result.results.labels array of object
İlgililik
iab_categories_result.results.labels.relevance double

Algılanan konunun algılanan bir konuda ne kadar ilgili olduğu

Etiket
iab_categories_result.results.labels.label string

Algılanan konunun etiketi için IAB taksonomik etiketi; burada > süpertopik/alttopik ilişki belirtilir

Start
iab_categories_result.results.timestamp.start integer

Milisaniye cinsinden başlangıç zamanı

End
iab_categories_result.results.timestamp.end integer

Milisaniye cinsinden bitiş zamanı

Özet
iab_categories_result.summary object

Konunun tüm ses dosyasıyla genel ilgisi

Özel Yazım Hataları
custom_spelling array of object

Sözcüklerin nasıl yazıldığını ve biçimlendirildiğini, gelen ve gelen değerleri kullanarak özelleştirme

Kaynak
custom_spelling.from array of string

Değiştirilmeye değer sözcükler veya tümcecikler

İçin
custom_spelling.to string

Yerine geçecek sözcük veya tümcecik

Otomatik Bölümler Etkin
auto_chapters boolean

Otomatik Bölümlerin etkinleştirilip etkinleştirilmediği doğru veya yanlış olabilir

Bölüm
chapters array of object

Ses dosyası için zamansal olarak sıralı bölümler dizisi

Öz
chapters.gist string

Bölümde konuşulan içeriğin ultra kısa bir özeti (yalnızca birkaç sözcük)

Başlık
chapters.headline string

Bölüm sırasında konuşulan içeriğin tek bir cümle özeti

Özet
chapters.summary string

Bölüm sırasında konuşulan içeriğin bir paragraf özeti

Start
chapters.start integer

Bölümün başlangıç saati (milisaniye cinsinden)

End
chapters.end integer

Bölümün başlangıç saati (milisaniye cinsinden)

Özetleme Etkin
summarization boolean

Özetleme'nin etkinleştirilip etkinleştirilmediği( true veya false)

Özet Türü
summary_type string

Özetleme etkinse oluşturulan özet türü

Özet Model
summary_model string

Özetleme etkinse özeti oluşturmak için kullanılan Özetleme modeli

Özet
summary string

Özetleme etkinse, medya dosyasının oluşturulan özeti

Özel Konular Etkin
custom_topics boolean

Özel konuların etkinleştirilip etkinleştirilmediği(true veya false)

Konu başlıkları
topics array of string

Özel konular etkinse sağlanan özel konuların listesi

Sentiment Analysis
sentiment_analysis boolean

Yaklaşım Analizi'nin etkinleştirilip etkinleştirilmediği, doğru veya yanlış olabilir

Yaklaşım Analizi Sonuçları
sentiment_analysis_results array of object

Yaklaşım Analizi modeli etkinse bir sonuç dizisi. Daha fazla bilgi için bkz. Yaklaşım Analizi.

Metin
sentiment_analysis_results.text string

Cümlenin dökümü

Start
sentiment_analysis_results.start integer

Cümlenin başlangıç saati (milisaniye cinsinden)

End
sentiment_analysis_results.end integer

Cümlenin bitiş saati (milisaniye cinsinden)

Duyarlılık
sentiment_analysis_results.sentiment

Pozitif, NÖTR, NEGATIF cümle için algılanan yaklaşım

Güven
sentiment_analysis_results.confidence double

Cümlenin algılanan yaklaşımı için 0'dan 1'e kadar güvenilirlik puanı

Hoparlör
sentiment_analysis_results.speaker string

Konuşmacı Diarizasyonu etkinse cümlenin konuşmacısı, aksi takdirde null

Varlık Algılama
entity_detection boolean

Varlık Algılama'nın etkinleştirilip etkinleştirilmediği, true veya false olabilir

Entities
entities array of object

Varlık Algılama modeli etkinse bir sonuç dizisi. Daha fazla bilgi için bkz. Varlık algılama.

Varlık Türü
entities.entity_type string

Algılanan varlık için varlık türü

Metin
entities.text string

Algılanan varlığın metni

Start
entities.start integer

Algılanan varlığın ses dosyasında göründüğü, milisaniye cinsinden başlangıç saati

End
entities.end integer

Ses dosyasında algılanan varlık için milisaniye cinsinden bitiş zamanı

Konuşma Eşiği
speech_threshold float

Varsayılan değer null'tır. Bu konuşma kesirinden daha azını içeren ses dosyalarını reddedin. Geçerli değerler [0, 1] (dahil) aralığındadır.

Kısıtlandı
throttled boolean

İstek kısıtlanırken True ve istek artık kısıtlandığında false

Hata
error string

Transkript neden başarısız oldu hata iletisi

Dil Modeli
language_model string

Transkript için kullanılan dil modeli

Akustik Model
acoustic_model string

Transkript için kullanılan akustik model

CümlelerResponse

Name Yol Tür Description
Transkript Kimliği
id uuid
Güven
confidence double
Ses Süresi
audio_duration number
Cümle
sentences array of object
Metin
sentences.text string
Start
sentences.start integer
End
sentences.end integer
Güven
sentences.confidence double
Kelime
sentences.words array of object
Güven
sentences.words.confidence double
Start
sentences.words.start integer
End
sentences.words.end integer
Metin
sentences.words.text string
Hoparlör
sentences.words.speaker string

Konuşmacı Diarizasyonu etkinse cümlenin konuşmacısı, aksi takdirde null

Hoparlör
sentences.speaker string

Konuşmacı Diarizasyonu etkinse cümlenin konuşmacısı, aksi takdirde null

ParagraflarResponse

Name Yol Tür Description
Transkript Kimliği
id uuid
Güven
confidence double
Ses Süresi
audio_duration number
Paragraflar
paragraphs array of object
Metin
paragraphs.text string
Start
paragraphs.start integer
End
paragraphs.end integer
Güven
paragraphs.confidence double
Kelime
paragraphs.words array of object
Güven
paragraphs.words.confidence double
Start
paragraphs.words.start integer
End
paragraphs.words.end integer
Metin
paragraphs.words.text string
Hoparlör
paragraphs.words.speaker string

Konuşmacı Diarizasyonu etkinse cümlenin konuşmacısı, aksi takdirde null

Hoparlör
paragraphs.speaker string

Konuşmacı Diarizasyonu etkinse cümlenin konuşmacısı, aksi takdirde null

TranscriptList

Dökümlerin listesi. Transkriptler en yeniden en eskiye sıralanır. Önceki URL her zaman daha eski transkriptleri olan bir sayfaya işaret eder.

Name Yol Tür Description
Sınır
page_details.limit integer

Bu sayfanın sınırlı olduğu sonuç sayısı

Sonuç Sayısı
page_details.result_count integer

Sayfadaki gerçek sonuç sayısı

Geçerli URL
page_details.current_url string

Geçerli transkript sayfasını almak için kullanılan URL

Önceki URL
page_details.prev_url string

Dökümlerin sonraki sayfasının URL'si. Önceki URL her zaman daha eski transkriptleri olan bir sayfaya işaret eder.

Sonraki URL
page_details.next_url string

Dökümlerin sonraki sayfasının URL'si. Sonraki URL her zaman daha yeni transkriptler içeren bir sayfaya işaret eder.

Transcripts
transcripts array of object
Kimlik
transcripts.id uuid
Kaynak URL
transcripts.resource_url string
Statü
transcripts.status string

Transkriptinizin durumu. Olası değerler kuyruğa alınır, işlenir, tamamlanır veya hata oluşur.

Oluşturuldu
transcripts.created string
Tamamlandı
transcripts.completed string
Ses URL'si
transcripts.audio_url string
Hata
transcripts.error string

Transkript neden başarısız oldu hata iletisi

Karşıya Yüklenen Dosya

Name Yol Tür Description
Karşıya Yüklenen Dosya URL'si
upload_url string

Ses dosyanıza işaret eden ve yalnızca AssemblyAI sunucuları tarafından erişilebilen bir URL

PurgeLemurRequestDataResponse

Name Yol Tür Description
İstek Kimliğini Temizle
request_id uuid

LeMUR isteğinin silme isteğinin kimliği

Temizlenmek için LeMUR İstek Kimliği
request_id_to_purge uuid

Için verileri temizlemek için LeMUR isteğinin kimliği

Silindi
deleted boolean

İstek verilerinin silinip silinmediği

LemurTaskResponse

Name Yol Tür Description
Yanıt
response string

LeMUR tarafından oluşturulan yanıt.

LeMUR İstek Kimliği
request_id uuid

LeMUR isteğinin kimliği

Giriş Belirteçleri
usage.input_tokens integer

Model tarafından kullanılan giriş belirteçlerinin sayısı

Çıkış Belirteçleri
usage.output_tokens integer

Model tarafından oluşturulan çıkış belirteçlerinin sayısı

LemurResponse

Name Yol Tür Description
Yanıt
response string

LeMUR tarafından oluşturulan yanıt.

LeMUR İstek Kimliği
request_id uuid

LeMUR isteğinin kimliği

Giriş Belirteçleri
usage.input_tokens integer

Model tarafından kullanılan giriş belirteçlerinin sayısı

Çıkış Belirteçleri
usage.output_tokens integer

Model tarafından oluşturulan çıkış belirteçlerinin sayısı

String

Bu, 'string' temel veri türüdür.