Aracılığıyla paylaş


Toplantı transkripsiyonu nedir? (Önizleme)

Toplantı transkripsiyonu, herhangi bir toplantının gerçek zamanlı veya zaman uyumsuz dökümünü sağlayan bir metin okuma çözümüdür. Şu anda önizleme aşamasında olan bu özellik, toplantıda kimin ne söylediğini ve ne zaman söylediğini belirlemek için konuşma tanıma, konuşmacı belirleme ve cümle atfını birleştirir.

Önemli

Eski "konuşma transkripsiyonu" senaryosu "toplantı transkripsiyonu" olarak yeniden adlandırıldı. Örneğin, yerine ConversationTranscriberkullanın MeetingTranscriber ve yerine CreateConversationAsynckullanınCreateMeetingAsync. Kullanıcı profilleri ve ses imzaları kullanılmadan yeni bir "konuşma transkripsiyonu" özelliği yayınlanır. Daha fazla bilgi için sürüm notlarına bakın.

Önemli özellikler

Toplantı transkripsiyonuyla ilgili aşağıdaki özellikleri yararlı bulabilirsiniz:

  • Zaman damgaları: Her konuşmacı konuşmasında bir zaman damgası vardır, böylece bir tümceciğin ne zaman söylendiğini kolayca bulabilirsiniz.
  • Okunabilir transkriptler: Metinlerin söylenenlerle yakından eşleştiğinden emin olmak için transkriptlerde biçimlendirme ve noktalama işaretleri otomatik olarak eklenir.
  • Kullanıcı profilleri: Kullanıcı profilleri, kullanıcı ses örnekleri toplanarak ve imza oluşturma işlemine gönderilerek oluşturulur.
  • Konuşmacı belirleme: Konuşmacılar kullanıcı profilleri kullanılarak tanımlanır ve her birine bir konuşmacı tanımlayıcısı atanır.
  • Çok konuşmacılı dilimleme: Ses akışını her konuşmacı tanımlayıcısıyla sentezleyerek kimin ne söylediğini belirleyin.
  • Gerçek zamanlı transkripsiyon: Toplantı sırasında kimin ne söylediğini ve ne zaman söylediğinin canlı dökümlerini sağlayın.
  • Zaman uyumsuz transkripsiyon: Çok kanallı ses akışı kullanarak transkriptleri daha yüksek doğrulukla sağlayın.

Not

Toplantı transkripsiyonu odadaki konuşmacı sayısına bir sınır koymasa da, oturum başına 2-10 hoparlör için iyileştirilmiştir.

Kullanmaya başlayın

Başlamak için gerçek zamanlı toplantı transkripsiyonu hızlı başlangıcına bakın.

Kullanım örnekleri

İşitme engelli ve işitme güçlüğü çeken katılımcılar gibi herkes için toplantıları kapsayıcı hale getirmek için transkripsiyonun gerçek zamanlı olarak yapılması önemlidir. Gerçek zamanlı modda toplantı transkripsiyonu, toplantı sesini alır ve kimin ne söylediğini belirler ve tüm toplantı katılımcılarının gecikmeden transkripti takip etmelerine ve toplantıya katılmalarına olanak sağlar.

Toplantı katılımcıları toplantıya odaklanabilir ve not alma işlemini toplantı dökümüne bırakabilir. Katılımcılar etkin bir şekilde toplantıya katılarak not almak yerine dökümü kullanarak sonraki adımları hızla izleyebilir ve toplantı sırasında eksik olabilecek bir şey olabilir.

Nasıl çalışır?

Aşağıdaki diyagramda özelliğin nasıl çalıştığına ilişkin üst düzey bir genel bakış gösterilmektedir.

Toplantı transkripsiyonu çözümünün farklı parçaları arasındaki ilişkileri gösteren diyagram.

Beklenen girişler

Toplantı transkripsiyonu iki tür giriş kullanır:

  • Çok kanallı ses akışı: Belirtim ve tasarım ayrıntıları için bkz . Mikrofon dizisi önerileri.
  • Kullanıcı sesi örnekleri: Toplantı transkripsiyonu, konuşmacı belirleme için konuşmadan önce kullanıcı profillerine ihtiyaç duyar. Her kullanıcıdan ses kayıtlarını toplayın ve ardından sesi doğrulamak ve kullanıcı profilleri oluşturmak için kayıtları imza oluşturma hizmetine gönderin.

Not

Toplantı transkripsiyonu için tek kanallı ses yapılandırması şu anda yalnızca özel önizlemede kullanılabilir.

Konuşmacı belirleme için ses imzaları için kullanıcı sesi örnekleri gereklidir. Ses örnekleri olmayan konuşmacılar tanımlanmamış olarak kabul edilir. Özellik etkinleştirildiğinde DifferentiateGuestSpeakers tanımlanamayan hoparlörler ayırt edilebilir (aşağıdaki örne bakın). Transkripsiyon çıktısı, konuşmacıları önceden kaydedilmiş belirli konuşmacı adları olarak tanımak yerine Guest_0 ve Guest_1 olarak gösterir.

config.SetProperty("DifferentiateGuestSpeakers", "true");

Gerçek zamanlı ve zaman uyumsuz karşılaştırması

Aşağıdaki bölümlerde, seçebileceğiniz transkripsiyon modları hakkında daha fazla ayrıntı sağlanır.

Gerçek zamanlı

Ses verileri, konuşmacı tanımlayıcısını ve transkriptini döndürmek için canlı olarak işlenir. Transkripsiyon çözümü gereksiniminiz, toplantı katılımcılarına devam eden toplantılarının canlı transkript görünümünü sağlamaksa bu modu seçin. Örneğin, toplantıları işitme kaybı veya işitme kaybı olan katılımcılar için daha erişilebilir hale getirmek için bir uygulama oluşturmak, gerçek zamanlı transkripsiyon için ideal bir kullanım örneğidir.

Zaman uyumsuz

Ses verileri, konuşmacı tanımlayıcısını ve transkriptini döndürmek için toplu olarak işlenir. Transkripsiyon çözümü gereksiniminiz canlı transkript görünümü olmadan daha yüksek doğruluk sağlamaksa bu modu seçin. Örneğin, toplantı katılımcılarının kaçırılan toplantıları kolayca yakalayabilmesini sağlayacak bir uygulama oluşturmak istiyorsanız, yüksek doğrulukta transkripsiyon sonuçları almak için zaman uyumsuz transkripsiyon modunu kullanın.

Gerçek zamanlı artı zaman uyumsuz

Ses verileri, konuşmacı tanımlayıcısını ve transkripti döndürmek için canlı olarak işlenir ve buna ek olarak, zaman uyumsuz işleme aracılığıyla yüksek doğrulukta bir transkript istemektedir. Uygulamanızın gerçek zamanlı transkripsiyona ihtiyacı varsa ve toplantı gerçekleştikten sonra kullanmak için daha yüksek doğruluk transkripti gerektiriyorsa bu modu seçin.

Dil desteği

Şu anda toplantı transkripsiyonu şu bölgelerdeki tüm metin dillerine konuşmayı destekler: centralus, eastasia, eastus, westeurope.

Sonraki adımlar