Konuşma SDK'sı kullanarak konuşma sentezi gecikme süresini kısaltma

Makale
01/22/2024

Sentez gecikmesi uygulamalarınız için kritik öneme sahiptir. Bu makalede, gecikme süresini azaltmak ve son kullanıcılarınıza en iyi performansı sunmak için en iyi yöntemleri tanıtacağız.

Normalde gecikme süresini first byte latency ve finish latencyile ölçeriz:

Gecikme süresi	Açıklama	SpeechSynthesisResult özellik anahtarı
ilk bayt gecikme süresi	Sentez görevinin başlangıcı ile ses verilerinin ilk öbeklerinin alınması arasındaki gecikme süresini gösterir.	SpeechServiceResponse_SynthesisFirstByteLatencyMs
bitiş gecikmesi	Sentez görevinin başlangıcı ile sentezlenen ses verilerinin tamamının alınması arasındaki gecikme süresini gösterir.	SpeechServiceResponse_SynthesisFinishLatencyMs

Konuşma SDK'sı gecikme sürelerini Özellikler koleksiyonuna SpeechSynthesisResultyerleştirir. Aşağıdaki örnek kod bu değerleri gösterir.

var result = await synthesizer.SpeakTextAsync(text);
Console.WriteLine($"first byte latency: \t{result.Properties.GetProperty(PropertyId.SpeechServiceResponse_SynthesisFirstByteLatencyMs)} ms");
Console.WriteLine($"finish latency: \t{result.Properties.GetProperty(PropertyId.SpeechServiceResponse_SynthesisFinishLatencyMs)} ms");
// you can also get the result id, and send to us when you need help for diagnosis
var resultId = result.ResultId;

Gecikme süresi	Açıklama	SpeechSynthesisResult özellik anahtarı
`first byte latency`	Sentezin başlamasıyla ilk ses öbeklerinin alınması arasındaki gecikme süresini gösterir.	`SpeechServiceResponse_SynthesisFirstByteLatencyMs`
`finish latency`	Sentezin başlaması ve sentezlenen sesin tamamının alınması arasındaki gecikme süresini gösterir.	`SpeechServiceResponse_SynthesisFinishLatencyMs`

Konuşma SDK'sı gecikme sürelerini ölçtü ve özelliğinin çantasına SpeechSynthesisResultyerleştirir. Almak için aşağıdaki kodlara bakın.

auto result = synthesizer->SpeakTextAsync(text).get();
auto firstByteLatency = std::stoi(result->Properties.GetProperty(PropertyId::SpeechServiceResponse_SynthesisFirstByteLatencyMs));
auto finishedLatency = std::stoi(result->Properties.GetProperty(PropertyId::SpeechServiceResponse_SynthesisFinishLatencyMs));
// you can also get the result id, and send to us when you need help for diagnosis
auto resultId = result->ResultId;

Gecikme süresi	Açıklama	SpeechSynthesisResult özellik anahtarı
`first byte latency`	Sentezin başlamasıyla ilk ses öbeklerinin alınması arasındaki gecikme süresini gösterir.	`SpeechServiceResponse_SynthesisFirstByteLatencyMs`
`finish latency`	Sentezin başlaması ve sentezlenen sesin tamamının alınması arasındaki gecikme süresini gösterir.	`SpeechServiceResponse_SynthesisFinishLatencyMs`

Konuşma SDK'sı gecikme sürelerini ölçtü ve özelliğinin çantasına SpeechSynthesisResultyerleştirir. Almak için aşağıdaki kodlara bakın.

SpeechSynthesisResult result = synthesizer.SpeakTextAsync(text).get();
System.out.println("first byte latency: \t" + result.getProperties().getProperty(PropertyId.SpeechServiceResponse_SynthesisFirstByteLatencyMs) + " ms.");
System.out.println("finish latency: \t" + result.getProperties().getProperty(PropertyId.SpeechServiceResponse_SynthesisFinishLatencyMs) + " ms.");
// you can also get the result id, and send to us when you need help for diagnosis
String resultId = result.getResultId();

Gecikme süresi	Açıklama	SpeechSynthesisResult özellik anahtarı
`first byte latency`	Sentezin başlamasıyla ilk ses öbeklerinin alınması arasındaki gecikme süresini gösterir.	`SpeechServiceResponse_SynthesisFirstByteLatencyMs`
`finish latency`	Sentezin başlaması ve sentezlenen sesin tamamının alınması arasındaki gecikme süresini gösterir.	`SpeechServiceResponse_SynthesisFinishLatencyMs`

Konuşma SDK'sı gecikme sürelerini ölçtü ve özelliğinin çantasına SpeechSynthesisResultyerleştirir. Almak için aşağıdaki kodlara bakın.

result = synthesizer.speak_text_async(text).get()
first_byte_latency = int(result.properties.get_property(speechsdk.PropertyId.SpeechServiceResponse_SynthesisFirstByteLatencyMs))
finished_latency = int(result.properties.get_property(speechsdk.PropertyId.SpeechServiceResponse_SynthesisFinishLatencyMs))
# you can also get the result id, and send to us when you need help for diagnosis
result_id = result.result_id

Gecikme süresi	Açıklama	SPXSpeechSynthesisResult özellik anahtarı
`first byte latency`	Sentezin başlamasıyla ilk ses öbeklerinin alınması arasındaki gecikme süresini gösterir.	`SPXSpeechServiceResponseSynthesisFirstByteLatencyMs`
`finish latency`	Sentezin başlaması ve sentezlenen sesin tamamının alınması arasındaki gecikme süresini gösterir.	`SPXSpeechServiceResponseSynthesisFinishLatencyMs`

Konuşma SDK'sı gecikme sürelerini ölçtü ve özelliğinin çantasına SPXSpeechSynthesisResultyerleştirir. Almak için aşağıdaki kodlara bakın.

SPXSpeechSynthesisResult *speechResult = [speechSynthesizer speakText:text];
int firstByteLatency = [intString [speechResult.properties getPropertyById:SPXSpeechServiceResponseSynthesisFirstByteLatencyMs]];
int finishedLatency = [intString [speechResult.properties getPropertyById:SPXSpeechServiceResponseSynthesisFinishLatencyMs]];
// you can also get the result id, and send to us when you need help for diagnosis
NSString *resultId = result.resultId;

çoğu durumda ilk bayt gecikme süresi, son gecikme süresinden daha düşüktür. İlk bayt gecikme süresi metin uzunluğundan bağımsızdır, ancak bitiş gecikme süresi metin uzunluğuyla artar.

İdeal olarak, kullanıcı tarafından karşılaşılan gecikme süresini (kullanıcı sesi duymadan önceki gecikme süresi) bir ağ yolu seyahat süresine ve konuşma sentezi hizmetinin ilk ses öbek gecikme süresini en aza indirmek istiyoruz.

Akışlar

Gecikme süresini azaltmak için Akış kritik önem taşır. İlk ses öbeği alındığında istemci kodu kayıttan yürütmeyi başlatabilir. Bir hizmet senaryosunda, tüm sesin tamamlanmasını beklemeden istemcilerinize ses öbeklerini hemen iletebilirsiniz.

PullAudioOutputStreamAkışı etkinleştirmek için Konuşma SDK'sının , PushAudioOutputStream, Synthesizing olayını ve AudioDataStream kullanabilirsiniz.