Hızlı Başlangıç: Azure AI Konuşma CLI'sını kullanmaya başlama
Bu makalede, herhangi bir kod yazmak zorunda kalmadan konuşmayı metne dönüştürme, metin okuma ve konuşma çevirisi gibi Konuşma hizmetlerine erişmek için Azure AI Konuşma CLI'sını (SPX olarak da adlandırılır) kullanmayı öğreneceksiniz. Konuşma CLI'sı üretime hazırdır ve konuşma hizmetindeki basit iş akışlarını veya kabuk betiklerini kullanarak .bat
otomatikleştirmek için kullanabilirsiniz.
Bu makalede Komut İstemi penceresi, terminal veya PowerShell hakkında bilgi sahibi olduğunuz varsayılır.
Not
PowerShell'de, ayrıştırmayı durdurma belirteci (--%
) izlenmelidir spx
. Örneğin, geçerli bölge yapılandırma değerini görüntülemek için komutunu çalıştırın spx --% config @region
.
İndirme ve kurma
Konuşma CLI'sini Windows'a yüklemek için şu adımları izleyin:
Platformunuz için Microsoft Visual Studio için Visual C++ Yeniden Dağıtılabilir 2019'u yükleyin. İlk kez yüklemek için yeniden başlatma gerekebilir.
.NET 6'yi yükleyin.
Şu komutu girerek Konuşma CLI'sini .NET CLI aracılığıyla yükleyin:
dotnet tool install --global Microsoft.CognitiveServices.Speech.CLI
Konuşma CLI'sını güncelleştirmek için şu komutu girin:
dotnet tool update --global Microsoft.CognitiveServices.Speech.CLI
Konuşma CLI'sı için yardım almak için veya spx help
yazınspx
.
Yazı tipi sınırlamaları
Windows'da Konuşma CLI'si yalnızca yerel bilgisayardaki komut isteminde kullanılabilen yazı tiplerini gösterebilir. Windows Terminali , Konuşma CLI'sinin etkileşimli olarak ürettiği tüm yazı tiplerini destekler.
Bir dosyaya çıkış yaparsanız, Not Defteri gibi bir metin düzenleyicisi veya Microsoft Edge gibi bir web tarayıcısı da tüm yazı tiplerini gösterebilir.
Kaynak yapılandırması oluşturma
Başlamak için konuşma kaynak anahtarına ve bölge tanımlayıcısına (örneğin, , eastus
westus
) ihtiyacınız vardır. Azure portalında konuşma kaynağı oluşturma. Daha fazla bilgi için bkz . Azure AI hizmetleri kaynağı oluşturma.
Kaynak anahtarınızı ve bölge tanımlayıcınızı yapılandırmak için aşağıdaki komutları çalıştırın:
spx config @key --set SPEECH-KEY
spx config @region --set SPEECH-REGION
Anahtar ve bölge, gelecekteki Konuşma CLI komutları için depolanır. Geçerli yapılandırmayı görüntülemek için aşağıdaki komutları çalıştırın:
spx config @key
spx config @region
Gerektiğinde, depolanan değerlerden clear
birini kaldırma seçeneğini ekleyin:
spx config @key --clear
spx config @region --clear
Temel kullanım
Önemli
Konuşma CLI'sini bir kapsayıcıda kullanırken seçeneğini ekleyin --host
. CLI'nın kimlik doğrulaması için Konuşma anahtarı kullanmadığından emin olmak için de belirtmelisiniz --key none
. Örneğin, konuşmayı metin kapsayıcısında bir ses dosyasından tanımak için komutunu çalıştırınspx recognize --key none --host wss://localhost:5000/ --file myaudio.wav
.
Bu bölümde, ilk kez test ve deneme için genellikle yararlı olan birkaç temel SPX komutu gösterilmektedir. Araç içi yardımı görüntülemek için aşağıdaki komutu çalıştırın:
spx
Yardım konularını anahtar sözcükle arayabilirsiniz. Örneğin, Konuşma CLI'sı kullanım örneklerinin listesini görmek için aşağıdaki komutu çalıştırın:
spx help find --topics "examples"
Komutun recognize
seçeneklerini görmek için aşağıdaki komutu çalıştırın:
spx help recognize
Konsol çıkışında daha fazla yardım komutu listelenir. Alt komutlar hakkında ayrıntılı yardım almak için bu komutları girebilirsiniz.
Konuşmayı metne dönüştürme (konuşma tanıma)
Not
Konuşma CLI'sini bir Docker kapsayıcısında çalıştırdığınızda bilgisayarınızın mikrofonunu kullanamazsınız. Ancak, yerel bağlı dizininizde ses dosyalarını okuyabilir ve kaydedebilirsiniz.
Sisteminizin varsayılan mikrofonunu kullanarak konuşmayı metne dönüştürmek (konuşma tanıma) için aşağıdaki komutu çalıştırın:
spx recognize --microphone
Komutu çalıştırdıktan sonra, SPX geçerli etkin giriş cihazında ses dinlemeye başlar. Enter'ı seçtiğinizde dinlemeyi durdurur. Daha sonra konuşulan ses tanınır ve konsol çıkışındaki metne dönüştürülür.
Konuşma CLI'sı ile ses dosyasındaki konuşmayı da tanıyabilirsiniz. Şu komutu çalıştırın:
spx recognize --file /path/to/file.wav
İpucu
Takılırsanız veya Konuşma CLI'sı tanıma seçenekleri hakkında daha fazla bilgi edinmek isterseniz komutunu çalıştırabilirsiniz spx help recognize
.
Metin okuma (konuşma sentezi)
Aşağıdaki komut, girdi olarak metni alır ve ardından sentezlenen konuşmayı geçerli etkin çıkış cihazına (örneğin, bilgisayar hoparlörleriniz) çıkarır.
spx synthesize --text "Testing synthesis using the Speech CLI" --speakers
Sentezlenen çıkışı bir dosyaya da kaydedebilirsiniz. Bu örnekte, komutunu çalıştırdığınız dizinde my-sample.wav adlı bir dosya oluşturalım.
spx synthesize --text "Enjoy using the Speech CLI." --audio output my-sample.wav
Bu örneklerde İngilizce test ettiğiniz varsayılıyor. Ancak, Konuşma tanıma hizmeti birçok dilde konuşma sentezi destekler. Aşağıdaki komutu çalıştırarak veya dil destek sayfasını ziyaret ederek seslerin tam listesini aşağı çekebilirsiniz.
spx synthesize --voices
İşte keşfettiğiniz seslerden birini kullanmaya yönelik bir komut.
spx synthesize --text "Bienvenue chez moi." --voice fr-FR-AlainNeural --speakers
İpucu
Takılırsanız veya Konuşma CLI'sı tanıma seçenekleri hakkında daha fazla bilgi edinmek isterseniz komutunu çalıştırabilirsiniz spx help synthesize
.
Konuşmayı metin çevirisine dönüştürme
Konuşma CLI'sı ile metin çevirisine konuşma da yapabilirsiniz. Varsayılan mikrofonunuzdan ses yakalamak ve çeviriyi metin olarak çıkarmak için aşağıdaki komutu çalıştırın. komutuyla translate
ve target
dilini sağlamanız source
gerektiğini unutmayın.
spx translate --microphone --source en-US --target ru-RU
Birden çok dile çevirirken, dil kodlarını noktalı virgülle (;
) ayırın.
spx translate --microphone --source en-US --target 'ru-RU;fr-FR;es-ES'
Çevirinizin çıkışını kaydetmek istiyorsanız bayrağını --output
kullanın. Bu örnekte, bir dosyadan da okursunuz.
spx translate --file /some/file/path/input.wav --source en-US --target ru-RU --output file /some/file/path/russian_translation.txt
İpucu
Takılırsanız veya Konuşma CLI'sı tanıma seçenekleri hakkında daha fazla bilgi edinmek isterseniz komutunu çalıştırabilirsiniz spx help translate
.