Hızlı Başlangıç: Azure OpenAI Whisper modeliyle metne konuşma
Bu hızlı başlangıçta konuşmayı metne dönüştürme için Azure OpenAI Whisper modelinin nasıl kullanılacağı açıklanmaktadır. Fısıltı modeli, insan konuşmasının dökümünü çok sayıda dilde alabilir ve diğer dilleri de İngilizceye çevirebilir.
Whisper modelinin dosya boyutu sınırı 25 MB'tır. 25 MB'tan büyük bir dosyanın dökümünü almanız gerekiyorsa Azure AI Konuşma toplu transkripsiyon API'sini kullanabilirsiniz.
Önkoşullar
Azure aboneliği - Ücretsiz bir abonelik oluşturun.
Desteklenen bir bölgede ve desteklenen bir modelle dağıtılan bir Azure OpenAI kaynağı.
Azure OpenAI kaynağı için en azından Bilişsel Hizmetler Katkıda Bulunanı rolüne atandığınızdan emin olun.
Ayarlama
Anahtarı ve uç noktayı alma
Azure OpenAI'ye karşı başarılı bir şekilde çağrı yapmak için bir uç nokta ve anahtar gerekir.
Değişken adı | Değer |
---|---|
AZURE_OPENAI_ENDPOINT |
Hizmet uç noktası, Kaynağınızı Azure portalından incelerken Anahtarlar ve Uç Nokta bölümünde bulunabilir. Alternatif olarak, uç noktayı Azure AI Studio'daki Dağıtımlar sayfasında bulabilirsiniz. Örnek uç nokta: https://docs-test-001.openai.azure.com/ . |
AZURE_OPENAI_API_KEY |
Bu değer, Azure portal kaynağınızı incelerken Anahtarlar ve Uç Nokta bölümünde bulunabilir. KEY1 veya KEY2 kullanabilirsiniz. |
Azure portalında kaynağınıza gidin. Uç Nokta ve Anahtarlar Kaynak Yönetimi bölümünde bulunabilir. Api çağrılarınızın kimliğini doğrulamak için ihtiyacınız olacak şekilde uç noktanızı ve erişim anahtarınızı kopyalayın. KEY1
veya KEY2
kullanabilirsiniz. Her zaman iki anahtara sahip olmak, hizmet kesintisine neden olmadan anahtarları güvenli bir şekilde döndürmenize ve yeniden oluşturmanıza olanak tanır.
Ortam değişkenleri
Anahtarınız ve uç noktanız için kalıcı ortam değişkenleri oluşturun ve atayın.
Önemli
API anahtarı kullanıyorsanız, bunu Azure Key Vault gibi başka bir yerde güvenli bir şekilde depolayın. API anahtarını doğrudan kodunuzla eklemeyin ve hiçbir zaman herkese açık olarak göndermeyin.
Yapay zeka hizmetleri güvenliği hakkında daha fazla bilgi için bkz . Azure AI hizmetlerine yönelik isteklerin kimliğini doğrulama.
setx AZURE_OPENAI_API_KEY "REPLACE_WITH_YOUR_KEY_VALUE_HERE"
setx AZURE_OPENAI_ENDPOINT "REPLACE_WITH_YOUR_ENDPOINT_HERE"
REST API isteği ve yanıtı oluşturma
Bash kabuğunda aşağıdaki komutu çalıştırın. öğesini Whisper modelini dağıtırken seçtiğiniz dağıtım adıyla değiştirmeniz YourDeploymentName
gerekir. Dağıtım adı, model adıyla aynı olmayabilir. Temel alınan model adıyla aynı olan bir dağıtım adı seçmediğiniz sürece model adının girilmesi hatayla sonuçlanır.
curl $AZURE_OPENAI_ENDPOINT/openai/deployments/YourDeploymentName/audio/transcriptions?api-version=2024-02-01 \
-H "api-key: $AZURE_OPENAI_API_KEY" \
-H "Content-Type: multipart/form-data" \
-F file="@./wikipediaOcelot.wav"
Yukarıdaki komutun örnek uç noktası olan ilk satırı aşağıdaki gibi görünür:
curl https://aoai-docs.openai.azure.com/openai/deployments/{YourDeploymentName}/audio/transcriptions?api-version=2024-02-01 \
wikipediaOcelot.wav gibi örnek ses dosyalarını GitHub'daki Azure AI Konuşma SDK'sı deposundan alabilirsiniz.
Önemli
Üretim için Azure Key Vault gibi güvenli bir yöntem kullanarak kimlik bilgilerinizi depolayın ve erişin. Kimlik bilgisi güvenliği hakkında daha fazla bilgi için bkz . Azure AI hizmetleri güvenliği.
Çıktı
{"text":"The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs."}
Önkoşullar
- Azure aboneliği. Ücretsiz bir tane oluşturabilirsiniz.
- Desteklenen bir bölgede Fısıltı modeli dağıtılan bir Azure OpenAI kaynağı. Daha fazla bilgi için bkz . Azure OpenAI ile kaynak oluşturma ve model dağıtma.
- Python 3.8 veya üzeri
- Aşağıdaki Python kitaplığı: os
Ayarlama
Anahtarı ve uç noktayı alma
Azure OpenAI'ye karşı başarılı bir şekilde çağrı yapmak için bir uç nokta ve anahtar gerekir.
Değişken adı | Değer |
---|---|
AZURE_OPENAI_ENDPOINT |
Hizmet uç noktası, Kaynağınızı Azure portalından incelerken Anahtarlar ve Uç Nokta bölümünde bulunabilir. Alternatif olarak, uç noktayı Azure AI Studio'daki Dağıtımlar sayfasında bulabilirsiniz. Örnek uç nokta: https://docs-test-001.openai.azure.com/ . |
AZURE_OPENAI_API_KEY |
Bu değer, Azure portal kaynağınızı incelerken Anahtarlar ve Uç Nokta bölümünde bulunabilir. KEY1 veya KEY2 kullanabilirsiniz. |
Azure portalında kaynağınıza gidin. Uç Nokta ve Anahtarlar Kaynak Yönetimi bölümünde bulunabilir. Api çağrılarınızın kimliğini doğrulamak için ihtiyacınız olacak şekilde uç noktanızı ve erişim anahtarınızı kopyalayın. KEY1
veya KEY2
kullanabilirsiniz. Her zaman iki anahtara sahip olmak, hizmet kesintisine neden olmadan anahtarları güvenli bir şekilde döndürmenize ve yeniden oluşturmanıza olanak tanır.
Ortam değişkenleri
Anahtarınız ve uç noktanız için kalıcı ortam değişkenleri oluşturun ve atayın.
Önemli
API anahtarı kullanıyorsanız, bunu Azure Key Vault gibi başka bir yerde güvenli bir şekilde depolayın. API anahtarını doğrudan kodunuzla eklemeyin ve hiçbir zaman herkese açık olarak göndermeyin.
Yapay zeka hizmetleri güvenliği hakkında daha fazla bilgi için bkz . Azure AI hizmetlerine yönelik isteklerin kimliğini doğrulama.
setx AZURE_OPENAI_API_KEY "REPLACE_WITH_YOUR_KEY_VALUE_HERE"
setx AZURE_OPENAI_ENDPOINT "REPLACE_WITH_YOUR_ENDPOINT_HERE"
Parolasız kimlik doğrulaması önerilir
Parolasız kimlik doğrulaması için
@azure/identity
Paketini kullanın.- Rolü kullanıcı hesabınıza atayın
Cognitive Services User
. Bu, Azure portalında Erişim denetimi (IAM)>Rol ataması ekle altında yapılabilir. - gibi
az login
Azure CLI ile oturum açın.
Python ortamı oluşturma
OpenAI Python istemci kitaplığını şu şekilde yükleyin:
pip install openai
Python uygulamasını oluşturma
quickstart.py adlı yeni bir Python dosyası oluşturun. Ardından tercih ettiğiniz düzenleyicide veya IDE'de açın.
quickstart.py içeriğini aşağıdaki kodla değiştirin. Dağıtım adınızı eklemek için kodu değiştirin:
import os
from openai import AzureOpenAI
client = AzureOpenAI(
api_key=os.getenv("AZURE_OPENAI_API_KEY"),
api_version="2024-02-01",
azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT")
)
deployment_id = "YOUR-DEPLOYMENT-NAME-HERE" #This will correspond to the custom name you chose for your deployment when you deployed a model."
audio_test_file = "./wikipediaOcelot.wav"
result = client.audio.transcriptions.create(
file=open(audio_test_file, "rb"),
model=deployment_id
)
print(result)
Hızlı başlangıç dosyanızda komutunu kullanarak python
uygulamayı çalıştırın:
python quickstart.py
wikipediaOcelot.wav gibi örnek ses dosyalarını GitHub'daki Azure AI Konuşma SDK'sı deposundan alabilirsiniz.
Önemli
Üretim için Azure Key Vault gibi güvenli bir yöntem kullanarak kimlik bilgilerinizi depolayın ve erişin. Kimlik bilgisi güvenliği hakkında daha fazla bilgi için bkz . Azure AI hizmetleri güvenliği.
Çıktı
{"text":"The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs."}
Önkoşullar
- Azure aboneliği. Ücretsiz bir tane oluşturabilirsiniz.
- Desteklenen bir bölgede Fısıltı modeli dağıtılan bir Azure OpenAI kaynağı. Daha fazla bilgi için bkz . Azure OpenAI ile kaynak oluşturma ve model dağıtma.
- .NET 8.0 SDK'sı
Ayarlama
Anahtarı ve uç noktayı alma
Azure OpenAI'ye karşı başarılı bir şekilde çağrı yapmak için bir uç nokta ve anahtar gerekir.
Değişken adı | Değer |
---|---|
AZURE_OPENAI_ENDPOINT |
Hizmet uç noktası, Kaynağınızı Azure portalından incelerken Anahtarlar ve Uç Nokta bölümünde bulunabilir. Alternatif olarak, uç noktayı Azure AI Studio'daki Dağıtımlar sayfasında bulabilirsiniz. Örnek uç nokta: https://docs-test-001.openai.azure.com/ . |
AZURE_OPENAI_API_KEY |
Bu değer, Azure portal kaynağınızı incelerken Anahtarlar ve Uç Nokta bölümünde bulunabilir. KEY1 veya KEY2 kullanabilirsiniz. |
Azure portalında kaynağınıza gidin. Uç Nokta ve Anahtarlar Kaynak Yönetimi bölümünde bulunabilir. Api çağrılarınızın kimliğini doğrulamak için ihtiyacınız olacak şekilde uç noktanızı ve erişim anahtarınızı kopyalayın. KEY1
veya KEY2
kullanabilirsiniz. Her zaman iki anahtara sahip olmak, hizmet kesintisine neden olmadan anahtarları güvenli bir şekilde döndürmenize ve yeniden oluşturmanıza olanak tanır.
.NET uygulamasını oluşturma
komutunu kullanarak
dotnet new
bir .NET uygulaması oluşturun:dotnet new console -n OpenAIWhisper
Yeni uygulamanın dizinine geçin:
cd OpenAIWhisper
İstemci kitaplığını
Azure.OpenAI
yükleyin:dotnet add package Azure.AI.OpenAI
Parolasız kimlik doğrulaması önerilir
Parolasız kimlik doğrulaması anahtar tabanlı alternatiflerden daha güvenlidir ve Azure hizmetlerine bağlanmak için önerilen yaklaşımdır. Parolasız kimlik doğrulamasını kullanmayı seçerseniz aşağıdakileri tamamlamanız gerekir:
Azure.Identity
paketini ekleyin.dotnet add package Azure.Identity
Rolü kullanıcı hesabınıza atayın
Cognitive Services User
. Bu, OpenAI kaynağınızdaki Azure portalında Erişim denetimi (IAM)>Rol ataması ekle altında yapılabilir.Aracılığıyla
az login
Visual Studio veya Azure CLI kullanarak Azure'da oturum açın.
Uygulama kodunu güncelleştirme
öğesinin içeriğini
program.cs
aşağıdaki kodla değiştirin ve yer tutucu değerlerini kendi kodunuzla güncelleştirin.Not
wikipediaOcelot.wav gibi örnek ses dosyalarını GitHub'daki Azure AI Konuşma SDK'sı deposundan alabilirsiniz.
using Azure; using Azure.AI.OpenAI; using Azure.Identity; // Required for Passwordless auth var endpoint = new Uri("YOUR_OPENAI_ENDPOINT"); var credentials = new AzureKeyCredential("YOUR_OPENAI_KEY"); // var credentials = new DefaultAzureCredential(); // Use this line for Passwordless auth var deploymentName = "whisper"; // Default deployment name, update with your own if necessary var audioFilePath = "YOUR_AUDIO_FILE_PATH"; var openAIClient = new AzureOpenAIClient(endpoint, credentials); var audioClient = openAIClient.GetAudioClient(deploymentName); var result = await audioClient.TranscribeAudioAsync(audioFilePath); Console.WriteLine("Transcribed text:"); foreach (var item in result.Value.Text) { Console.Write(item); }
Önemli
Üretim için Azure Key Vault gibi güvenli bir yöntem kullanarak kimlik bilgilerinizi depolayın ve erişin. Kimlik bilgisi güvenliği hakkında daha fazla bilgi için bkz . Azure AI hizmetleri güvenliği.
Visual Studio'nun
dotnet run
üst kısmındaki komutu veya çalıştır düğmesini kullanarak uygulamayı çalıştırın:dotnet run
Örnek ses dosyasını kullanıyorsanız konsolda aşağıdaki metnin yazdırıldığını görmeniz gerekir:
The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears...
Kaynak kodu | Paketi (npm) | Örnekler
Önkoşullar
- Azure aboneliği - Ücretsiz bir abonelik oluşturun
- Node.js LTS sürümleri
- Yerel geliştirme ortamında parolasız kimlik doğrulaması için kullanılan Azure CLI , Azure CLI ile oturum açarak gerekli bağlamı oluşturun.
- Desteklenen bir bölgede oluşturulan bir Azure OpenAI kaynağı (bkz . Bölge kullanılabilirliği). Daha fazla bilgi için bkz . Azure OpenAI ile kaynak oluşturma ve model dağıtma.
Ayarlama
Anahtarı ve uç noktayı alma
Azure OpenAI'ye karşı başarılı bir şekilde çağrı yapmak için bir uç nokta ve anahtar gerekir.
Değişken adı | Değer |
---|---|
AZURE_OPENAI_ENDPOINT |
Hizmet uç noktası, Kaynağınızı Azure portalından incelerken Anahtarlar ve Uç Nokta bölümünde bulunabilir. Alternatif olarak, uç noktayı Azure AI Studio'daki Dağıtımlar sayfasında bulabilirsiniz. Örnek uç nokta: https://docs-test-001.openai.azure.com/ . |
AZURE_OPENAI_API_KEY |
Bu değer, Azure portal kaynağınızı incelerken Anahtarlar ve Uç Nokta bölümünde bulunabilir. KEY1 veya KEY2 kullanabilirsiniz. |
Azure portalında kaynağınıza gidin. Uç Nokta ve Anahtarlar Kaynak Yönetimi bölümünde bulunabilir. Api çağrılarınızın kimliğini doğrulamak için ihtiyacınız olacak şekilde uç noktanızı ve erişim anahtarınızı kopyalayın. KEY1
veya KEY2
kullanabilirsiniz. Her zaman iki anahtara sahip olmak, hizmet kesintisine neden olmadan anahtarları güvenli bir şekilde döndürmenize ve yeniden oluşturmanıza olanak tanır.
Ortam değişkenleri
Anahtarınız ve uç noktanız için kalıcı ortam değişkenleri oluşturun ve atayın.
Önemli
API anahtarı kullanıyorsanız, bunu Azure Key Vault gibi başka bir yerde güvenli bir şekilde depolayın. API anahtarını doğrudan kodunuzla eklemeyin ve hiçbir zaman herkese açık olarak göndermeyin.
Yapay zeka hizmetleri güvenliği hakkında daha fazla bilgi için bkz . Azure AI hizmetlerine yönelik isteklerin kimliğini doğrulama.
setx AZURE_OPENAI_API_KEY "REPLACE_WITH_YOUR_KEY_VALUE_HERE"
setx AZURE_OPENAI_ENDPOINT "REPLACE_WITH_YOUR_ENDPOINT_HERE"
Microsoft Entra Id kimlik doğrulaması önerilir
Parolasız kimlik doğrulaması için
@azure/identity
Paketini kullanın.- Rolü kullanıcı hesabınıza atayın
Cognitive Services User
. Bu, Azure portalında Erişim denetimi (IAM)>Rol ataması ekle altında yapılabilir. - gibi
az login
Azure CLI ile oturum açın.
Node uygulaması oluşturma
Konsol penceresinde (cmd, PowerShell veya Bash gibi), uygulamanız için yeni bir dizin oluşturun ve bu dizine gidin. Ardından komutunu çalıştırarak npm init
package.json dosyasıyla bir düğüm uygulaması oluşturun.
npm init
İstemci kitaplığını yükleme
İstemci kitaplıklarını şu şekilde yükleyin:
npm install openai @azure/identity
Uygulamanızın package.json dosyası bağımlılıklarla güncelleştirilir.
Örnek uygulama oluşturma
Whisper.js adlı yeni bir dosya oluşturun ve bunu tercih ettiğiniz kod düzenleyicisinde açın. Aşağıdaki kodu Whisper.js dosyasına kopyalayın:
const { createReadStream } = require("fs"); const { AzureOpenAI } = require("openai"); const { DefaultAzureCredential, getBearerTokenProvider } = require("@azure/identity"); // You will need to set these environment variables or edit the following values const audioFilePath = "<audio file path>"; const endpoint = process.env["AZURE_OPENAI_ENDPOINT"] || "<endpoint>"; // Required Azure OpenAI deployment name and API version const apiVersion = "2024-08-01-preview"; const deploymentName = "whisper"; // keyless authentication const credential = new DefaultAzureCredential(); const scope = "https://cognitiveservices.azure.com/.default"; const azureADTokenProvider = getBearerTokenProvider(credential, scope); function getClient() { return new AzureOpenAI({ endpoint, azureADTokenProvider, apiVersion, deployment: deploymentName, }); } export async function main() { console.log("== Transcribe Audio Sample =="); const client = getClient(); const result = await client.audio.transcriptions.create({ model: "", file: createReadStream(audioFilePath), }); console.log(`Transcription: ${result.text}`); } main().catch((err) => { console.error("The sample encountered an error:", err); });
Betiği aşağıdaki komutla çalıştırın:
node Whisper.js
wikipediaOcelot.wav gibi örnek ses dosyalarını GitHub'daki Azure AI Konuşma SDK'sı deposundan alabilirsiniz.
Önemli
Üretim için Azure Key Vault gibi güvenli bir yöntem kullanarak kimlik bilgilerinizi depolayın ve erişin. Kimlik bilgisi güvenliği hakkında daha fazla bilgi için bkz . Azure AI hizmetleri güvenliği.
Çıktı
{"text":"The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs."}
Kaynak kodu | Paketi (npm) | Örnekler
Önkoşullar
- Azure aboneliği - Ücretsiz bir abonelik oluşturun
- Node.js LTS sürümleri
- TypeScript
- Yerel geliştirme ortamında parolasız kimlik doğrulaması için kullanılan Azure CLI , Azure CLI ile oturum açarak gerekli bağlamı oluşturun.
- Desteklenen bir bölgede oluşturulan bir Azure OpenAI kaynağı (bkz . Bölge kullanılabilirliği). Daha fazla bilgi için bkz . Azure OpenAI ile kaynak oluşturma ve model dağıtma.
Ayarlama
Anahtarı ve uç noktayı alma
Azure OpenAI'ye karşı başarılı bir şekilde çağrı yapmak için bir uç nokta ve anahtar gerekir.
Değişken adı | Değer |
---|---|
AZURE_OPENAI_ENDPOINT |
Bu değer, Azure portal kaynağınızı incelerken Anahtarlar ve Uç Nokta bölümünde bulunabilir. Alternatif olarak, değeri Azure OpenAI Studio>Oyun Alanı>Kod Görünümü'nde bulabilirsiniz. Örnek uç nokta: https://aoai-docs.openai.azure.com/ . |
AZURE_OPENAI_API_KEY |
Bu değer, Azure portal kaynağınızı incelerken Anahtarlar ve Uç Nokta bölümünde bulunabilir. KEY1 veya KEY2 kullanabilirsiniz. |
Azure portalında kaynağınıza gidin. Uç Nokta ve Anahtarlar Kaynak Yönetimi bölümünde bulunabilir. Api çağrılarınızın kimliğini doğrulamak için ihtiyacınız olacak şekilde uç noktanızı ve erişim anahtarınızı kopyalayın. KEY1
veya KEY2
kullanabilirsiniz. Her zaman iki anahtara sahip olmak, hizmet kesintisine neden olmadan anahtarları güvenli bir şekilde döndürmenize ve yeniden oluşturmanıza olanak tanır.
Ortam değişkenleri
Anahtarınız ve uç noktanız için kalıcı ortam değişkenleri oluşturun ve atayın.
Önemli
API anahtarı kullanıyorsanız, bunu Azure Key Vault gibi başka bir yerde güvenli bir şekilde depolayın. API anahtarını doğrudan kodunuzla eklemeyin ve hiçbir zaman herkese açık olarak göndermeyin.
Yapay zeka hizmetleri güvenliği hakkında daha fazla bilgi için bkz . Azure AI hizmetlerine yönelik isteklerin kimliğini doğrulama.
setx AZURE_OPENAI_API_KEY "REPLACE_WITH_YOUR_KEY_VALUE_HERE"
setx AZURE_OPENAI_ENDPOINT "REPLACE_WITH_YOUR_ENDPOINT_HERE"
Microsoft Entra Id kimlik doğrulaması önerilir
Parolasız kimlik doğrulaması için
@azure/identity
Paketini kullanın.- Rolü kullanıcı hesabınıza atayın
Cognitive Services User
. Bu, Azure portalında Erişim denetimi (IAM)>Rol ataması ekle altında yapılabilir. - gibi
az login
Azure CLI ile oturum açın.
Node uygulaması oluşturma
Konsol penceresinde (cmd, PowerShell veya Bash gibi), uygulamanız için yeni bir dizin oluşturun ve bu dizine gidin. Ardından komutunu çalıştırarak npm init
package.json dosyasıyla bir düğüm uygulaması oluşturun.
npm init
İstemci kitaplığını yükleme
İstemci kitaplıklarını şu şekilde yükleyin:
npm install openai @azure/identity
Uygulamanızın package.json dosyası bağımlılıklarla güncelleştirilir.
Örnek uygulama oluşturma
Whisper.ts adlı yeni bir dosya oluşturun ve bunu tercih ettiğiniz kod düzenleyicisinde açın. Aşağıdaki kodu Whisper.ts dosyasına kopyalayın:
import { createReadStream } from "fs"; import { AzureOpenAI } from "openai"; import { DefaultAzureCredential, getBearerTokenProvider } from "@azure/identity"; // You will need to set these environment variables or edit the following values const audioFilePath = "<audio file path>"; const endpoint = process.env["AZURE_OPENAI_ENDPOINT"] || "<endpoint>"; // Required Azure OpenAI deployment name and API version const apiVersion = "2024-08-01-preview"; const deploymentName = "whisper"; // keyless authentication const credential = new DefaultAzureCredential(); const scope = "https://cognitiveservices.azure.com/.default"; const azureADTokenProvider = getBearerTokenProvider(credential, scope); function getClient(): AzureOpenAI { return new AzureOpenAI({ endpoint, azureADTokenProvider, apiVersion, deployment: deploymentName, }); } export async function main() { console.log("== Transcribe Audio Sample =="); const client = getClient(); const result = await client.audio.transcriptions.create({ model: "", file: createReadStream(audioFilePath), }); console.log(`Transcription: ${result.text}`); } main().catch((err) => { console.error("The sample encountered an error:", err); });
Uygulamayı aşağıdaki komutla derleyin:
tsc
Uygulamayı aşağıdaki komutla çalıştırın:
node Whisper.js
wikipediaOcelot.wav gibi örnek ses dosyalarını GitHub'daki Azure AI Konuşma SDK'sı deposundan alabilirsiniz.
Önemli
Üretim için Azure Key Vault gibi güvenli bir yöntem kullanarak kimlik bilgilerinizi depolayın ve erişin. Kimlik bilgisi güvenliği hakkında daha fazla bilgi için bkz . Azure AI hizmetleri güvenliği.
Çıktı
{"text":"The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs."}
Önkoşullar
- Azure aboneliği - Ücretsiz bir abonelik oluşturun
- En son sürümü, PowerShell 7'yi veya Windows PowerShell 5.1'i kullanabilirsiniz.
- Modeli dağıtılan bir Azure OpenAI Hizmeti kaynağı. Model dağıtımı hakkında daha fazla bilgi için bkz. kaynak dağıtım kılavuzu.
- veya
gpt-4
modellerinin dağıtılacağı bir Azure OpenAI Hizmeti kaynağıgpt-35-turbo
. Model dağıtımı hakkında daha fazla bilgi için bkz. kaynak dağıtım kılavuzu.
Ayarlama
Anahtarı ve uç noktayı alma
Azure OpenAI'ye karşı başarılı bir şekilde çağrı yapmak için bir uç nokta ve anahtar gerekir.
Değişken adı | Değer |
---|---|
AZURE_OPENAI_ENDPOINT |
Hizmet uç noktası, Kaynağınızı Azure portalından incelerken Anahtarlar ve Uç Nokta bölümünde bulunabilir. Alternatif olarak, uç noktayı Azure AI Studio'daki Dağıtımlar sayfasında bulabilirsiniz. Örnek uç nokta: https://docs-test-001.openai.azure.com/ . |
AZURE_OPENAI_API_KEY |
Bu değer, Azure portal kaynağınızı incelerken Anahtarlar ve Uç Nokta bölümünde bulunabilir. KEY1 veya KEY2 kullanabilirsiniz. |
Azure portalında kaynağınıza gidin. Uç Nokta ve Anahtarlar Kaynak Yönetimi bölümünde bulunabilir. Api çağrılarınızın kimliğini doğrulamak için ihtiyacınız olacak şekilde uç noktanızı ve erişim anahtarınızı kopyalayın. KEY1
veya KEY2
kullanabilirsiniz. Her zaman iki anahtara sahip olmak, hizmet kesintisine neden olmadan anahtarları güvenli bir şekilde döndürmenize ve yeniden oluşturmanıza olanak tanır.
Ortam değişkenleri
Anahtarınız ve uç noktanız için kalıcı ortam değişkenleri oluşturun ve atayın.
Önemli
API anahtarı kullanıyorsanız, bunu Azure Key Vault gibi başka bir yerde güvenli bir şekilde depolayın. API anahtarını doğrudan kodunuzla eklemeyin ve hiçbir zaman herkese açık olarak göndermeyin.
Yapay zeka hizmetleri güvenliği hakkında daha fazla bilgi için bkz . Azure AI hizmetlerine yönelik isteklerin kimliğini doğrulama.
setx AZURE_OPENAI_API_KEY "REPLACE_WITH_YOUR_KEY_VALUE_HERE"
setx AZURE_OPENAI_ENDPOINT "REPLACE_WITH_YOUR_ENDPOINT_HERE"
PowerShell uygulaması oluşturma
Aşağıdaki komutu çalıştırın. öğesini Whisper modelini dağıtırken seçtiğiniz dağıtım adıyla değiştirmeniz YourDeploymentName
gerekir. Dağıtım adı, model adıyla aynı olmayabilir. Temel alınan model adıyla aynı olan bir dağıtım adı seçmediğiniz sürece model adının girilmesi hatayla sonuçlanır.
# Azure OpenAI metadata variables
$openai = @{
api_key = $Env:AZURE_OPENAI_API_KEY
api_base = $Env:AZURE_OPENAI_ENDPOINT # your endpoint should look like the following https://YOUR_RESOURCE_NAME.openai.azure.com/
api_version = '2024-02-01' # this may change in the future
name = 'YourDeploymentName' #This will correspond to the custom name you chose for your deployment when you deployed a model.
}
# Header for authentication
$headers = [ordered]@{
'api-key' = $openai.api_key
}
$form = @{ file = get-item -path './wikipediaOcelot.wav' }
# Send a completion call to generate an answer
$url = "$($openai.api_base)/openai/deployments/$($openai.name)/audio/transcriptions?api-version=$($openai.api_version)"
$response = Invoke-RestMethod -Uri $url -Headers $headers -Form $form -Method Post -ContentType 'multipart/form-data'
return $response.text
wikipediaOcelot.wav gibi örnek ses dosyalarını GitHub'daki Azure AI Konuşma SDK'sı deposundan alabilirsiniz.
Önemli
Üretim için Azure Key Vault ile PowerShell Gizli Dizi Yönetimi gibi güvenli bir yöntem kullanarak kimlik bilgilerinizi depolayın ve erişin. Kimlik bilgisi güvenliği hakkında daha fazla bilgi için bkz . Azure AI hizmetleri güvenliği.
Çıktı
The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs.
Kaynakları temizleme
Bir Azure OpenAI kaynağını temizlemek ve kaldırmak istiyorsanız kaynağı silebilirsiniz. Kaynağı silmeden önce dağıtılan modelleri silmeniz gerekir.
Sonraki adımlar
- Ses verilerini toplu olarak metne dönüştürmeyi öğrenmek için bkz . Toplu iş transkripsiyonu oluşturma.
- Daha fazla örnek için Azure OpenAI Örnekleri GitHub deposuna göz atın.