Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Bu hızlı başlangıçta konuşmayı metne dönüştürme için Azure OpenAI Whisper modelinin nasıl kullanılacağı açıklanmaktadır. Fısıltı modeli, insan konuşmasının dökümünü çok sayıda dilde alabilir ve diğer dilleri de İngilizceye çevirebilir.
Uyarı
Azure OpenAI ile kullanabileceğiniz diğer ses modelleri hakkında bilgi için bkz. Ses modelleri.
Whisper modelinin dosya boyutu sınırı 25 MB'tır. 25 MB'tan büyük bir dosyanın dökümünü almanız gerekiyorsa Azure AI Konuşma toplu transkripsiyon API'sini kullanabilirsiniz.
Önkoşullar
Azure aboneliği - Ücretsiz bir abonelik oluşturun.
Desteklenen bir bölgede dağıtılan konuşma metin modeline sahip bir Azure OpenAI kaynağı. Daha fazla bilgi için bkz. Azure OpenAI ile kaynak oluşturma ve model dağıtma.
Azure OpenAI kaynağı için en azından Bilişsel Hizmetler Katkıda Bulunanı rolüne atandığınızdan emin olun.
Kurulum
Anahtarı ve uç noktayı alma
Azure OpenAI'ye karşı başarılı bir şekilde çağrı yapmak için bir uç nokta ve anahtar gerekir.
Değişken adı | Değer |
---|---|
AZURE_OPENAI_ENDPOINT |
Hizmet uç noktası, Kaynağınızı Azure portalından incelerken Anahtarlar ve Uç Nokta bölümünde bulunabilir. Alternatif olarak, uç noktayı Azure AI Foundry portalındaki Dağıtımlar sayfasında bulabilirsiniz. Örnek uç nokta: https://docs-test-001.openai.azure.com/ . |
AZURE_OPENAI_API_KEY |
Bu değer, Kaynağınızı Azure portalından incelerken Anahtarlar ve Uç Nokta bölümünde bulunabilir.
KEY1 veya KEY2 kullanabilirsiniz. |
Azure portalında kaynağınıza gidin.
Uç Nokta ve Anahtarlar Kaynak Yönetimi bölümünde bulunabilir. Api çağrılarınızın kimliğini doğrulamak için ihtiyacınız olacak şekilde uç noktanızı ve erişim anahtarınızı kopyalayın.
KEY1
veya KEY2
kullanabilirsiniz. Her zaman iki anahtara sahip olmak, hizmet kesintisine neden olmadan anahtarları güvenli bir şekilde döndürmenize ve yeniden oluşturmanıza olanak tanır.
Ortam değişkenleri
Anahtarınız ve uç noktanız için kalıcı ortam değişkenleri oluşturun ve atayın.
Önemli
API anahtarlarını dikkatli kullanın. API anahtarını doğrudan kodunuzla eklemeyin ve hiçbir zaman herkese açık olarak göndermeyin. API anahtarı kullanıyorsanız, bunu Azure Key Vault'ta güvenli bir şekilde depolayın. Uygulamalarınızda API anahtarlarını güvenli bir şekilde kullanma hakkında daha fazla bilgi için bkz. Azure Key Vault ile API anahtarları.
Yapay zeka hizmetleri güvenliği hakkında daha fazla bilgi için bkz. Azure AI hizmetlerine yönelik isteklerin kimliğini doğrulama.
setx AZURE_OPENAI_API_KEY "REPLACE_WITH_YOUR_KEY_VALUE_HERE"
setx AZURE_OPENAI_ENDPOINT "REPLACE_WITH_YOUR_ENDPOINT_HERE"
REST API isteği ve yanıtı oluşturma
Bash kabuğunda aşağıdaki komutu çalıştırın.
YourDeploymentName
öğesini, Whisper modelini dağıtırken seçtiğiniz dağıtım adıyla değiştirmeniz gerekir. Dağıtım adı, model adıyla aynı olmayabilir. Temel alınan model adıyla aynı olan bir dağıtım adı seçmediğiniz sürece model adının girilmesi hatayla sonuçlanır.
curl $AZURE_OPENAI_ENDPOINT/openai/deployments/YourDeploymentName/audio/transcriptions?api-version=2024-02-01 \
-H "api-key: $AZURE_OPENAI_API_KEY" \
-H "Content-Type: multipart/form-data" \
-F file="@./wikipediaOcelot.wav"
Yukarıdaki komutun örnek uç noktası olan ilk satırı aşağıdaki gibi görünür:
curl https://aoai-docs.openai.azure.com/openai/deployments/{YourDeploymentName}/audio/transcriptions?api-version=2024-02-01 \
wikipediaOcelot.wav gibi örnek ses dosyalarını GitHub'daki Azure AI Konuşma SDK'sı deposundan alabilirsiniz.
Önemli
Üretim için Azure Key Vault gibi güvenli bir yöntem kullanarak kimlik bilgilerinizi depolayın ve erişin. Daha fazla bilgi için bkz. kimlik bilgisi güvenliği.
Çıktı
{"text":"The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs."}
Önkoşullar
- Bir Azure aboneliği. Ücretsiz bir tane oluşturabilirsiniz.
- Desteklenen bir bölgede dağıtılan konuşma metin modeline sahip bir Azure OpenAI kaynağı. Daha fazla bilgi için bkz. Azure OpenAI ile kaynak oluşturma ve model dağıtma.
- Python 3.8 veya üzeri
- Aşağıdaki Python kitaplığı: os
Kurulum
Anahtarı ve uç noktayı alma
Azure OpenAI'ye karşı başarılı bir şekilde çağrı yapmak için bir uç nokta ve anahtar gerekir.
Değişken adı | Değer |
---|---|
AZURE_OPENAI_ENDPOINT |
Hizmet uç noktası, Kaynağınızı Azure portalından incelerken Anahtarlar ve Uç Nokta bölümünde bulunabilir. Alternatif olarak, uç noktayı Azure AI Foundry portalındaki Dağıtımlar sayfasında bulabilirsiniz. Örnek uç nokta: https://docs-test-001.openai.azure.com/ . |
AZURE_OPENAI_API_KEY |
Bu değer, Kaynağınızı Azure portalından incelerken Anahtarlar ve Uç Nokta bölümünde bulunabilir.
KEY1 veya KEY2 kullanabilirsiniz. |
Azure portalında kaynağınıza gidin.
Uç Nokta ve Anahtarlar Kaynak Yönetimi bölümünde bulunabilir. Api çağrılarınızın kimliğini doğrulamak için ihtiyacınız olacak şekilde uç noktanızı ve erişim anahtarınızı kopyalayın.
KEY1
veya KEY2
kullanabilirsiniz. Her zaman iki anahtara sahip olmak, hizmet kesintisine neden olmadan anahtarları güvenli bir şekilde döndürmenize ve yeniden oluşturmanıza olanak tanır.
Ortam değişkenleri
Anahtarınız ve uç noktanız için kalıcı ortam değişkenleri oluşturun ve atayın.
Önemli
API anahtarlarını dikkatli kullanın. API anahtarını doğrudan kodunuzla eklemeyin ve hiçbir zaman herkese açık olarak göndermeyin. API anahtarı kullanıyorsanız, bunu Azure Key Vault'ta güvenli bir şekilde depolayın. Uygulamalarınızda API anahtarlarını güvenli bir şekilde kullanma hakkında daha fazla bilgi için bkz. Azure Key Vault ile API anahtarları.
Yapay zeka hizmetleri güvenliği hakkında daha fazla bilgi için bkz. Azure AI hizmetlerine yönelik isteklerin kimliğini doğrulama.
setx AZURE_OPENAI_API_KEY "REPLACE_WITH_YOUR_KEY_VALUE_HERE"
setx AZURE_OPENAI_ENDPOINT "REPLACE_WITH_YOUR_ENDPOINT_HERE"
Parolasız kimlik doğrulaması önerilir
Parolasız kimlik doğrulaması için şunları yapmanız gerekir:
-
@azure/identity
Paketini kullanın. - Rolü kullanıcı hesabınıza atayın
Cognitive Services User
. Bu, Azure portalında Erişim denetimi (IAM)>Rol ataması ekle altında yapılabilir. - gibi
az login
Azure CLI ile oturum açın.
Python ortamı oluşturma
OpenAI Python istemci kitaplığını şu şekilde yükleyin:
pip install openai
Python uygulamasını oluşturma
quickstart.py adlı yeni bir Python dosyası oluşturun. Ardından tercih ettiğiniz düzenleyicide veya IDE'de açın.
quickstart.py içeriğini aşağıdaki kodla değiştirin. Dağıtım adınızı eklemek için kodu değiştirin:
import os
from openai import AzureOpenAI
client = AzureOpenAI(
api_key=os.getenv("AZURE_OPENAI_API_KEY"),
api_version="2024-02-01",
azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT")
)
deployment_id = "YOUR-DEPLOYMENT-NAME-HERE" #This will correspond to the custom name you chose for your deployment when you deployed a model."
audio_test_file = "./wikipediaOcelot.wav"
result = client.audio.transcriptions.create(
file=open(audio_test_file, "rb"),
model=deployment_id
)
print(result)
Hızlı başlangıç dosyanızda komutunu kullanarak python
uygulamayı çalıştırın:
python quickstart.py
wikipediaOcelot.wav gibi örnek ses dosyalarını GitHub'daki Azure AI Konuşma SDK'sı deposundan alabilirsiniz.
Önemli
Üretim için Azure Key Vault gibi güvenli bir yöntem kullanarak kimlik bilgilerinizi depolayın ve erişin. Daha fazla bilgi için bkz. kimlik bilgisi güvenliği.
Çıktı
{"text":"The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs."}
Önkoşullar
- Bir Azure aboneliği. Ücretsiz bir tane oluşturabilirsiniz.
- Desteklenen bir bölgede dağıtılan konuşma metin modeline sahip bir Azure OpenAI kaynağı. Daha fazla bilgi için bkz. Azure OpenAI ile kaynak oluşturma ve model dağıtma.
- .NET 8.0 SDK'sı
Microsoft Entra Id önkoşulları
Microsoft Entra Id ile önerilen anahtarsız kimlik doğrulaması için şunları yapmanız gerekir:
- Microsoft Entra ID ile anahtarsız kimlik doğrulaması için kullanılan Azure CLI'yi yükleyin.
- Rolü kullanıcı hesabınıza atayın
Cognitive Services User
. Azure portalında Erişim denetimi (IAM)>Rol ataması ekle altında rol atayabilirsiniz.
Kurulum
Yeni bir klasör
whisper-quickstart
oluşturun ve aşağıdaki komutu kullanarak hızlı başlangıç klasörüne gidin:mkdir whisper-quickstart && cd whisper-quickstart
Aşağıdaki komutla yeni bir konsol uygulaması oluşturun:
dotnet new console
OpenAI .NET istemci kitaplığınıdotnet add package komutuyla yükleyin:
dotnet add package Azure.AI.OpenAI
Microsoft Entra ID ile önerilen anahtarsız kimlik doğrulaması için Azure.Identity paketini şu şekilde yükleyin:
dotnet add package Azure.Identity
Microsoft Entra ID ile önerilen anahtarsız kimlik doğrulaması için aşağıdaki komutu kullanarak Azure'da oturum açın:
az login
Kaynak bilgilerini alma
Azure OpenAI kaynağınızla uygulamanızın kimliğini doğrulamak için aşağıdaki bilgileri almanız gerekir:
Değişken adı | Değer |
---|---|
AZURE_OPENAI_ENDPOINT |
Bu değer, Kaynağınızı Azure portalından incelerken Anahtarlar ve Uç Nokta bölümünde bulunabilir. |
AZURE_OPENAI_DEPLOYMENT_NAME |
Dağıttığınız bir model için dağıtımınıza özel verdiğiniz isme bu değer karşılık gelir. Bu değer, Azure portalındaki Kaynak Yönetimi>Modeli Dağıtımları altında bulunabilir. |
OPENAI_API_VERSION |
API Sürümleri hakkında daha fazla bilgi edinin. Koddaki sürümü değiştirebilir veya bir ortam değişkeni kullanabilirsiniz. |
Anahtarsız kimlik doğrulaması ve ortam değişkenlerini ayarlama hakkında daha fazla bilgi edinin.
Hızlı başlangıcı çalıştırma
Bu hızlı başlangıçtaki örnek kod, önerilen anahtarsız kimlik doğrulaması için Microsoft Entra Kimliğini kullanır. API anahtarı kullanmayı tercih ederseniz, DefaultAzureCredential
nesnesini bir AzureKeyCredential
nesneyle değiştirebilirsiniz.
AzureOpenAIClient openAIClient = new AzureOpenAIClient(new Uri(endpoint), new DefaultAzureCredential());
Uyarı
wikipediaOcelot.wav gibi örnek ses dosyalarını GitHub'daki Azure AI Konuşma SDK'sı deposundan alabilirsiniz.
Hızlı başlangıcı çalıştırmak için şu adımları izleyin:
öğesinin içeriğini
Program.cs
aşağıdaki kodla değiştirin ve yer tutucu değerlerini kendi kodunuzla güncelleştirin.using Azure; using Azure.AI.OpenAI; using Azure.Identity; // Required for Passwordless auth string deploymentName = "whisper"; string endpoint = Environment.GetEnvironmentVariable("AZURE_OPENAI_ENDPOINT") ?? "https://<your-resource-name>.openai.azure.com/"; string key = Environment.GetEnvironmentVariable("AZURE_OPENAI_API_KEY") ?? "<your-key>"; // Use the recommended keyless credential instead of the AzureKeyCredential credential. AzureOpenAIClient openAIClient = new AzureOpenAIClient(new Uri(endpoint), new DefaultAzureCredential()); //AzureOpenAIClient openAIClient = new AzureOpenAIClient(new Uri(endpoint), new AzureKeyCredential(key)); var audioFilePath = "<audio file path>" var audioClient = openAIClient.GetAudioClient(deploymentName); var result = await audioClient.TranscribeAudioAsync(audioFilePath); Console.WriteLine("Transcribed text:"); foreach (var item in result.Value.Text) { Console.Write(item); }
Visual Studio'nun
dotnet run
üst kısmındaki komutu veya çalıştır düğmesini kullanarak uygulamayı çalıştırın:dotnet run
Çıktı
Örnek ses dosyasını kullanıyorsanız konsolda aşağıdaki metnin yazdırıldığını görmeniz gerekir:
The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States,
Mexico, and Central and South America. This medium-sized cat is characterized by solid
black spots and streaks on its coat, round ears...
Kaynak kodu | Paketi (npm) | Örnekler
Önkoşullar
- Azure aboneliği - Ücretsiz bir tane oluşturun
- Node.js LTS sürümleri
- Yerel geliştirme ortamında parolasız kimlik doğrulaması için kullanılan Azure CLI, Azure CLI ile oturum açarak gerekli bağlamı oluşturun.
- Desteklenen bir bölgede dağıtılan konuşma metin modeline sahip bir Azure OpenAI kaynağı. Daha fazla bilgi için bkz. Azure OpenAI ile kaynak oluşturma ve model dağıtma.
Microsoft Entra Id önkoşulları
Microsoft Entra Id ile önerilen anahtarsız kimlik doğrulaması için şunları yapmanız gerekir:
- Microsoft Entra ID ile anahtarsız kimlik doğrulaması için kullanılan Azure CLI'yi yükleyin.
- Rolü kullanıcı hesabınıza atayın
Cognitive Services User
. Azure portalında Erişim denetimi (IAM)>Rol ataması ekle altında rol atayabilirsiniz.
Kurulum
Yeni bir klasör
synthesis-quickstart
oluşturun ve aşağıdaki komutu kullanarak hızlı başlangıç klasörüne gidin:mkdir synthesis-quickstart && cd synthesis-quickstart
Aşağıdaki komutla
package.json
oluşturun:npm init -y
JavaScript için OpenAI istemci kitaplığını şu şekilde yükleyin:
npm install openai
Önerilen parolasız kimlik doğrulaması için:
npm install @azure/identity
Kaynak bilgilerini alma
Azure OpenAI kaynağınızla uygulamanızın kimliğini doğrulamak için aşağıdaki bilgileri almanız gerekir:
Değişken adı | Değer |
---|---|
AZURE_OPENAI_ENDPOINT |
Bu değer, Kaynağınızı Azure portalından incelerken Anahtarlar ve Uç Nokta bölümünde bulunabilir. |
AZURE_OPENAI_DEPLOYMENT_NAME |
Dağıttığınız bir model için dağıtımınıza özel verdiğiniz isme bu değer karşılık gelir. Bu değer, Azure portalındaki Kaynak Yönetimi>Modeli Dağıtımları altında bulunabilir. |
OPENAI_API_VERSION |
API Sürümleri hakkında daha fazla bilgi edinin. Koddaki sürümü değiştirebilir veya bir ortam değişkeni kullanabilirsiniz. |
Anahtarsız kimlik doğrulaması ve ortam değişkenlerini ayarlama hakkında daha fazla bilgi edinin.
Dikkat
SDK ile önerilen anahtarsız kimlik doğrulamasını kullanmak için ortam değişkeninin AZURE_OPENAI_API_KEY
ayarlanmamış olduğundan emin olun.
Örnek uygulama oluşturma
index.js
Dosyayı aşağıdaki kodla oluşturun:const { createReadStream } = require("fs"); const { AzureOpenAI } = require("openai"); const { DefaultAzureCredential, getBearerTokenProvider } = require("@azure/identity"); // You will need to set these environment variables or edit the following values const audioFilePath = "<audio file path>"; const endpoint = process.env.AZURE_OPENAI_ENDPOINT || "Your endpoint"; // Required Azure OpenAI deployment name and API version const apiVersion = process.env.OPENAI_API_VERSION || "2024-08-01-preview"; const deploymentName = process.env.AZURE_OPENAI_DEPLOYMENT_NAME || "whisper"; // keyless authentication const credential = new DefaultAzureCredential(); const scope = "https://cognitiveservices.azure.com/.default"; const azureADTokenProvider = getBearerTokenProvider(credential, scope); function getClient() { return new AzureOpenAI({ endpoint, azureADTokenProvider, apiVersion, deployment: deploymentName, }); } export async function main() { console.log("== Transcribe Audio Sample =="); const client = getClient(); const result = await client.audio.transcriptions.create({ model: "", file: createReadStream(audioFilePath), }); console.log(`Transcription: ${result.text}`); } main().catch((err) => { console.error("The sample encountered an error:", err); });
Aşağıdaki komutla Azure'da oturum açın:
az login
JavaScript dosyasını çalıştırın.
node index.js
wikipediaOcelot.wav gibi örnek ses dosyalarını GitHub'daki Azure AI Konuşma SDK'sı deposundan alabilirsiniz.
Çıktı
{"text":"The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs."}
Kaynak kodu | Paketi (npm) | Örnekler
Önkoşullar
- Azure aboneliği - Ücretsiz bir tane oluşturun
- Node.js LTS sürümleri
- TypeScript
- Yerel geliştirme ortamında parolasız kimlik doğrulaması için kullanılan Azure CLI, Azure CLI ile oturum açarak gerekli bağlamı oluşturun.
- Desteklenen bir bölgede dağıtılan konuşma metin modeline sahip bir Azure OpenAI kaynağı. Daha fazla bilgi için bkz. Azure OpenAI ile kaynak oluşturma ve model dağıtma.
Microsoft Entra Id önkoşulları
Microsoft Entra Id ile önerilen anahtarsız kimlik doğrulaması için şunları yapmanız gerekir:
- Microsoft Entra ID ile anahtarsız kimlik doğrulaması için kullanılan Azure CLI'yi yükleyin.
- Rolü kullanıcı hesabınıza atayın
Cognitive Services User
. Azure portalında Erişim denetimi (IAM)>Rol ataması ekle altında rol atayabilirsiniz.
Kurulum
Yeni bir klasör
whisper-quickstart
oluşturun ve aşağıdaki komutu kullanarak hızlı başlangıç klasörüne gidin:mkdir whisper-quickstart && cd whisper-quickstart
Aşağıdaki komutla
package.json
oluşturun:npm init -y
package.json
aşağıdaki komut ile ECMAScript olarak güncelleyin:npm pkg set type=module
JavaScript için OpenAI istemci kitaplığını şu şekilde yükleyin:
npm install openai
Önerilen parolasız kimlik doğrulaması için:
npm install @azure/identity
Kaynak bilgilerini alma
Azure OpenAI kaynağınızla uygulamanızın kimliğini doğrulamak için aşağıdaki bilgileri almanız gerekir:
Değişken adı | Değer |
---|---|
AZURE_OPENAI_ENDPOINT |
Bu değer, Kaynağınızı Azure portalından incelerken Anahtarlar ve Uç Nokta bölümünde bulunabilir. |
AZURE_OPENAI_DEPLOYMENT_NAME |
Dağıttığınız bir model için dağıtımınıza özel verdiğiniz isme bu değer karşılık gelir. Bu değer, Azure portalındaki Kaynak Yönetimi>Modeli Dağıtımları altında bulunabilir. |
OPENAI_API_VERSION |
API Sürümleri hakkında daha fazla bilgi edinin. Koddaki sürümü değiştirebilir veya bir ortam değişkeni kullanabilirsiniz. |
Anahtarsız kimlik doğrulaması ve ortam değişkenlerini ayarlama hakkında daha fazla bilgi edinin.
Dikkat
SDK ile önerilen anahtarsız kimlik doğrulamasını kullanmak için ortam değişkeninin AZURE_OPENAI_API_KEY
ayarlanmamış olduğundan emin olun.
Örnek uygulama oluşturma
index.ts
Dosyayı aşağıdaki kodla oluşturun:import { createReadStream } from "fs"; import { AzureOpenAI } from "openai"; import { DefaultAzureCredential, getBearerTokenProvider } from "@azure/identity"; // You will need to set these environment variables or edit the following values const audioFilePath = "<audio file path>"; const endpoint = process.env.AZURE_OPENAI_ENDPOINT || "Your endpoint"; // Required Azure OpenAI deployment name and API version const apiVersion = process.env.OPENAI_API_VERSION || "2024-08-01-preview"; const deploymentName = process.env.AZURE_OPENAI_DEPLOYMENT_NAME || "whisper"; // keyless authentication const credential = new DefaultAzureCredential(); const scope = "https://cognitiveservices.azure.com/.default"; const azureADTokenProvider = getBearerTokenProvider(credential, scope); function getClient(): AzureOpenAI { return new AzureOpenAI({ endpoint, azureADTokenProvider, apiVersion, deployment: deploymentName, }); } export async function main() { console.log("== Transcribe Audio Sample =="); const client = getClient(); const result = await client.audio.transcriptions.create({ model: "", file: createReadStream(audioFilePath), }); console.log(`Transcription: ${result.text}`); } main().catch((err) => { console.error("The sample encountered an error:", err); });
tsconfig.json
dosyasını oluşturup TypeScript kodunu dönüştürmek için ECMAScript için aşağıdaki kodu kopyalayın.{ "compilerOptions": { "module": "NodeNext", "target": "ES2022", // Supports top-level await "moduleResolution": "NodeNext", "skipLibCheck": true, // Avoid type errors from node_modules "strict": true // Enable strict type-checking options }, "include": ["*.ts"] }
TypeScript'ten JavaScript'e dönüştürme.
tsc
Aşağıdaki komutla Azure'da oturum açın:
az login
Kodu aşağıdaki komutla çalıştırın:
node index.js
wikipediaOcelot.wav gibi örnek ses dosyalarını GitHub'daki Azure AI Konuşma SDK'sı deposundan alabilirsiniz.
Önemli
API anahtarlarını dikkatli kullanın. API anahtarını doğrudan kodunuzla eklemeyin ve hiçbir zaman herkese açık olarak göndermeyin. API anahtarı kullanıyorsanız, bunu Azure Key Vault'ta güvenli bir şekilde depolayın. Uygulamalarınızda API anahtarlarını güvenli bir şekilde kullanma hakkında daha fazla bilgi için bkz. Azure Key Vault ile API anahtarları.
Yapay zeka hizmetleri güvenliği hakkında daha fazla bilgi için bkz. Azure AI hizmetlerine yönelik isteklerin kimliğini doğrulama.
Çıktı
{"text":"The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs."}
Önkoşullar
- Azure aboneliği - Ücretsiz bir tane oluşturun
- En son sürümü, PowerShell 7'yi veya Windows PowerShell 5.1'i kullanabilirsiniz.
- Desteklenen bir bölgede dağıtılan konuşma metin modeline sahip bir Azure OpenAI kaynağı. Daha fazla bilgi için bkz. Azure OpenAI ile kaynak oluşturma ve model dağıtma.
Kurulum
Anahtarı ve uç noktayı alma
Azure OpenAI'ye karşı başarılı bir şekilde çağrı yapmak için bir uç nokta ve anahtar gerekir.
Değişken adı | Değer |
---|---|
AZURE_OPENAI_ENDPOINT |
Hizmet uç noktası, Kaynağınızı Azure portalından incelerken Anahtarlar ve Uç Nokta bölümünde bulunabilir. Alternatif olarak, uç noktayı Azure AI Foundry portalındaki Dağıtımlar sayfasında bulabilirsiniz. Örnek uç nokta: https://docs-test-001.openai.azure.com/ . |
AZURE_OPENAI_API_KEY |
Bu değer, Kaynağınızı Azure portalından incelerken Anahtarlar ve Uç Nokta bölümünde bulunabilir.
KEY1 veya KEY2 kullanabilirsiniz. |
Azure portalında kaynağınıza gidin.
Uç Nokta ve Anahtarlar Kaynak Yönetimi bölümünde bulunabilir. Api çağrılarınızın kimliğini doğrulamak için ihtiyacınız olacak şekilde uç noktanızı ve erişim anahtarınızı kopyalayın.
KEY1
veya KEY2
kullanabilirsiniz. Her zaman iki anahtara sahip olmak, hizmet kesintisine neden olmadan anahtarları güvenli bir şekilde döndürmenize ve yeniden oluşturmanıza olanak tanır.
Ortam değişkenleri
Anahtarınız ve uç noktanız için kalıcı ortam değişkenleri oluşturun ve atayın.
Önemli
API anahtarlarını dikkatli kullanın. API anahtarını doğrudan kodunuzla eklemeyin ve hiçbir zaman herkese açık olarak göndermeyin. API anahtarı kullanıyorsanız, bunu Azure Key Vault'ta güvenli bir şekilde depolayın. Uygulamalarınızda API anahtarlarını güvenli bir şekilde kullanma hakkında daha fazla bilgi için bkz. Azure Key Vault ile API anahtarları.
Yapay zeka hizmetleri güvenliği hakkında daha fazla bilgi için bkz. Azure AI hizmetlerine yönelik isteklerin kimliğini doğrulama.
setx AZURE_OPENAI_API_KEY "REPLACE_WITH_YOUR_KEY_VALUE_HERE"
setx AZURE_OPENAI_ENDPOINT "REPLACE_WITH_YOUR_ENDPOINT_HERE"
PowerShell uygulaması oluşturma
Aşağıdaki komutu çalıştırın.
YourDeploymentName
öğesini, Whisper modelini dağıtırken seçtiğiniz dağıtım adıyla değiştirmeniz gerekir. Dağıtım adı, model adıyla aynı olmayabilir. Temel alınan model adıyla aynı olan bir dağıtım adı seçmediğiniz sürece model adının girilmesi hatayla sonuçlanır.
# Azure OpenAI metadata variables
$openai = @{
api_key = $Env:AZURE_OPENAI_API_KEY
api_base = $Env:AZURE_OPENAI_ENDPOINT # your endpoint should look like the following https://YOUR_RESOURCE_NAME.openai.azure.com/
api_version = '2024-02-01' # this may change in the future
name = 'YourDeploymentName' #This will correspond to the custom name you chose for your deployment when you deployed a model.
}
# Header for authentication
$headers = [ordered]@{
'api-key' = $openai.api_key
}
$form = @{ file = get-item -path './wikipediaOcelot.wav' }
# Send a completion call to generate an answer
$url = "$($openai.api_base)/openai/deployments/$($openai.name)/audio/transcriptions?api-version=$($openai.api_version)"
$response = Invoke-RestMethod -Uri $url -Headers $headers -Form $form -Method Post -ContentType 'multipart/form-data'
return $response.text
wikipediaOcelot.wav gibi örnek ses dosyalarını GitHub'daki Azure AI Konuşma SDK'sı deposundan alabilirsiniz.
Önemli
Üretim için, Azure Key Vault ile PowerShell Gizli Yönetimi gibi güvenli bir yöntem kullanarak kimlik bilgilerinizi depolayın ve erişin. Daha fazla bilgi için bkz. kimlik bilgisi güvenliği.
Çıktı
The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs.
Kaynakları temizle
Bir Azure OpenAI kaynağını temizlemek ve kaldırmak istiyorsanız kaynağı silebilirsiniz. Kaynağı silmeden önce dağıtılan modelleri silmeniz gerekir.
Sonraki Adımlar
- Ses verilerini toplu olarak metne dönüştürmeyi öğrenmek için bkz Toplu iş transkripsiyonu oluşturma.
- Daha fazla örnek için Azure OpenAI Örnekleri GitHub deposuna göz atın.