Az Azure OpenAI Service modelljei

Cikk
10/26/2024

Az Azure OpenAI szolgáltatást különböző képességekkel és árpontokkal rendelkező modellek változatos halmaza működteti. A modell rendelkezésre állása régiónként és felhőnként eltérő. Az Azure Government-modell rendelkezésre állásával kapcsolatban tekintse meg az Azure Government OpenAI szolgáltatást.

Modellek	Leírás
o1-preview és o1-mini	Korlátozott hozzáférési modellek, amelyek kifejezetten az érvelési és problémamegoldási feladatok nagyobb összpontosítással és képességgel való kezelésére lettek kialakítva.
GPT-4o & GPT-4o mini & GPT-4 Turbo	A legújabb, többmodális verziójú Azure OpenAI-modellek, amelyek bemenetként szövegeket és képeket is elfogadnak.
GPT-4o hang	A GPT-4o modell, amely támogatja az alacsony késleltetésű, "beszéd, beszéd ki" beszélgetési interakciókat.
GPT-4	A GPT-3.5-ben fejleszthető modellek, amelyek képesek megérteni és létrehozni a természetes nyelvet és kódot.
GPT-3.5	A GPT-3-on fejleszthető modellek, amelyek képesek megérteni és létrehozni a természetes nyelvet és a kódot.
Beágyazások	Olyan modellek készlete, amelyek a szöveg numerikus vektorformává alakíthatók a szöveg hasonlóságának megkönnyítése érdekében.
DALL-E	Olyan modellek sorozata, amelyek eredeti képeket hozhatnak létre természetes nyelvről.
Súg	Előzetes verziójú modellek sorozata, amelyek átírhatják és lefordíthatják a beszédet szöveggé.
Szövegfelolvasás (előzetes verzió)	Egy előzetes verziójú modellsorozat, amely képes szövegfelolvasásra.

o1-preview és o1-mini modellek korlátozott hozzáféréssel

Az Azure OpenAI o1-preview és o1-mini a modellek kifejezetten az érvelési és problémamegoldási feladatok nagyobb összpontosítással és képességgel való kezelésére lettek kialakítva. Ezek a modellek több időt töltenek a felhasználó kérésének feldolgozásával és megértésével, így rendkívül erősek a korábbi iterációkhoz képest olyan területeken, mint a tudomány, a kódolás és a matematika.

Modellazonosító	Leírás	Maximális kérelem (jogkivonatok)	Betanítási adatok (legfeljebb)
`o1-preview` (2024-09-12)	Az o1 sorozat legtehatósabb modellje, amely továbbfejlesztett érvelési képességeket kínál.	Bemenet: 128 000 Kimenet: 32 768	2023. október
`o1-mini` (2024-09-12)	Gyorsabb és költséghatékonyabb megoldás az o1 sorozatban, amely ideális a sebességet és alacsonyabb erőforrás-felhasználást igénylő feladatok kódolásához.	Bemenet: 128 000 Kimenet: 65 536	2023. október

Elérhetőség

A o1-preview modellek mostantól o1-mini elérhetők API-hozzáféréshez és modelltelepítéshez. Regisztráció szükséges, és a hozzáférés a Microsoft jogosultsági feltételei alapján lesz megadva.

Hozzáférés kérése: korlátozott hozzáférésű modellalkalmazás

A hozzáférés megadása után minden modellhez létre kell hoznia egy üzembe helyezést.

API-támogatás

Az o1 sorozatú modellek támogatása az API-verzióban 2024-09-01-previewlett hozzáadva.

A max_tokens paraméter elavult, és az új max_completion_tokens paraméterre cserélődött. o1 sorozatú modellek csak a max_completion_tokens paraméterrel működnek.

Használat

Ezek a modellek jelenleg nem támogatják ugyanazokat a paramétereket, mint a csevegésvégzítési API-t használó többi modell. Jelenleg csak egy nagyon korlátozott részhalmaz támogatott, ezért az olyan gyakori paraméterek, mint például temperaturea , top_pnem érhetők el, és azokat is beleszámítva a kérés sikertelen lesz. o1-preview és o1-mini a modellek nem fogadják el a rendszer üzenetszerepkörét az üzenettömb részeként.

Előfordulhat, hogy frissítenie kell az OpenAI Python-kódtár verzióját, hogy kihasználhassa az új max_completion_tokens paraméter előnyeit.

pip install openai --upgrade

Ha még nem használta a Microsoft Entra ID-t a hitelesítéshez, olvassa el az Azure OpenAI szolgáltatás Microsoft Entra ID-hitelesítéssel való konfigurálását ismertető témakört.

from openai import AzureOpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider

token_provider = get_bearer_token_provider(
    DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
)

client = AzureOpenAI(
  azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT"), 
  azure_ad_token_provider=token_provider,
  api_version="2024-09-01-preview"
)

response = client.chat.completions.create(
    model="o1-preview-new", # replace with the model deployment name of your o1-preview, or o1-mini model
    messages=[
        {"role": "user", "content": "What steps should I think about when writing my first Python API?"},
    ],
    max_completion_tokens = 5000

)

print(response.model_dump_json(indent=2))

Előfordulhat, hogy frissítenie kell az OpenAI Python-kódtár verzióját, hogy kihasználhassa az új max_completion_tokens paraméter előnyeit.

pip install openai --upgrade


from openai import AzureOpenAI

client = AzureOpenAI(
  azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT"), 
  api_key=os.getenv("AZURE_OPENAI_API_KEY"),  
  api_version="2024-09-01-preview"
)

response = client.chat.completions.create(
    model="o1-preview-new", # replace with the model deployment name of your o1-preview, or o1-mini model
    messages=[
        {"role": "user", "content": "What steps should I think about when writing my first Python API?"},
    ],
    max_completion_tokens = 5000

)

print(response.model_dump_json(indent=2))

{
  "id": "chatcmpl-AEj7pKFoiTqDPHuxOcirA9KIvf3yz",
  "choices": [
    {
      "finish_reason": "stop",
      "index": 0,
      "logprobs": null,
      "message": {
        "content": "Writing your first Python API is an exciting step in developing software that can communicate with other applications. An API (Application Programming Interface) allows different software systems to interact with each other, enabling data exchange and functionality sharing. Here are the steps you should consider when creating your first Python API:\n\n1. **Define the Purpose and Requirements**\n\n   - **Identify the Functionality**: Clearly outline what your API is supposed to do. What data or services will it provide to the users?\n   - **Determine the Endpoints**: Plan the different URLs (endpoints) through which users can access the API functionalities.\n   - **Specify Request and Response Formats**: Decide on the data formats (usually JSON) for incoming requests and outgoing responses.\n\n2. **Choose the Right Framework**\n\n   Python offers several frameworks for building APIs. Two of the most popular are:\n\n   - **Flask**: A lightweight and flexible web framework, great for small to medium-sized APIs.\n   - **FastAPI**: A modern, high-performance framework for building APIs with Python 3.6+ types, offering automatic interactive documentation.\n\n   **Example**:\n   ```bash\n   pip install flask\n   ```\n   or\n   ```bash\n   pip install fastapi uvicorn\n   ```\n\n3. **Set Up the Development Environment**\n\n   - **Create a Virtual Environment**: Isolate your project dependencies using `venv` or `conda`.\n   - **Install Required Packages**: Ensure all necessary libraries and packages are installed.\n\n   **Example**:\n   ```bash\n   python -m venv env\n   source env/bin/activate  # On Windows use `env\\Scripts\\activate`\n   ```\n\n4. **Implement the API Endpoints**\n\n   - **Write the Code for Each Endpoint**: Implement the logic that handles requests and returns responses.\n   - **Use Decorators to Define Routes**: In frameworks like Flask, you use decorators to specify the URL endpoints.\n\n   **Example with Flask**:\n   ```python\n   from flask import Flask, request, jsonify\n\n   app = Flask(__name__)\n\n   @app.route('/hello', methods=['GET'])\n   def hello_world():\n       return jsonify({'message': 'Hello, World!'})\n\n   if __name__ == '__main__':\n       app.run(debug=True)\n   ```\n\n5. **Handle Data Serialization and Deserialization**\n\n   - **Parsing Incoming Data**: Use libraries to parse JSON or other data formats from requests.\n   - **Formatting Output Data**: Ensure that responses are properly formatted in JSON or XML.\n\n6. **Implement Error Handling**\n\n   - **Handle Exceptions Gracefully**: Provide meaningful error messages and HTTP status codes.\n   - **Validate Input Data**: Check for required fields and appropriate data types to prevent errors.\n\n   **Example**:\n   ```python\n   @app.errorhandler(404)\n   def resource_not_found(e):\n       return jsonify(error=str(e)), 404\n   ```\n\n7. **Add Authentication and Authorization (If Necessary)**\n\n   - **Secure Endpoints**: If your API requires, implement security measures such as API keys, tokens (JWT), or OAuth.\n   - **Manage User Sessions**: Handle user login states and permissions appropriately.\n\n8. **Document Your API**\n\n   - **Use Tools Like Swagger/OpenAPI**: Automatically generate interactive API documentation.\n   - **Provide Usage Examples**: Help users understand how to interact with your API.\n\n   **Example with FastAPI**:\n   FastAPI automatically generates docs at `/docs` using Swagger UI.\n\n9. **Test Your API**\n\n   - **Write Unit and Integration Tests**: Ensure each endpoint works as expected.\n   - **Use Testing Tools**: Utilize tools like `unittest`, `pytest`, or API testing platforms like Postman.\n\n   **Example**:\n   ```python\n   import unittest\n   class TestAPI(unittest.TestCase):\n       def test_hello_world(self):\n           response = app.test_client().get('/hello')\n           self.assertEqual(response.status_code, 200)\n   ```\n\n10. **Optimize Performance**\n\n    - **Improve Response Times**: Optimize your code and consider using asynchronous programming if necessary.\n    - **Manage Resource Utilization**: Ensure your API can handle the expected load.\n\n11. **Deploy Your API**\n\n    - **Choose a Hosting Platform**: Options include AWS, Heroku, DigitalOcean, etc.\n    - **Configure the Server**: Set up the environment to run your API in a production setting.\n    - **Use a Production Server**: Instead of the development server, use WSGI servers like Gunicorn or Uvicorn.\n\n    **Example**:\n    ```bash\n    uvicorn main:app --host 0.0.0.0 --port 80\n    ```\n\n12. **Monitor and Maintain**\n\n    - **Logging**: Implement logging to track events and errors.\n    - **Monitoring**: Use monitoring tools to track performance and uptime.\n    - **Update and Patch**: Keep dependencies up to date and patch any security vulnerabilities.\n\n13. **Consider Versioning**\n\n    - **Plan for Updates**: Use versioning in your API endpoints to manage changes without breaking existing clients.\n    - **Example**:\n      ```python\n      @app.route('/v1/hello', methods=['GET'])\n      ```\n\n14. **Gather Feedback and Iterate**\n\n    - **User Feedback**: Encourage users to provide feedback on your API.\n    - **Continuous Improvement**: Use the feedback to make improvements and add features.\n\n**Additional Tips**:\n\n- **Keep It Simple**: Start with a minimal viable API and expand functionality over time.\n- **Follow RESTful Principles**: Design your API according to REST standards to make it intuitive and standard-compliant.\n- **Security Best Practices**: Always sanitize inputs and protect against common vulnerabilities like SQL injection and cross-site scripting (XSS).\nBy following these steps, you'll be well on your way to creating a functional and robust Python API. Good luck with your development!",
        "refusal": null,
        "role": "assistant",
        "function_call": null,
        "tool_calls": null
      },
      "content_filter_results": {
        "hate": {
          "filtered": false,
          "severity": "safe"
        },
        "protected_material_code": {
          "filtered": false,
          "detected": false
        },
        "protected_material_text": {
          "filtered": false,
          "detected": false
        },
        "self_harm": {
          "filtered": false,
          "severity": "safe"
        },
        "sexual": {
          "filtered": false,
          "severity": "safe"
        },
        "violence": {
          "filtered": false,
          "severity": "safe"
        }
      }
    }
  ],
  "created": 1728073417,
  "model": "o1-preview-2024-09-12",
  "object": "chat.completion",
  "service_tier": null,
  "system_fingerprint": "fp_503a95a7d8",
  "usage": {
    "completion_tokens": 1843,
    "prompt_tokens": 20,
    "total_tokens": 1863,
    "completion_tokens_details": {
      "audio_tokens": null,
      "reasoning_tokens": 448
    },
    "prompt_tokens_details": {
      "audio_tokens": null,
      "cached_tokens": 0
    }
  },
  "prompt_filter_results": [
    {
      "prompt_index": 0,
      "content_filter_results": {
        "custom_blocklists": {
          "filtered": false
        },
        "hate": {
          "filtered": false,
          "severity": "safe"
        },
        "jailbreak": {
          "filtered": false,
          "detected": false
        },
        "self_harm": {
          "filtered": false,
          "severity": "safe"
        },
        "sexual": {
          "filtered": false,
          "severity": "safe"
        },
        "violence": {
          "filtered": false,
          "severity": "safe"
        }
      }
    }
  ]
}

Régiónkénti elérhetőség

Standard és globális standard üzembe helyezéshez érhető el az USA keleti régiójában, az USA 2. keleti régiójában, az USA északi középső régiójában, az USA déli középső régiójában, Svédország középső régiójában, az USA nyugati régiójában és az USA 3. nyugati régiójában jóváhagyott ügyfelek számára.

GPT-4o hang

A gpt-4o-realtime-preview modell a GPT-4o modellcsalád része, és támogatja az alacsony késleltetésű, "beszéd, beszéd ki" beszélgetési interakciókat. A GPT-4o hang a valós idejű, alacsony késleltetésű beszélgetési interakciók kezelésére lett kialakítva, így kiválóan alkalmas támogató ügynökök, asszisztensek, fordítók és egyéb használati esetek kezelésére, amelyekhez a felhasználóval együtt rendkívül rugalmas háttérrendszerre van szükség.

A GPT-4o hang az USA 2. keleti régiójában (eastus2) és Svédország középső (swedencentral) régiójában érhető el. A GPT-4o hang használatához létre kell hoznia vagy használnia kell egy meglévő erőforrást az egyik támogatott régióban.

Az erőforrás létrehozásakor üzembe helyezheti a GPT-4o hangmodellt. Ha programozott üzembe helyezést végez, a modell neve .gpt-4o-realtime-preview A GPT-4o hang használatáról további információt a GPT-4o hangdokumentációjában talál.

A kérelmek maximális jogkivonatairól és a betanítási adatokról az alábbi táblázatban olvashat.

Modellazonosító	Leírás	Maximális kérelem (jogkivonatok)	Betanítási adatok (legfeljebb)
`gpt-4o-realtime-preview` (2024-10-01-preview) GPT-4o hang	Hangmodell valós idejű hangfeldolgozáshoz	Bemenet: 128 000 Kimenet: 4096	2023. október

GPT-4o és GPT-4 Turbo

A GPT-4o egyetlen modellben integrálja a szöveget és a képeket, így egyszerre több adattípust is képes kezelni. Ez a multimodális megközelítés növeli a pontosságot és a válaszkészséget az emberi-számítógépes interakciókban. A GPT-4o megfelel a GPT-4 Turbo angol nyelvű szöveg- és kódolási feladatainak, miközben kiváló teljesítményt nyújt nem angol nyelvű és látási feladatokban, új teljesítményteszteket állít be az AI-képességekhez.

Hogyan elérni a GPT-4o és a GPT-4o mini modelleket?

A GPT-4o és a GPT-4o mini standard és globális modell üzembe helyezéséhez érhető el.

Meglévő erőforrást kell létrehoznia vagy használnia egy támogatott standard vagy globális standard régióban, ahol a modell elérhető.

Az erőforrás létrehozásakor üzembe helyezheti a GPT-4o modelleket. Ha programozott üzembe helyezést végez, a modell nevei a következők:

gpt-4oVerzió 2024-08-06
gpt-4o, Verzió 2024-05-13
gpt-4o-miniVerzió 2024-07-18

GPT-4 Turbo

A GPT-4 Turbo egy nagy multimodális modell (szöveg- vagy képbemenetek elfogadása és szöveg generálása), amely nagyobb pontossággal képes megoldani a nehéz problémákat, mint az OpenAI korábbi modelljei. A GPT-3.5 Turbo és a régebbi GPT-4 modellekhez hasonlóan a GPT-4 Turbo is csevegésre van optimalizálva, és jól működik a hagyományos befejezési feladatokhoz.

A GPT-4 Turbo legújabb GA kiadása a következő:

gpt-4Verzió: turbo-2024-04-09

Ez a következő előzetes modellek lecserélése:

gpt-4Verzió: 1106-Preview
gpt-4Verzió: 0125-Preview
gpt-4Verzió: vision-preview

Az OpenAI és az Azure OpenAI GPT-4 Turbo GA modellek közötti különbségek

Az OpenAI legújabb 0409 turbómodell verziója támogatja a JSON módot és a függvényeket, amelyek minden következtetési kérést meghívnak.
Az Azure OpenAI legújabb turbo-2024-04-09 verziója jelenleg nem támogatja a JSON mód és a függvényhívás használatát, amikor következtetési kérelmeket készít képi (vision) bemenettel. A szövegalapú bemeneti kérések (képek nélküli image_url és beágyazott kérések) támogatják a JSON-módot és a függvényhívást.

Különbségek a gpt-4 vision-preview-tól

Az Azure AI-specifikus Vision fejlesztései a GPT-4 Turbo és a Vision együttműködésével nem támogatottak a verzióhoz gpt-4 : turbo-2024-04-09. Ez magában foglalja az optikai karakterfelismerést (OCR), az objektumok földelését, a videoüzeneteket és az adatok képekkel való jobb kezelését.

Fontos

Vision fejlesztések előzetes funkciók, beleértve az optikai karakterfelismerés (OCR), objektum földelés, video parancssorok lesznek kivonva, és már nem érhető el, ha gpt-4 verzió: vision-preview frissítve turbo-2024-04-09van. Ha jelenleg ezen előzetes verziójú funkciók bármelyikére támaszkodik, ez az automatikus modellfrissítés kompatibilitástörő változás lesz.

GPT-4 Turbo kiosztott felügyelt rendelkezésre állás

gpt-4Verzió: turbo-2024-04-09 standard és kiépített üzemelő példányokhoz is elérhető. A modell kiépített verziója jelenleg nem támogatja a kép-/látásbeli következtetési kérelmeket. A modell kiépített üzembe helyezései csak szöveges bemeneteket fogadnak el. A standard modelltelepítések szöveges és képi/látási következtetési kéréseket is elfogadnak.

A GPT-4 Turbo üzembe helyezése a Vision GA-val

Ha a GA-modellt a Studio felhasználói felületén szeretné üzembe helyezni, válassza ki GPT-4 , majd válassza ki a turbo-2024-04-09 verziót a legördülő menüből. A modell alapértelmezett kvótája megegyezik a gpt-4-turbo-2024-04-09 GPT-4-Turbo jelenlegi kvótával. Tekintse meg a regionális kvótakorlátokat.

GPT-4

A GPT-4 a GPT-4 Turbo elődje. Mind a GPT-4, mind a GPT-4 Turbo modellek alapmodelljének gpt-4neve . A GPT-4 és a Turbo modellek között a modellverzió vizsgálatával lehet különbséget tenni.

gpt-4Verzió 0314
gpt-4Verzió 0613
gpt-4-32kVerzió 0613

A modellösszesítő táblázatban láthatja az egyes modellek által támogatott jogkivonat-környezet hosszát.

GPT-4 és GPT-4 Turbo modellek

Ezek a modellek csak a Csevegés befejezése API-val használhatók.

A modellverziókból megtudhatja, hogyan kezeli az Azure OpenAI Service a modellverzió-frissítéseket, és hogyan dolgozhat modellekkel a GPT-4 üzemelő példányok modellverzió-beállításainak megtekintéséhez és konfigurálásához.

Modellazonosító	Leírás	Maximális kérelem (jogkivonatok)	Betanítási adatok (legfeljebb)
`gpt-4o` (2024-08-06) GPT-4o (Omni)	A legújabb nagy GA-modell - Strukturált kimenetek - Szöveg, képfeldolgozás - JSON mód - párhuzamos függvényhívás - Nagyobb pontosság és válaszkészség - Parity with English text and coding tasks to GPT-4 Turbo with Vision - Kiváló teljesítmény nem angol nyelven és látási feladatokban	Bemenet: 128 000 Kimenet: 16 384	2023. október
`gpt-4o-mini` (2024-07-18) GPT-4o mini	Legújabb kis GA-modell - Gyors, olcsó, képes modell ideális cseréje GPT-3.5 Turbo sorozatú modellek. - Szöveg, képfeldolgozás - JSON mód - párhuzamos függvényhívás	Bemenet: 128 000 Kimenet: 16 384	2023. október
`gpt-4o` (2024-05-13) GPT-4o (Omni)	Szöveg, képfeldolgozás - JSON mód - párhuzamos függvényhívás - Nagyobb pontosság és válaszkészség - Parity with English text and coding tasks to GPT-4 Turbo with Vision - Kiváló teljesítmény nem angol nyelven és látási feladatokban	Bemenet: 128 000 Kimenet: 4096	2023. október
`gpt-4` (turbo-2024-04-09) GPT-4 Turbo és Vision	Új GA-modell - Az összes korábbi GPT-4 előzetes modell cseréje (`vision-preview`, `1106-Preview`, ). `0125-Preview` - A funkciók rendelkezésre állása jelenleg eltérő a bemeneti módszertől és az üzembe helyezés típusától függően.	Bemenet: 128 000 Kimenet: 4096	2023. december
`gpt-4` (0125-Preview)* GPT-4 Turbo előzetes verzió	Mintamodell -Lecseréli az 1106-előzetes verziót – Jobb kódgenerálási teljesítmény – Csökkenti azokat az eseteket, amikor a modell nem végez el feladatot - JSON mód - párhuzamos függvényhívás - reprodukálható kimenet (előzetes verzió)	Bemenet: 128 000 Kimenet: 4096	2023. december
`gpt-4` (vision-preview) GPT-4 Turbo a Vision Előzetes verzióval	Mintamodell – Szöveg- és képbevitelt fogad el. - Támogatja a fejlesztéseket - JSON mód - párhuzamos függvényhívás - reprodukálható kimenet (előzetes verzió)	Bemenet: 128 000 Kimenet: 4096	2023. ápr.
`gpt-4` (1106-előzetes verzió) GPT-4 Turbo előzetes verzió	Mintamodell - JSON mód - párhuzamos függvényhívás - reprodukálható kimenet (előzetes verzió)	Bemenet: 128 000 Kimenet: 4096	2023. ápr.
`gpt-4-32k` (0613)	Régebbi GA-modell - Alapszintű függvényhívás eszközökkel	32,768	2021. szeptember
`gpt-4` (0613)	Régebbi GA-modell - Alapszintű függvényhívás eszközökkel	8,192	2021. szeptember
`gpt-4-32k`(0314)	Régebbi GA-modell - Nyugdíjazási információk	32,768	2021. szeptember
`gpt-4` (0314)	Régebbi GA-modell - Nyugdíjazási információk	8,192	2021. szeptember

Figyelemfelhívás

Nem javasoljuk, hogy éles környezetben használjunk előzetes verziójú modelleket. Az előzetes modellek összes üzembe helyezését frissítjük a jövőbeli előzetes verziókra vagy a legújabb stabil GA-verzióra. Az előzetes verzióra kijelölt modellek nem követik a standard Azure OpenAI-modell életciklusát.

A GPT-4 0125-előzetes verziója a GPT-4 Turbo előzetes verzió frissített verziója, amely korábban 1106-os előzetes verzióként jelent meg.
A GPT-4 0125-előzetes verziója olyan feladatokat hajt végre, mint a kódlétrehozás a gpt-4-1106-előzetes verzióhoz képest. Emiatt a feladattól függően az ügyfelek azt tapasztalhatják, hogy a GPT-4-0125-preview több kimenetet generál a gpt-4-1106-preview-hoz képest. Javasoljuk, hogy az ügyfelek hasonlítsák össze az új modell kimeneteit. A GPT-4-0125-preview a gpt-4-1106-preview hibáit is elhárítja, a nem angol nyelvű UTF-8 kezeléssel.
A GPT-4 verzió turbo-2024-04-09 a legújabb GA-kiadás, és lecseréli 0125-Previewa , 1106-previewés vision-preview.

Fontos

A GPT-4 (gpt-4) verziók1106-Preview0125-Preview, és vision-preview a jövőben egy stabil verzióval gpt-4 lesznek frissítve.

A verziók 1106-Previewközponti telepítéseigpt-4, 0125-Previewés vision-preview az "Automatikus frissítés alapértelmezettre" és a "Frissítés lejárt" értékre állítás után a rendszer a stabil verzió kiadása után megkezdi a frissítését. Minden üzemelő példány esetében a modellverzió frissítése az API-hívások szolgáltatásának megszakítása nélkül történik. A frissítések régiónként vannak megosztva, és a teljes frissítési folyamat várhatóan 2 hétig tart.
A verziók 1106-Previewközponti telepítéseigpt-4, 0125-Previewés vision-preview a "Nincs automatikus frissítés" beállítás nem lesz frissítve, és leállnak, amikor az előzetes verziót frissítik a régióban. A frissítés időzítésével kapcsolatos további információkért tekintse meg az Azure OpenAI-modell kivonásait és elavulását .

GPT-3.5

A GPT-3.5 modellek képesek megérteni és létrehozni a természetes nyelvet vagy kódot. A GPT-3.5 család leginkább alkalmas és költséghatékony modellje a GPT-3.5 Turbo, amely csevegésre lett optimalizálva, és jól működik a hagyományos befejezési feladatokhoz is. A GPT-3.5 Turbo a Chat Completions API-val használható. A GPT-3.5 Turbo Instruct hasonló képességekkel text-davinci-003 rendelkezik a Befejezések API használatához a Csevegés befejezések API helyett. A GPT-3.5 Turbo és a GPT-3.5 Turbo Instruct örökölt GPT-3.5 és GPT-3 modellek használatát javasoljuk.

Modellazonosító	Leírás	Maximális kérelem (jogkivonatok)	Betanítási adatok (legfeljebb)
`gpt-35-turbo` (0125) ÚJ	Legújabb GA-modell - JSON mód - párhuzamos függvényhívás - reprodukálható kimenet (előzetes verzió) - Nagyobb pontosság a kért formátumokban való válaszadáshoz. – Kijavítottunk egy hibát, amely szövegkódolási hibát okozott a nem angol nyelvű függvényhívások esetében.	Bemenet: 16 385 Kimenet: 4096	2021. szeptember
`gpt-35-turbo` (1106)	Régebbi GA-modell - JSON mód - párhuzamos függvényhívás - reprodukálható kimenet (előzetes verzió)	Bemenet: 16 385 Kimenet: 4096	2021. szeptember
`gpt-35-turbo-instruct` (0914)	Csak befejezési végpont - Régi befejezési modellek cseréje	4,097	2021. szeptember
`gpt-35-turbo-16k` (0613)	Régebbi GA-modell - Alapszintű függvényhívás eszközökkel	16,384	2021. szeptember
`gpt-35-turbo` (0613)	Régebbi GA-modell - Alapszintű függvényhívás eszközökkel	4,096	2021. szeptember
`gpt-35-turbo`¹ (0301)	Régebbi GA-modell - Nyugdíjazási információk	4,096	2021. szeptember

Ha többet szeretne megtudni a GPT-3.5 Turbo és a Csevegés befejezések API használatáról, tekintse meg részletes útmutatónkat.

¹ Ez a modell 4096 jogkivonatot > fogad el. Nem ajánlott túllépni a 4096 bemeneti jogkivonat korlátját, mivel a modell újabb verziója 4096 jogkivonaton van leképezve. Ha 4096 bemeneti jogkivonat túllépésekor problémákat tapasztal ezzel a modellel, ez a konfiguráció hivatalosan nem támogatott.

Beágyazások

text-embedding-3-large A legújabb és leginkább alkalmas beágyazási modell. A beágyazási modellek közötti frissítés nem lehetséges. Ahhoz, hogy áttérjen a használatról text-embedding-ada-002 , text-embedding-3-large új beágyazásokat kell létrehoznia.

text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002

A tesztelés során az OpenAI a nagy és a kis harmadik generációs beágyazási modelleket is jobb átlagos többnyelvű lekérési teljesítményt nyújt a MIRACL-teljesítményteszttel , miközben továbbra is fenntartja az angol feladatok teljesítményét az MTEB-teljesítményteszttel .

Kiértékelési teljesítményteszt	`text-embedding-ada-002`	`text-embedding-3-small`	`text-embedding-3-large`
MIRACL-átlag	31.4	44.0	54.9
MTEB-átlag	61,0	62.3	64.6

A harmadik generációs beágyazási modellek támogatják a beágyazás méretének csökkentését egy új dimensions paraméterrel. A nagyobb beágyazások általában számítási, memória- és tárolási szempontból drágábbak. A dimenziók számának módosításához nagyobb mértékben szabályozható a teljes költség és a teljesítmény. A dimensions paraméter nem támogatott az OpenAI 1.x Python-kódtár minden verziójában, ezért javasoljuk, hogy a paramétert a legújabb verzióra frissítse: pip install openai --upgrade.

Az OpenAI MTEB benchmark-tesztje azt találta, hogy még akkor is, ha a harmadik generációs modell méretei 1536-nál text-embeddings-ada-002 kisebbre csökkennek, a teljesítmény kissé jobb marad.

DALL-E

A DALL-E modellek képeket hoznak létre a felhasználó által megadott szöveges kérésekből. A DALL-E 3 általánosan elérhető a REST API-khoz. A DALL-E 2 és a DALL-E 3 ügyféloldali SDK-kkal előzetes verzióban érhető el.

Súg

A Suttogó modellek szövegfelolvasáshoz használhatók.

A Whisper-modellt az Azure AI Speech kötegelt átírási API-val is használhatja. További információ az Azure AI Speech és az Azure OpenAI szolgáltatás használatáról: Mi a Whisper-modell?

Szövegfelolvasás (előzetes verzió)

A jelenleg előzetes verzióban elérhető OpenAI-szöveg-beszédmodellek a szöveg beszédszintézisére használhatók.

Az OpenAI szöveget az Azure AI Speech használatával is beszédre használhatja. További információ: OpenAI text to speech voices via Azure OpenAI Service vagy Azure AI Speech guide.

Modellösszesítő táblázat és régió rendelkezésre állása

Modellek üzembe helyezési típus szerint

Az Azure OpenAI az üzleti és használati mintáknak megfelelő üzemeltetési struktúrával kapcsolatos lehetőségeket biztosít az ügyfelek számára. A szolgáltatás két fő üzembe helyezési típust kínál:

A Standard egy globális üzembe helyezési lehetőséggel érhető el, amely globálisan irányítja a forgalmat, hogy nagyobb átviteli sebességet biztosítson.
A kiépítés egy globális üzembe helyezési lehetőséggel is elérhető, amely lehetővé teszi az ügyfelek számára a kiépített átviteli egységek megvásárlását és üzembe helyezését az Azure globális infrastruktúrában.

Minden üzemelő példány pontosan ugyanazokat a következtetési műveleteket hajthatja végre, azonban a számlázás, a skálázás és a teljesítmény lényegesen eltérő. Az Azure OpenAI üzembe helyezési típusaival kapcsolatos további információkért tekintse meg az üzembe helyezési típusokra vonatkozó útmutatót.

Globális standard modell rendelkezésre állása

Régió	o1-preview, 2024-09-12	o1-mini, 2024-09-12	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18	gpt-4o-realtime-preview, 2024-10-01	gpt-4, turbo-2024-04-09
ausztráliaeast	-	-	✅	-	✅	-	✅
brazilsouth	-	-	✅	-	✅	-	✅
canadaeast	-	-	✅	-	✅	-	✅
eastus	✅	✅	✅	✅	✅	-	✅
eastus2	✅	✅	✅	✅	✅	✅	✅
francecentral	-	-	✅	-	✅	-	✅
germanywestcentral	-	-	✅	-	✅	-	✅
japaneast	-	-	✅	-	✅	-	✅
koreacentral	-	-	✅	-	✅	-	✅
northcentralus	✅	✅	✅	✅	✅	-	✅
norwayeast	-	-	✅	-	✅	-	✅
lengyelországcentral	-	-	✅	-	✅	-	✅
southafricanorth	-	-	✅	-	✅	-	✅
USA déli középső régiója	✅	✅	✅	✅	✅	-	✅
southindia	-	-	✅	-	✅	-	✅
spaincentral	-	-	✅	✅	✅	-	✅
swedencentral	✅	✅	✅	✅	✅	✅	✅
switzerlandnorth	-	-	✅	-	✅	-	✅
uaenorth	-	-	✅	-	✅	-	✅
uksouth	-	-	✅	-	✅	-	✅
westeurope	-	-	✅	-	✅	-	✅
westus	✅	✅	✅	✅	✅	-	✅
westus3	✅	✅	✅	✅	✅	-	✅

Globálisan kiosztott felügyelt modell rendelkezésre állása

Régió	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18
ausztráliaeast	✅	✅
brazilsouth	✅	✅
canadacentral	✅	✅
canadaeast	✅	✅
eastus	✅	✅
eastus2	✅	✅
francecentral	✅	✅
germanywestcentral	✅	✅
japaneast	✅	✅
koreacentral	✅	✅
northcentralus	✅	✅
norwayeast	✅	✅
lengyelországcentral	✅	✅
southafricanorth	✅	✅
USA déli középső régiója	✅	✅
southindia	✅	✅
spaincentral	✅	✅
swedencentral	✅	✅
switzerlandnorth	✅	✅
svájcwest	✅	✅
uksouth	✅	✅
westeurope	✅	✅
westus	✅	✅
westus3	✅	✅

A kötegelt modell globális rendelkezésre állása

Régió	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18	gpt-4, 0613	gpt-4, turbo-2024-04-09	gpt-35-turbo, 0613	gpt-35-turbo, 1106	gpt-35-turbo, 0125
ausztráliaeast	✅	✅	✅	✅	✅	✅	✅	✅
canadaeast	✅	✅	✅	✅	✅	✅	✅	✅
eastus	✅	✅	✅	✅	✅	✅	✅	✅
eastus2	✅	✅	✅	✅	✅	✅	✅	✅
northcentralus	✅	✅	✅	✅	✅	✅	✅	✅
USA déli középső régiója	✅	✅	✅	✅	✅	✅	✅	✅
southindia	✅	✅	✅	✅	✅	✅	✅	✅
swedencentral	✅	✅	✅	✅	✅	✅	✅	✅
switzerlandnorth	✅	✅	✅	✅	✅	✅	✅	✅
uksouth	✅	✅	✅	✅	✅	✅	✅	✅
westus	✅	✅	✅	✅	✅	✅	✅	✅
westus3	✅	✅	✅	✅	✅	✅	✅	✅

Az adatzóna standard modell rendelkezésre állása

Régió	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18
eastus	✅	✅	✅
eastus2	✅	✅	✅
francecentral	✅	✅	✅
germanywestcentral	✅	✅	✅
northcentralus	✅	✅	✅
lengyelországcentral	✅	✅	✅
USA déli középső régiója	✅	✅	✅
spaincentral	✅	✅	✅
swedencentral	✅	✅	✅
westeurope	✅	✅	✅
westus	✅	✅	✅
westus3	✅	✅	✅

Standard üzemi modell rendelkezésre állása

Régió	o1-preview, 2024-09-12	o1-mini, 2024-09-12	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18	gpt-4, 0613	gpt-4, 1106-Preview	gpt-4, 0125-Preview	gpt-4, vision-preview	gpt-4, turbo-2024-04-09	gpt-4-32k, 0613	gpt-35-turbo, 0301	gpt-35-turbo, 0613	gpt-35-turbo, 1106	gpt-35-turbo, 0125	gpt-35-turbo-16k, 0613	gpt-35-turbo-instruct, 0914	text-embedding-3-small, 1	text-embedding-3-large, 1	text-embedding-ada-002, 1	text-embedding-ada-002, 2	dall-e-2, 2.0	dall-e-3, 3.0	babbage-002, 1	davinci-002, 1	tts, 001	tts-hd, 001	whisper, 001
ausztráliaeast	-	-	-	-	-	✅	✅	-	✅	-	✅	-	✅	✅	-	✅	-	-	-	-	✅	-	✅	-	-	-	-	-
brazilsouth	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-
canadaeast	-	-	-	-	-	✅	✅	-	-	-	✅	-	✅	✅	✅	✅	-	✅	✅	-	✅	-	-	-	-	-	-	-
eastus	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	-	-	-
eastus2	✅	✅	✅	✅	✅	-	✅	-	-	✅	-	-	✅	-	✅	✅	-	✅	✅	-	✅	-	-	-	-	-	-	✅
francecentral	-	-	-	-	-	✅	✅	-	-	-	✅	✅	✅	✅	-	✅	-	-	✅	-	✅	-	-	-	-	-	-	-
japaneast	-	-	-	-	-	-	-	-	✅	-	-	-	✅	-	✅	✅	-	✅	✅	-	✅	-	-	-	-	-	-	-
northcentralus	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	-	✅	-	✅	✅	-	-	-	-	✅	-	-	✅	✅	✅	✅	✅
norwayeast	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-	-	-	-	✅	-	✅	-	-	-	-	-	-	✅
lengyelországcentral	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-	-
southafricanorth	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-
USA déli középső régiója	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	✅	-	-	✅	-	-	-	-	✅	✅	-	-	-	-	-	-	-
southindia	-	-	-	-	-	-	✅	-	-	-	-	-	-	✅	-	-	-	-	✅	-	✅	-	-	-	-	-	-	✅
swedencentral	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	-	✅	✅	-	✅	✅	-	✅	-	✅	-	✅	✅	✅	✅	✅	✅
switzerlandnorth	-	-	-	-	-	✅	-	-	✅	-	✅	-	✅	-	-	✅	-	-	✅	-	✅	-	-	-	-	-	-	✅
uaenorth	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	✅
uksouth	-	-	-	-	-	-	✅	✅	-	-	-	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	-	-	-	-	-	-
westeurope	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	✅
westus	✅	✅	✅	✅	✅	-	✅	-	✅	✅	-	-	-	✅	✅	-	-	-	-	-	✅	-	-	-	-	-	-	-
westus3	✅	✅	✅	✅	✅	-	✅	-	-	✅	-	-	-	-	✅	-	-	-	✅	-	✅	-	-	-	-	-	-	-

Üzembehelyezési modell rendelkezésre állása

Régió	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18	gpt-4, 0613	gpt-4, 1106-Preview	gpt-4, 0125-Preview	gpt-4, turbo-2024-04-09	gpt-4-32k, 0613	gpt-35-turbo, 1106	gpt-35-turbo, 0125
ausztráliaeast	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
brazilsouth	✅	-	✅	✅	✅	✅	-	✅	✅	-
canadacentral	-	-	-	✅	-	-	-	✅	-	✅
canadaeast	✅	-	✅	✅	✅	-	✅	-	✅	-
eastus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
eastus2	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
francecentral	✅	✅	✅	✅	✅	✅	-	✅	-	✅
germanywestcentral	✅	-	-	✅	✅	✅	✅	✅	✅	-
japaneast	✅	✅	✅	-	✅	✅	✅	-	-	✅
koreacentral	✅	✅	✅	✅	-	-	✅	✅	✅	-
northcentralus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
norwayeast	✅	-	✅	✅	-	✅	-	✅	-	-
lengyelországcentral	✅	-	-	✅	✅	✅	✅	✅	✅	✅
southafricanorth	✅	-	-	✅	✅	-	✅	✅	✅	-
USA déli középső régiója	✅	-	-	✅	✅	✅	✅	✅	✅	✅
southindia	✅	-	✅	✅	✅	✅	-	✅	✅	✅
swedencentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
switzerlandnorth	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
svájcwest	-	-	-	-	-	-	-	-	-	✅
uaenorth	✅	-	-	-	✅	-	-	-	✅	✅
uksouth	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus3	✅	✅	-	✅	✅	✅	✅	✅	✅	✅

Feljegyzés

A Verzió kiépített verziója gpt-4 : turbo-2024-04-09 jelenleg csak szövegre korlátozódik.

A kiépített üzembe helyezésekkel kapcsolatos további információkért tekintse meg a kiépített útmutatót.

Ez a táblázat nem tartalmazza a regionális rendelkezésre állási adatok finomhangolását. Az információkért tekintse meg a finomhangolási szakaszt .

Standard modellek végpontok szerint

Csevegés befejezése

Régió	o1-preview, 2024-09-12	o1-mini, 2024-09-12	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18	gpt-4, 0613	gpt-4, 1106-Preview	gpt-4, 0125-Preview	gpt-4, vision-preview	gpt-4, turbo-2024-04-09	gpt-4-32k, 0613	gpt-35-turbo, 0301	gpt-35-turbo, 0613	gpt-35-turbo, 1106	gpt-35-turbo, 0125	gpt-35-turbo-16k, 0613
ausztráliaeast	-	-	-	-	-	✅	✅	-	✅	-	✅	-	✅	✅	-	✅
canadaeast	-	-	-	-	-	✅	✅	-	-	-	✅	-	✅	✅	✅	✅
eastus	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	✅	✅	-	✅	✅
eastus2	✅	✅	✅	✅	✅	-	✅	-	-	✅	-	-	✅	-	✅	✅
francecentral	-	-	-	-	-	✅	✅	-	-	-	✅	✅	✅	✅	-	✅
japaneast	-	-	-	-	-	-	-	-	✅	-	-	-	✅	-	✅	✅
northcentralus	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	-	✅	-	✅	✅
norwayeast	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-	-
USA déli középső régiója	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	✅	-	-	✅	-
southindia	-	-	-	-	-	-	✅	-	-	-	-	-	-	✅	-	-
swedencentral	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	-	✅	✅	-	✅
switzerlandnorth	-	-	-	-	-	✅	-	-	✅	-	✅	-	✅	-	-	✅
uksouth	-	-	-	-	-	-	✅	✅	-	-	-	✅	✅	✅	✅	✅
westeurope	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-
westus	✅	✅	✅	✅	✅	-	✅	-	✅	✅	-	-	-	✅	✅	-
westus3	✅	✅	✅	✅	✅	-	✅	-	-	✅	-	-	-	-	✅	-

GPT-4 és GPT-4 Turbo modell rendelkezésre állása

Ügyfélhozzáférés kiválasztása

A fenti régiók mellett, amelyek minden Azure OpenAI-ügyfél számára elérhetők, egyes kiválasztott, már meglévő ügyfelek további régiókban kaptak hozzáférést a GPT-4 verzióihoz:

Modell	Régió
`gpt-4` (0314) `gpt-4-32k` (0314)	USA keleti régiója Közép-Franciaország USA déli középső régiója Az Egyesült Királyság déli régiója
`gpt-4` (0613) `gpt-4-32k` (0613)	USA keleti régiója USA 2. keleti régiója Kelet-Japán Az Egyesült Királyság déli régiója

GPT-3.5 modellek

A modellverziókból megtudhatja, hogyan kezeli az Azure OpenAI Service a modellverzió-frissítéseket, és hogyan dolgozhat modellekkel a GPT-3.5 Turbo-környezetek modellverzió-beállításainak megtekintéséhez és konfigurálásához.

Beágyazási modellek

Régió	text-embedding-3-small, 1	text-embedding-3-large, 1	text-embedding-ada-002, 1	text-embedding-ada-002, 2
ausztráliaeast	-	-	-	✅
brazilsouth	-	-	-	✅
canadaeast	✅	✅	-	✅
eastus	✅	✅	✅	✅
eastus2	✅	✅	-	✅
francecentral	-	✅	-	✅
japaneast	✅	✅	-	✅
northcentralus	-	-	-	✅
norwayeast	-	✅	-	✅
lengyelországcentral	-	✅	-	-
southafricanorth	-	-	-	✅
USA déli középső régiója	-	-	✅	✅
southindia	-	✅	-	✅
swedencentral	-	✅	-	✅
switzerlandnorth	-	✅	-	✅
uaenorth	-	-	-	✅
uksouth	-	✅	-	✅
westeurope	-	-	-	✅
westus	-	-	-	✅
westus3	-	✅	-	✅

Ezek a modellek csak API-kérések beágyazásával használhatók.

Feljegyzés

text-embedding-3-large A legújabb és leginkább alkalmas beágyazási modell. A beágyazási modellek közötti frissítés nem lehetséges. A használatból text-embedding-ada-002 text-embedding-3-large való migráláshoz új beágyazásokat kell létrehoznia.

Modellazonosító	Maximális kérelem (jogkivonatok)	Kimeneti dimenziók	Betanítási adatok (naprakész)
`text-embedding-ada-002` (2. verzió)	8,192	1,536	2021. szeptember
`text-embedding-ada-002` (1. verzió)	2,046	1,536	2021. szeptember
`text-embedding-3-large`	8,192	3,072	2021. szeptember
`text-embedding-3-small`	8,192	1,536	2021. szeptember

Feljegyzés

Bemenetek tömbjének beágyazáshoz való küldésekor a tömbben lévő bemeneti elemek maximális száma a beágyazási végpontra irányuló hívásonként 2048.

Képgenerálási modellek

Régió	dall-e-2, 2.0	dall-e-3, 3.0
ausztráliaeast	-	✅
eastus	✅	✅
swedencentral	-	✅

DALL-E modellek

Modellazonosító	Maximális kérelem (karakterek)
dalle2 (előzetes verzió)	1000
dall-e-3	4 000

Hangmodellek

Régió	tts, 001	tts-hd, 001	whisper, 001
eastus2	-	-	✅
northcentralus	✅	✅	✅
norwayeast	-	-	✅
southindia	-	-	✅
swedencentral	✅	✅	✅
switzerlandnorth	-	-	✅
uaenorth	-	-	✅
westeurope	-	-	✅

Suttogó modellek

Modellazonosító	Maximális kérelem (hangfájl mérete)
`whisper`	25 MB

Szöveg–beszédmodellek (előzetes verzió)

Modellazonosító	Leírás
`tts`	A legújabb Azure OpenAI szövegfelolvasási modell, amely a sebességre van optimalizálva.
`tts-hd`	A legújabb Azure OpenAI szövegről beszédre modell, minőségre optimalizálva.

Befejezési modellek

babbage-002 és davinci-002 nincsenek betanításuk az utasítások követésére. Ezeknek az alapmodelleknek a lekérdezése csak egy finomhangolt verzió hivatkozási pontjaként végezhető el a betanítás előrehaladásának kiértékeléséhez.

Régió	gpt-35-turbo-instruct, 0914	babbage-002, 1	davinci-002, 1
eastus	✅	-	-
northcentralus	-	✅	✅
swedencentral	✅	✅	✅

Modellek finomhangolása

Feljegyzés

gpt-35-turbo – A modell finomhangolása a régiók egy részhalmazára korlátozódik, és nem érhető el minden régióban, ahol az alapmodell elérhető.

A finomhangolás támogatott régiói eltérőek lehetnek, ha Azure OpenAI-modelleket használ egy AI Studio-projektben, és nem egy projekten kívül.

Modellazonosító	Régiók finomhangolása	Maximális kérelem (jogkivonatok)	Betanítási adatok (legfeljebb)
`babbage-002`	USA északi középső régiója Svédország középső régiója Nyugat-Svájc	16,384	2021. szeptember
`davinci-002`	USA északi középső régiója Svédország középső régiója Nyugat-Svájc	16,384	2021. szeptember
`gpt-35-turbo` (0613)	USA 2. keleti régiója USA északi középső régiója Svédország középső régiója Nyugat-Svájc	4,096	2021. szeptember
`gpt-35-turbo` (1106)	USA 2. keleti régiója USA északi középső régiója Svédország középső régiója Nyugat-Svájc	Bemenet: 16 385 Kimenet: 4096	2021. szeptember
`gpt-35-turbo` (0125)	USA 2. keleti régiója USA északi középső régiója Svédország középső régiója Nyugat-Svájc	16,385	2021. szeptember
`gpt-4` (0613) ¹	USA északi középső régiója Közép-Svédország	8192	2021. szeptember
`gpt-4o-mini`¹ (2024-07-18)	USA északi középső régiója Közép-Svédország	Bemenet: 128 000 Kimenet: 16 384 Példa betanítási környezet hossza: 64 536	2023. október
`gpt-4o`¹ (2024-08-06)	USA 2. keleti régiója USA északi középső régiója Közép-Svédország	Bemenet: 128 000 Kimenet: 16 384 Példa betanítási környezet hossza: 64 536	2023. október

^{Az 1} GPT-4 jelenleg nyilvános előzetes verzióban érhető el.

Asszisztensek (előzetes verzió)

Az Asszisztensek esetében egy támogatott modell és egy támogatott régió kombinációjára van szükség. Bizonyos eszközökhöz és képességekhez a legújabb modellek szükségesek. A következő modellek érhetők el az Assistants API-ban, az SDK-ban és az Azure AI Studióban. Az alábbi táblázat használatalapú fizetésre szolgál. A kiosztott átviteli egység (PTU) rendelkezésre állásáról további információt a kiosztott átviteli sebességben talál. A felsorolt modellek és régiók az Assistants v1 és v2 verzióval is használhatók. Globális standard modelleket akkor használhat, ha az alább felsorolt régiókban támogatottak.

Régió	`gpt-35-turbo (0613)`	`gpt-35-turbo (1106)`	`fine tuned gpt-3.5-turbo-0125`	`gpt-4 (0613)`	`gpt-4 (1106)`	`gpt-4 (0125)`	`gpt-4o (2024-05-13)`	`gpt-4o-mini (2024-07-18)`
Kelet-Ausztrália	✅	✅		✅	✅
USA keleti régiója	✅					✅	✅	✅
USA 2. keleti régiója	✅		✅	✅	✅		✅
Közép-Franciaország	✅	✅		✅	✅
Kelet-Japán	✅
Kelet-Norvégia					✅
Közép-Svédország	✅	✅	✅	✅	✅		✅
Az Egyesült Királyság déli régiója	✅	✅			✅	✅
USA nyugati régiója		✅			✅		✅
USA 3. nyugati régiója					✅		✅

Modell kivonása

A modell kivonásával kapcsolatos legfrissebb információkért tekintse meg a modell kivonási útmutatójában.

Megosztás a következőn keresztül:

Az Azure OpenAI Service modelljei

o1-preview és o1-mini modellek korlátozott hozzáféréssel

Elérhetőség

API-támogatás

Használat

Régiónkénti elérhetőség

GPT-4o hang

GPT-4o és GPT-4 Turbo

Hogyan elérni a GPT-4o és a GPT-4o mini modelleket?

GPT-4 Turbo

Az OpenAI és az Azure OpenAI GPT-4 Turbo GA modellek közötti különbségek

Különbségek a gpt-4 vision-preview-tól

GPT-4 Turbo kiosztott felügyelt rendelkezésre állás

A GPT-4 Turbo üzembe helyezése a Vision GA-val

GPT-4

GPT-4 és GPT-4 Turbo modellek

GPT-3.5

Beágyazások

DALL-E

Súg

Szövegfelolvasás (előzetes verzió)

Modellösszesítő táblázat és régió rendelkezésre állása

Modellek üzembe helyezési típus szerint

Globális standard modell rendelkezésre állása

Standard modellek végpontok szerint

Csevegés befejezése

GPT-4 és GPT-4 Turbo modell rendelkezésre állása

Ügyfélhozzáférés kiválasztása

GPT-3.5 modellek

Modellek finomhangolása

Asszisztensek (előzetes verzió)

Modell kivonása

Következő lépések

Visszajelzés

További források