Udostępnij za pośrednictwem


Szablony aplikacji sztucznej inteligencji

W tej sekcji dokumentacji przedstawiono szablony aplikacji sztucznej inteligencji i powiązane artykuły, które korzystają z tych szablonów, aby zademonstrować sposób wykonywania kluczowych zadań deweloperskich. Szablony aplikacji sztucznej inteligencji zapewniają dobrze utrzymywane, łatwe w wdrażaniu implementacje referencyjne, które pomagają zapewnić wysokiej jakości punkt wyjścia dla aplikacji sztucznej inteligencji.

Istnieją dwie kategorie szablonów aplikacji sztucznej inteligencji, bloki konstrukcyjne i kompleksowe rozwiązania. W poniższych sekcjach przedstawiono niektóre szablony kluczy w każdej kategorii dla języka programowania wybranego w górnej części tego artykułu. Aby przejrzeć bardziej kompleksową listę zawierającą te i inne szablony, zobacz szablony aplikacji sztucznej inteligencji w galerii interfejsu wiersza polecenia dla deweloperów platformy Azure.

Bloki konstrukcyjne

Bloki konstrukcyjne to próbki o mniejszej skali, które koncentrują się na konkretnych scenariuszach i zadaniach. Większość bloków konstrukcyjnych demonstruje funkcje, które korzystają z kompleksowego rozwiązania dla aplikacji do czatu korzystającej z własnych danych.

Blok konstrukcyjny opis
Równoważenie obciążenia za pomocą usługi Azure Container Apps Dowiedz się, jak dodać równoważenie obciążenia do aplikacji, aby rozszerzyć aplikację czatu poza limity przydziału tokenu usługi Azure OpenAI i modelu. To podejście używa usługi Azure Container Apps do tworzenia trzech punktów końcowych usługi Azure OpenAI, a także podstawowego kontenera do kierowania ruchu przychodzącego do jednego z trzech punktów końcowych.
Blok konstrukcyjny opis
Konfigurowanie zabezpieczeń dokumentów dla aplikacji do czatu Podczas tworzenia aplikacji czatu przy użyciu wzorca RAG z własnymi danymi upewnij się, że każdy użytkownik otrzyma odpowiedź na podstawie swoich uprawnień. Autoryzowany użytkownik powinien mieć dostęp do odpowiedzi zawartych w dokumentach aplikacji do czatu. Nieautoryzowany użytkownik nie powinien mieć dostępu do odpowiedzi z zabezpieczonych dokumentów, które nie mają autoryzacji do wyświetlenia.
Ocena odpowiedzi aplikacji do czatu Dowiedz się, jak ocenić odpowiedzi aplikacji czatu na zestaw poprawnych lub idealnych odpowiedzi (znanych jako prawda podstawy). Za każdym razem, gdy zmienisz aplikację czatu w sposób, który ma wpływ na odpowiedzi, uruchom ocenę, aby porównać zmiany. Ta aplikacja demonstracyjna oferuje narzędzia, których można używać dzisiaj, aby ułatwić uruchamianie ocen.
Równoważenie obciążenia za pomocą usługi Azure Container Apps Dowiedz się, jak dodać równoważenie obciążenia do aplikacji, aby rozszerzyć aplikację czatu poza limity przydziału tokenu usługi Azure OpenAI i modelu. To podejście używa usługi Azure Container Apps do tworzenia trzech punktów końcowych usługi Azure OpenAI, a także podstawowego kontenera do kierowania ruchu przychodzącego do jednego z trzech punktów końcowych.
Równoważenie obciążenia za pomocą usługi API Management Dowiedz się, jak dodać równoważenie obciążenia do aplikacji, aby rozszerzyć aplikację czatu poza limity przydziału tokenu usługi Azure OpenAI i modelu. To podejście używa usługi Azure API Management do tworzenia trzech punktów końcowych usługi Azure OpenAI, a także kontenera podstawowego do kierowania ruchu przychodzącego do jednego z trzech punktów końcowych.
Testowanie obciążenia aplikacji czatu w języku Python za pomocą locust Dowiedz się, jak przeprowadzić testowanie obciążenia w aplikacji czatu w języku Python przy użyciu wzorca RAG z Locust, popularnym narzędziem do testowania obciążenia typu open source. Głównym celem testowania obciążenia jest upewnienie się, że oczekiwane obciążenie aplikacji czatu nie przekracza bieżącego limitu przydziału transakcji usługi Azure OpenAI na minutę (TPM). Symulując zachowanie użytkownika pod dużym obciążeniem, można zidentyfikować potencjalne wąskie gardła i problemy ze skalowalnością w aplikacji.
Blok konstrukcyjny opis
Równoważenie obciążenia za pomocą usługi Azure Container Apps Dowiedz się, jak dodać równoważenie obciążenia do aplikacji, aby rozszerzyć aplikację czatu poza limity przydziału tokenu usługi Azure OpenAI i modelu. To podejście używa usługi Azure Container Apps do tworzenia trzech punktów końcowych usługi Azure OpenAI, a także podstawowego kontenera do kierowania ruchu przychodzącego do jednego z trzech punktów końcowych.
Blok konstrukcyjny opis
Ocena odpowiedzi aplikacji do czatu Dowiedz się, jak ocenić odpowiedzi aplikacji czatu na zestaw poprawnych lub idealnych odpowiedzi (znanych jako prawda podstawy). Za każdym razem, gdy zmienisz aplikację czatu w sposób, który ma wpływ na odpowiedzi, uruchom ocenę, aby porównać zmiany. Ta aplikacja demonstracyjna oferuje narzędzia, których można używać dzisiaj, aby ułatwić uruchamianie ocen.
Równoważenie obciążenia za pomocą usługi Azure Container Apps Dowiedz się, jak dodać równoważenie obciążenia do aplikacji, aby rozszerzyć aplikację czatu poza limity przydziału tokenu usługi Azure OpenAI i modelu. To podejście używa usługi Azure Container Apps do tworzenia trzech punktów końcowych usługi Azure OpenAI, a także podstawowego kontenera do kierowania ruchu przychodzącego do jednego z trzech punktów końcowych.
Równoważenie obciążenia za pomocą usługi API Management Dowiedz się, jak dodać równoważenie obciążenia do aplikacji, aby rozszerzyć aplikację czatu poza limity przydziału tokenu usługi Azure OpenAI i modelu. To podejście używa usługi Azure API Management do tworzenia trzech punktów końcowych usługi Azure OpenAI, a także kontenera podstawowego do kierowania ruchu przychodzącego do jednego z trzech punktów końcowych.

Kompleksowe rozwiązania

Kompleksowe rozwiązania to kompleksowe przykłady referencyjne, w tym dokumentowanie, kod źródłowy i wdrażanie, które umożliwiają wykonywanie i rozszerzanie ich na własne potrzeby.

Rozmowa z danymi przy użyciu usług Azure OpenAI i Azure AI Search za pomocą platformy .NET

Ten szablon to kompletne kompleksowe rozwiązanie demonstrujące wzorzec generacji rozszerzonej pobierania (RAG, Retrieval-Augmented Generation) uruchomiony na platformie Azure. Używa ona usługi Azure AI Search do pobierania i dużych modeli językowych usługi Azure OpenAI, aby zapewnić obsługę środowisk typu ChatGPT i Q&A.

Aby rozpocząć pracę z tym szablonem, zobacz Wprowadzenie do czatu przy użyciu własnego przykładu danych dla platformy .NET. Aby uzyskać dostęp do kodu źródłowego i przeczytać szczegółowe informacje o szablonie, zobacz repozytorium GitHub azure-search-openai-demo-csharp .

Diagram przedstawiający architekturę z klienta do aplikacji zaplecza dla platformy .NET.

Zrzut ekranu przedstawiający aplikację czatu .NET w przeglądarce z kilkoma sugestiami dotyczącymi wprowadzania danych wejściowych na czacie i polem tekstowym czatu w celu wprowadzenia pytania.

Ten szablon demonstruje użycie tych funkcji.

Rozwiązanie do hostingu platformy Azure Technologie Modele AI
Azure Container Apps
Azure Functions
Azure OpenAI
Przetwarzanie obrazów na platformie Azure
Rozpoznawanie formularzy Azure
Wyszukiwanie AI platformy Azure
Azure Storage
GPT 3.5 Turbo
GPT 4.0

Firma Contoso rozmawia w handlu detalicznym Copilot za pomocą platformy .NET i jądra semantycznego

Ten szablon implementuje firmę Contoso Outdoors, koncepcyjny sklep specjalizujący się w sprzęcie na świeżym powietrzu dla entuzjastów turystyki pieszej i kempingowej. Ten sklep wirtualny zwiększa zaangażowanie klientów i obsługę sprzedaży za pośrednictwem inteligentnego agenta czatu. Ten agent jest obsługiwany przez wzorzec generacji rozszerzonej (RAG) pobierania w usłudze Microsoft Azure AI Stack wzbogacony o obsługę semantycznych jądra i monitów.

Aby uzyskać dostęp do kodu źródłowego i przeczytać szczegółowe informacje o szablonie, zobacz repozytorium GitHub contoso-chat-csharp-prompty .

Diagram przedstawiający architekturę od klienta do aplikacji zaplecza dla aplikacji turystycznej.

Zrzut ekranu przedstawiający sklep dla miłośników turystyki turystycznej i kempingowej platformy .NET.

Ten szablon demonstruje użycie tych funkcji.

Rozwiązanie do hostingu platformy Azure Technologie Modele AI
Azure Container Apps
Azure OpenAI
Microsoft Entra ID
Tożsamość zarządzana na platformie Azure
Azure Monitor
Wyszukiwanie AI platformy Azure
Azure AI Studio
Azure SQL
Azure Storage
GPT 3.5 Turbo
GPT 4.0

Automatyzacja procesów z zamianą mowy na tekst i podsumowywaniem za pomocą platform .NET i GPT 3.5 Turbo

Ten szablon jest rozwiązaniem automatyzacji procesów, które odbiera problemy zgłaszane przez pracowników terenowych i sklepowych w firmie o nazwie Contoso Manufacturing, firmie produkcyjnej, która produkuje baterie samochodowe. Problemy są współużytkowane przez pracowników za pośrednictwem danych wejściowych mikrofonu lub wstępnie zarejestrowanych jako pliki audio. Rozwiązanie tłumaczy dane wejściowe audio z mowy na tekst, a następnie używa modułu LLM i Prompty lub Promptflow do podsumowania problemu i zwrócenia wyników w formacie określonym przez rozwiązanie.

Aby uzyskać dostęp do kodu źródłowego i przeczytać szczegółowe informacje o szablonie, zobacz repozytorium GitHub summarization-openai-csharp-prompty .

Zrzut ekranu aplikacji internetowej platformy .NET z czatem bocznym na potrzeby zamiany mowy na tekst i podsumowanie dla firmy Contoso Manufacturing.

Ten szablon demonstruje użycie tych funkcji.

Rozwiązanie do hostingu platformy Azure Technologie Modele AI
Azure Container Apps Zamiana mowy na tekst
Podsumowanie
Azure OpenAI
GPT 3.5 Turbo

Rozmowa z danymi przy użyciu usług Azure OpenAI i Azure AI Search przy użyciu języka Python

Ten szablon to kompletne kompleksowe rozwiązanie demonstrujące wzorzec generacji rozszerzonej pobierania (RAG, Retrieval-Augmented Generation) uruchomiony na platformie Azure. Używa ona usługi Azure AI Search do pobierania i dużych modeli językowych usługi Azure OpenAI, aby zapewnić obsługę środowisk typu ChatGPT i Q&A.

Aby rozpocząć pracę z tym szablonem, zobacz Wprowadzenie do czatu przy użyciu własnego przykładu danych dla języka Python. Aby uzyskać dostęp do kodu źródłowego i przeczytać szczegółowe informacje o szablonie, zobacz repozytorium GitHub azure-search-openai-demo .

Zrzut ekranu przedstawiający aplikację czatu w przeglądarce z kilkoma sugestiami dotyczącymi wprowadzania danych wejściowych na czacie i polem tekstowym czatu w celu wprowadzenia pytania.

Diagram przedstawiający architekturę z klienta do aplikacji zaplecza

Ten szablon demonstruje użycie tych funkcji.

Rozwiązanie do hostingu platformy Azure Technologie Modele AI
Azure App Service Azure OpenAI
Wyszukiwanie w usłudze Bing
Tożsamość zarządzana na platformie Azure
Azure Monitor
Wyszukiwanie AI platformy Azure
Azure AI Studio
GPT 3.5 Turbo
GPT 4.0
DALL-E

Multi-Modal Creative Writing Copilot with DALL-E

Ten szablon jest kreatywnym rozwiązaniem do pisania wielu agentów, które ułatwia użytkownikom pisanie artykułów. Pokazano w nim, jak tworzyć agentów sztucznej inteligencji i pracować z agentami sztucznej inteligencji opartymi na usłudze Azure OpenAI. Zawiera ona aplikację platformy Flask, która pobiera temat i instrukcje od użytkownika, a następnie wywołuje agenta badawczego korzystającego z interfejsu API wyszukiwania Bing do badania tematu, agenta produktu korzystającego z usługi Azure AI Search w celu wyszukiwania semantycznej podobieństwa powiązanych produktów z magazynu wektorów, agenta zapisywania w celu połączenia badań i informacji o produkcie w pomocny artykuł, oraz agent edytora, aby uściślić artykuł, który zostanie ostatecznie przedstawiony użytkownikowi.

Aby uzyskać dostęp do kodu źródłowego i przeczytać szczegółowe informacje o szablonie, zobacz repozytorium GitHub agent-openai-python-prompty .

Diagram architektury wielomodalnych aplikacji do pisania w języku Python.

Ten szablon demonstruje użycie tych funkcji.

Rozwiązanie do hostingu platformy Azure Technologie Modele AI
Rejestrowanie kontenera platformy Azure
Azure Kubernetes
Azure OpenAI
Wyszukiwanie w usłudze Bing
Tożsamość zarządzana na platformie Azure
Azure Monitor
Wyszukiwanie AI platformy Azure
Azure AI Studio
GPT 3.5 Turbo
GPT 4.0
DALL-E

Contoso Chat Retail Copilot z usługą AI Studio

Ten szablon jest rozwiązaniem do obsługi sprzedaży i obsługi technicznej klienta. Pokazano w nim, jak utworzyć aplikację modelu dużego języka (LLM) przy użyciu architektury RAG (pobieranie rozszerzonej generacji) przy użyciu programu Azure AI Studio i przepływu monitów.

Aby uzyskać dostęp do kodu źródłowego i przeczytać szczegółowe informacje o szablonie, zobacz repozytorium GitHub contoso-chat .

Zrzut ekranu przedstawiający aplikację do czatu z przepływem monitów w edytorze wizualnym dla aplikacji handlu detalicznego firmy Contoso.

Ten szablon demonstruje użycie tych funkcji.

Rozwiązanie do hostingu platformy Azure Technologie Modele AI
Azure Container Apps
Azure OpenAI
Wyszukiwanie AI platformy Azure
Azure AI Studio
Azure Cosmos DB
GPT 3.5 Turbo
GPT 4.0
Zarządzane środowisko Integration Runtime (MIR)

Automatyzacja procesów z zamianą mowy na tekst i podsumowywanie za pomocą programu AI Studio

Ten szablon jest rozwiązaniem automatyzacji procesów, które odbiera problemy zgłaszane przez pracowników terenowych i sklepowych w firmie o nazwie Contoso Manufacturing, firmie produkcyjnej, która produkuje baterie samochodowe. Problemy są współużytkowane przez pracowników za pośrednictwem danych wejściowych mikrofonu, wstępnie zarejestrowanych jako pliki audio lub jako dane wejściowe tekstu. Rozwiązanie tłumaczy dane wejściowe audio z mowy na tekst, a następnie używa raportów tekstowych jako danych wejściowych do llM i Prompty/Promptflow, aby podsumować problem i zwrócić wyniki w formacie określonym przez rozwiązanie.

Aby uzyskać dostęp do kodu źródłowego i przeczytać szczegółowe informacje o szablonie, zobacz repozytorium GitHub summarization-openai-python-prompflow .

Diagram architektury automatyzacji procesów z zamianą mowy na tekst i podsumowanie za pomocą programu AI Studio dla języka Python.

Ten szablon demonstruje użycie tych funkcji.

Rozwiązanie do hostingu platformy Azure Technologie Modele AI
Azure Container Apps Azure AI Studio
Usługa zamiany mowy na tekst
Przepływ monitu
Zarządzane środowisko Integration Runtime (MIR)
GPT 3.5 Turbo

Ten szablon jest aplikacją, która używa agenta wyszukiwania Prompty, Langchain i Elasticsearch do tworzenia agenta wyszukiwania dużego modelu językowego (LLM). Ten agent z technologią generacji rozszerzonej (RAG) może odpowiadać na pytania użytkowników na podstawie dostarczonych danych, integrując pobieranie informacji w czasie rzeczywistym z odpowiedziami generowania.

Aby uzyskać dostęp do kodu źródłowego i przeczytać szczegółowe informacje o szablonie, zobacz repozytorium GitHub agent-python-openai-prompty-langchain .

Diagram architektury aplikacji przy użyciu narzędzia Prompty, Langchain i Elasticsearch do utworzenia agenta wyszukiwania dużego modelu językowego (LLM) z funkcją wywołującą język Python.

Ten szablon demonstruje użycie tych funkcji.

Rozwiązanie do hostingu platformy Azure Technologie Modele AI
Machine Learning Service Azure AI Studio
Wyszukiwanie elastyczne
Microsoft Entra ID
Tożsamość zarządzana na platformie Azure
Azure Monitor
Azure Storage
Azure AI Studio
Zarządzane środowisko Integration Runtime (MIR)
GPT 3.5 Turbo

Wywoływanie funkcji za pomocą funkcji Prompty, LangChain i Pinecone

Ten szablon wykorzystuje nowe narzędzie Prompty, Langchain i Pinecone do tworzenia agenta wyszukiwania dużego modelu językowego (LLM). Ten agent z technologią generacji rozszerzonej (RAG) może odpowiadać na pytania użytkowników na podstawie dostarczonych danych, integrując pobieranie informacji w czasie rzeczywistym z odpowiedziami generowania.

Aby uzyskać dostęp do kodu źródłowego i przeczytać szczegółowe informacje o szablonie, zobacz repozytorium GitHub agent-openai-python-prompty-langchain-pinecone .

Diagram architektury aplikacji agenta OpenAI korzystający z narzędzi Prompty, Langchain i Pinecone z językiem Python.

Ten szablon demonstruje użycie tych funkcji.

Rozwiązanie do hostingu platformy Azure Technologie Modele AI
Azure Container Apps Pinecone
Microsoft Entra ID
Tożsamość zarządzana firmy Microsoft
Azure Monitor
Azure Storage
GPT 3.5 Turbo

Asystent interfejsu API Analytics Copilot z użyciem języka Python i programu Azure AI Studio

Ten szablon jest interfejsem API asystenta do rozmowy z danymi tabelarycznymi i przeprowadzania analizy w języku naturalnym. Aby uzyskać dostęp do kodu źródłowego i przeczytać szczegółowe informacje o szablonie, zobacz repozytorium GitHub assistant-data-openai-python-promptflow .

Diagram architektury interfejsu API asystenta do rozmowy z danymi tabelarycznymi i przeprowadzania analizy w języku naturalnym.

Ten szablon demonstruje użycie tych funkcji.

Rozwiązanie do hostingu platformy Azure Technologie Modele AI
Machine Learning Service Wyszukiwanie AI platformy Azure
Azure AI Studio
Zarządzane środowisko Integration Runtime (MIR)
Azure OpenAI
GPT 3.5 Turbo
GPT 4

Rozmowa z danymi przy użyciu usług Azure OpenAI i Azure AI Search za pomocą języka Java

Ten szablon to kompletne kompleksowe rozwiązanie, które demonstruje wzorzec generacji rozszerzonej (RAG) pobierania na platformie Azure. Używa ona usługi Azure AI Search do pobierania i dużych modeli językowych usługi Azure OpenAI, aby zapewnić obsługę środowisk typu ChatGPT i Q&A.

Aby rozpocząć pracę z tym szablonem, zobacz Wprowadzenie do czatu przy użyciu własnego przykładu danych dla języka Java. Aby uzyskać dostęp do kodu źródłowego i przeczytać szczegółowe informacje o szablonie, zobacz repozytorium GitHub azure-search-openai-demo-java .

Diagram przedstawiający architekturę z klienta do aplikacji zaplecza w języku Java.

Zrzut ekranu aplikacji do czatu w języku Java w przeglądarce przedstawiający kilka sugestii dotyczących wprowadzania danych wejściowych czatu i pola tekstowego czatu w celu wprowadzenia pytania.

Ten szablon demonstruje użycie tych funkcji.

Rozwiązanie do hostingu platformy Azure Technologie Modele AI
Azure App Service
Azure Container Apps
Azure Kubernetes Service
Azure OpenAI
Wyszukiwanie AI platformy Azure
Azure Storage
Azure Monitor

Rozmowa z danymi przy użyciu usług Azure OpenAI i Azure AI Search za pomocą języka JavaScript

Ten szablon to kompletne kompleksowe rozwiązanie demonstrujące wzorzec generacji rozszerzonej pobierania (RAG, Retrieval-Augmented Generation) uruchomiony na platformie Azure. Używa ona usługi Azure AI Search do pobierania i dużych modeli językowych usługi Azure OpenAI, aby zapewnić obsługę środowisk typu ChatGPT i Q&A.

Aby rozpocząć pracę z tym szablonem, zobacz Wprowadzenie do czatu przy użyciu własnego przykładu danych dla języka JavaScript. Aby uzyskać dostęp do kodu źródłowego i przeczytać szczegółowe informacje o szablonie, zobacz repozytorium GitHub azure-search-openai-javascript .

Diagram przedstawiający architekturę z klienta do aplikacji zaplecza.

Zrzut ekranu przedstawiający aplikację czatu w przeglądarce z kilkoma sugestiami dotyczącymi wprowadzania danych wejściowych na czacie i polem tekstowym czatu w celu wprowadzenia pytania.

Ten szablon demonstruje użycie tych funkcji.

Rozwiązanie do hostingu platformy Azure Technologie Modele AI
Azure Container Apps
Azure Static Web Apps
Azure OpenAI
Wyszukiwanie AI platformy Azure
Azure Storage
Azure Monitor
text-embedding-ada-002

Fronton czatu usługi Azure OpenAI

Ten szablon jest minimalnym składnikiem internetowym czatu OpenAI, który można podłączyć do dowolnej implementacji zaplecza jako klienta.

Aby uzyskać dostęp do kodu źródłowego i przeczytać szczegółowe informacje o szablonie, zobacz repozytorium GitHub azure-openai-chat-frontend .

Wideo przedstawiające aplikację frontonu czatu w języku JavaScript.

Ten szablon demonstruje użycie tych funkcji.

Rozwiązanie do hostingu platformy Azure Technologie Modele AI
Azure Static Web Apps Wyszukiwanie AI platformy Azure
Azure OpenAI
GPT 3.5 Turbo
GPT4

Bezserwerowy czat sztucznej inteligencji z narzędziem RAG przy użyciu LangChain.js

Szablon to bezserwerowy czatbot sztucznej inteligencji z rozszerzoną generacją pobierania przy użyciu LangChain.js i platformy Azure, który używa zestawu dokumentów przedsiębiorstwa do generowania odpowiedzi na zapytania użytkowników. Używa fikcyjnej firmy o nazwie Contoso Real Estate, a środowisko pozwala swoim klientom zadawać pytania dotyczące użycia swoich produktów. Przykładowe dane zawierają zestaw dokumentów opisujących warunki świadczenia usługi, zasady ochrony prywatności i przewodnik pomocy technicznej.

Aby dowiedzieć się, jak wdrożyć i uruchomić ten szablon, zobacz Wprowadzenie do bezserwerowego czatu sztucznej inteligencji z narzędziem RAG przy użyciu LangChain.js. Aby uzyskać dostęp do kodu źródłowego i przeczytać szczegółowe informacje o szablonie, zobacz repozytorium GitHub serverless-chat-langchainjs .

Dowiedz się, jak wdrożyć i uruchomić ten szablon referencyjny języka JavaScript.

Diagram przedstawiający architekturę bezserwerowego interfejsu API przy użyciu biblioteki LangChainjs do integracji z usługą Azure OpenAI Service i usługą Azure AI Search.

Wideo z przeglądarką przedstawiające aplikację do czatu w języku JavaScript przy użyciu narzędzi RAG i Langchain.js

Ten szablon demonstruje użycie tych funkcji.

Rozwiązanie do hostingu platformy Azure Technologie Modele AI
Azure Static Web Apps
Azure Functions
Wyszukiwanie AI platformy Azure
Azure OpenAI
Azure Cosmos DB
Azure Storage
Tożsamość zarządzana na platformie Azure
GPT4
Mistral
Ollama