Uruchamianie agentów

Abstrakcja agenta podstawowego uwidacznia różne opcje uruchamiania agenta. Osoby wywołujące mogą wybrać opcję dostarczania zera, jednego lub wielu komunikatów wejściowych. Osoby wywołujące mogą również wybierać między przesyłaniem strumieniowym i bez przesyłania strumieniowego. Przyjrzyjmy się różnym scenariuszom użycia.

Przesyłanie strumieniowe i nie przesyłane strumieniowo

Program Microsoft Agent Framework obsługuje metody przesyłania strumieniowego i nieprzesyłania strumieniowego na potrzeby uruchamiania agenta.

W przypadku braku przesyłania strumieniowego RunAsync użyj metody .

Console.WriteLine(await agent.RunAsync("What is the weather like in Amsterdam?"));

W przypadku przesyłania strumieniowego RunStreamingAsync użyj metody .

await foreach (var update in agent.RunStreamingAsync("What is the weather like in Amsterdam?"))
{
    Console.Write(update);
}

W przypadku braku przesyłania strumieniowego run użyj metody .

result = await agent.run("What is the weather like in Amsterdam?")
print(result.text)

W przypadku przesyłania strumieniowego run_stream użyj metody .

async for update in agent.run_stream("What is the weather like in Amsterdam?"):
    if update.text:
        print(update.text, end="", flush=True)

Opcje uruchamiania agenta

Abstrakcja agenta podstawowego umożliwia przekazywanie obiektu opcji dla każdego uruchomienia agenta, jednak możliwość dostosowania przebiegu na poziomie abstrakcji jest dość ograniczona. Agenci mogą się znacznie różnić i dlatego nie ma naprawdę typowych opcji dostosowywania.

W przypadku, gdy obiekt wywołujący zna typ agenta, z którym pracują, można przekazać określone opcje typu w celu umożliwienia dostosowywania przebiegu.

Na przykład agent jest elementem ChatClientAgent i można przekazać ChatClientAgentRunOptions obiekt, który dziedziczy z AgentRunOptionselementu . Dzięki temu obiekt wywołujący może udostępnić niestandardowe ChatOptions , które są scalane z dowolnymi opcjami na poziomie agenta przed przekazaniem do IChatClient elementu, na który ChatClientAgent jest oparty.

var chatOptions = new ChatOptions() { Tools = [AIFunctionFactory.Create(GetWeather)] };
Console.WriteLine(await agent.RunAsync("What is the weather like in Amsterdam?", options: new ChatClientAgentRunOptions(chatOptions)));

Agenci języka Python obsługują dostosowywanie każdego przebiegu za pomocą parametru options . Opcje są przekazywane jako TypedDict i można je ustawiać w czasie budowy (za pośrednictwem ) i na przebieg (za pośrednictwem default_options).options Każdy dostawca ma własną klasę TypedDict, która zapewnia pełne autouzupełnianie środowiska IDE i sprawdzanie typów pod kątem ustawień specyficznych dla dostawcy.

Dostępne są typowe opcje:

max_tokens: Maksymalna liczba tokenów do wygenerowania
temperature: Kontroluje losowość w generowaniu odpowiedzi
model_id: zastąpić model dla tego konkretnego przebiegu
top_p: Parametr próbkowania jądra
response_format: Określ format odpowiedzi (np. dane wyjściowe ze strukturą)

Uwaga / Notatka

Parametry tools i instructions pozostają jako argumenty słów kluczowych bezpośrednich i nie są przekazywane za pośrednictwem słownika options .

from agent_framework.openai import OpenAIChatClient, OpenAIChatOptions

# Set default options at construction time
agent = OpenAIChatClient().as_agent(
    instructions="You are a helpful assistant",
    default_options={
        "temperature": 0.7,
        "max_tokens": 500
    }
)

# Run with custom options (overrides defaults)
# OpenAIChatOptions provides IDE autocomplete for all OpenAI-specific settings
options: OpenAIChatOptions = {
    "temperature": 0.3,
    "max_tokens": 150,
    "model_id": "gpt-4o",
    "presence_penalty": 0.5,
    "frequency_penalty": 0.3
}

result = await agent.run(
    "What is the weather like in Amsterdam?",
    options=options
)

# Streaming with custom options
async for update in agent.run_stream(
    "Tell me a detailed weather forecast",
    options={"temperature": 0.7, "top_p": 0.9},
    tools=[additional_weather_tool]  # tools is still a keyword argument
):
    if update.text:
        print(update.text, end="", flush=True)

Każdy dostawca ma własną klasę TypedDict (np. OpenAIChatOptions, AnthropicChatOptions, ), OllamaChatOptionsktóra uwidacznia pełny zestaw opcji obsługiwanych przez tego dostawcę.

Po podaniu opcji zarówno, default_options jak i dla każdego uruchomienia options mają pierwszeństwo i są scalane z wartościami domyślnymi.

Typy odpowiedzi

Zarówno odpowiedzi przesyłane strumieniowo, jak i nie przesyłane strumieniowo z agentów zawierają całą zawartość utworzoną przez agenta. Zawartość może zawierać dane, które nie są wynikiem (czyli odpowiedzią na pytanie użytkownika) od agenta. Przykłady innych zwracanych danych obejmują wywołania narzędzi funkcji, wyniki wywołań narzędzi funkcji, tekst rozumowania, aktualizacje stanu i wiele innych.

Ponieważ nie zwracana jest cała zwracana zawartość, ważne jest, aby wyszukać określone typy zawartości podczas próby odizolowania wyniku od innej zawartości.

Aby wyodrębnić wynik tekstu z odpowiedzi, wszystkie TextContent elementy ze wszystkich ChatMessages elementów muszą zostać zagregowane. Aby uprościć ten proces, Text właściwość jest dostępna we wszystkich typach odpowiedzi, które agregują wszystkie TextContenttypy odpowiedzi .

W przypadku przypadku braku przesyłania strumieniowego wszystko jest zwracane w jednym AgentResponse obiekcie. AgentResponse umożliwia dostęp do wygenerowanych komunikatów za pośrednictwem Messages właściwości .

var response = await agent.RunAsync("What is the weather like in Amsterdam?");
Console.WriteLine(response.Text);
Console.WriteLine(response.Messages.Count);

W przypadku przypadku AgentResponseUpdate przesyłania strumieniowego obiekty są przesyłane strumieniowo w miarę ich tworzenia. Każda aktualizacja może zawierać część wyniku agenta, a także różne inne elementy zawartości. Podobnie jak w przypadku braku przesyłania strumieniowego, można użyć Text właściwości , aby pobrać część wyniku zawartego w aktualizacji i przejść do szczegółów za pośrednictwem Contents właściwości .

await foreach (var update in agent.RunStreamingAsync("What is the weather like in Amsterdam?"))
{
    Console.WriteLine(update.Text);
    Console.WriteLine(update.Contents.Count);
}

Aby wyodrębnić wynik tekstu z odpowiedzi, wszystkie TextContent elementy ze wszystkich ChatMessage elementów muszą zostać zagregowane. Aby uprościć ten proces, Text właściwość jest dostępna we wszystkich typach odpowiedzi, które agregują wszystkie TextContenttypy odpowiedzi .

response = await agent.run("What is the weather like in Amsterdam?")
print(response.text)
print(len(response.messages))

# Access individual messages
for message in response.messages:
    print(f"Role: {message.role}, Text: {message.text}")

W przypadku przypadku AgentResponseUpdate przesyłania strumieniowego obiekty są przesyłane strumieniowo w miarę ich tworzenia. Każda aktualizacja może zawierać część wyniku agenta, a także różne inne elementy zawartości. Podobnie jak w przypadku braku przesyłania strumieniowego, można użyć text właściwości , aby pobrać część wyniku zawartego w aktualizacji i przejść do szczegółów za pośrednictwem contents właściwości .

async for update in agent.run_stream("What is the weather like in Amsterdam?"):
    print(f"Update text: {update.text}")
    print(f"Content count: {len(update.contents)}")

    # Access individual content items
    for content in update.contents:
        if hasattr(content, 'text'):
            print(f"Content: {content.text}")

Typy komunikatów

Dane wejściowe i wyjściowe z agentów są reprezentowane jako komunikaty. Wiadomości są podzielone na elementy zawartości.

Program Microsoft Agent Framework używa typów komunikatów i zawartości udostępnianych przez Microsoft.Extensions.AI abstrakcje. Komunikaty są reprezentowane przez klasę ChatMessage , a wszystkie klasy zawartości dziedziczą z klasy bazowej AIContent .

Istnieją różne AIContent podklasy, które są używane do reprezentowania różnych typów zawartości. Niektóre są udostępniane jako część abstrakcji podstawowych Microsoft.Extensions.AI , ale dostawcy mogą również dodawać własne typy, w razie potrzeby.

Oto kilka popularnych typów:Microsoft.Extensions.AI

Typ	Description
TextContent	Zawartość tekstowa, która może być zarówno danymi wejściowymi, jak i danymi wyjściowymi z agenta, na przykład z poziomu użytkownika lub dewelopera. Zazwyczaj zawiera wynik tekstowy agenta.
DataContent	Zawartość binarna, która może być zarówno danymi wejściowymi, jak i wyjściowymi. Może służyć do przekazywania danych obrazu, audio lub wideo do i z agenta (gdzie jest obsługiwana).
UriContent	Adres URL, który zazwyczaj wskazuje hostowaną zawartość, taką jak obraz, dźwięk lub wideo.
FunctionCallContent	Żądanie przez usługę wnioskowania w celu wywołania narzędzia funkcji.
FunctionResultContent	Wynik wywołania narzędzia funkcji.

Struktura agenta języka Python używa typów komunikatów i zawartości z agent_framework pakietu. Komunikaty są reprezentowane przez klasę ChatMessage , a wszystkie klasy zawartości dziedziczą z klasy bazowej BaseContent .

Istnieją różne BaseContent podklasy, które są używane do reprezentowania różnych typów zawartości:

Typ	Description
`TextContent`	Zawartość tekstowa, która może być zarówno danymi wejściowymi, jak i wyjściowymi agenta. Zazwyczaj zawiera wynik tekstowy agenta.
`DataContent`	Zawartość binarna reprezentowana jako identyfikator URI danych (na przykład obrazy zakodowane w formacie base64). Może służyć do przekazywania danych binarnych do i z agenta.
`UriContent`	Identyfikator URI wskazujący hostowaną zawartość, taką jak obraz, plik audio lub dokument.
`FunctionCallContent`	Żądanie przez usługę sztucznej inteligencji w celu wywołania narzędzia funkcji.
`FunctionResultContent`	Wynik wywołania narzędzia funkcji.
`ErrorContent`	Informacje o błędzie podczas przetwarzania kończą się niepowodzeniem.
`UsageContent`	Informacje o użyciu tokenu i rozliczeniach z usługi sztucznej inteligencji.

Oto jak pracować z różnymi typami zawartości:

from agent_framework import ChatMessage, TextContent, DataContent, UriContent

# Create a text message
text_message = ChatMessage(role="user", text="Hello!")

# Create a message with multiple content types
image_data = b"..."  # your image bytes
mixed_message = ChatMessage(
    role="user",
    contents=[
        TextContent("Analyze this image:"),
        DataContent(data=image_data, media_type="image/png"),
    ]
)

# Access content from responses
response = await agent.run("Describe the image")
for message in response.messages:
    for content in message.contents:
        if isinstance(content, TextContent):
            print(f"Text: {content.text}")
        elif isinstance(content, DataContent):
            print(f"Data URI: {content.uri}")
        elif isinstance(content, UriContent):
            print(f"External URI: {content.uri}")

Dalsze kroki

Konwersacje obejmujące wiele kolei

Sprzężenie zwrotne

Czy ta strona była pomocna?

Last updated on 2026-01-15