プロンプトフローと GitHub を使用する LLMOps

[アーティクル]
01/02/2024

大規模な言語運用 (LLMOps) は、効率的なプロンプトエンジニアリングと LLM を取り入れたアプリケーションの開発とデプロイの基礎となっています。 LLM を取り入れたアプリケーションの需要が高まり続ける中、組織はエンドツーエンドのライフサイクルを管理するためのまとまりのある合理化されたプロセスを必要としています。

Azure Machine Learning を使用すると、GitHub と統合して、LLM を取り入れたアプリケーションの開発ライフサイクルをプロンプトフローで自動化できます。

Azure Machine Learning Prompt Flow は、LLM を組み込んだアプリケーションを開発するための合理化され、構造化されたアプローチを提供します。その明確に定義されたプロセスとライフサイクルは、フローの構築、テスト、最適化、デプロイのプロセスを案内し、完全に機能する LLM を融合したソリューションの作成に結び付けます。

LLMOps プロンプトフローの機能

プロンプトフロー付き LLMOps は、プロンプトフローを使用して LLM を取り入れたアプリをビルドするのに役立つ "LLMOps テンプレートとガイダンス" です。また、以下のような特徴があります。

一元化されたコードホスティング: このリポジトリは、プロンプトフローに基づいて複数のフローのホスティングコードをサポートし、すべてのフローに 1 つのリポジトリを提供します。このプラットフォームは、すべてのプロンプトフローコードが存在する単一のリポジトリと見なされます。フローのライブラリのようなもので、さまざまなプロジェクトで簡単に検索、アクセス、コラボレーションを行うことができます。
ライフサイクル管理: 各フローは独自のライフサイクルを利用し、ローカルの実験から運用環境へのデプロイへのスムーズな移行を可能にします。
バリアントとハイパーパラメーターの実験: 複数のバリアントとハイパーパラメーターで実験し、フローバリアントを簡単に評価します。バリアントとハイパーパラメーターは、レシピの成分のようなものです。このプラットフォームを使用すると、フロー内の複数のノード間で異なるバリアントの組み合わせを実権することができます。
複数のデプロイターゲット: リポジトリでは、構成によって実行される Azure App Services、Kubernetes、Azure マネージドコンピューティングへのフローのデプロイをサポートし、必要に応じてフローをスケーリングできるようにします。また、Docker をサポートする任意のターゲットプラットフォームとオペレーティングシステムにデプロイするためのフローランタイムおよびフローを取り入れた Docker イメージが生成されます。
A/B デプロイ: A/B デプロイをシームレスに実装し、さまざまなフローバージョンを簡単に比較できます。 Web サイトの従来の A/B テストと同様に、このプラットフォームにより、プロンプトフローの A/B デプロイが容易になります。つまり、実際の設定でフローのさまざまなバージョンを簡単に比較して、最適なパフォーマンスを判断できます。
多対多データセット/フローリレーションシップ: 標準フローと評価フローのそれぞに対して複数のデータセットに対応し、フローテストと評価の多様性を確保します。プラットフォームは、フローごとに複数のデータセットに対応するように設計されています。
条件付きデータとモデルの登録: プラットフォームでは、Azure Machine Learning データ資産のデータセットの新しいバージョンおよびモデルレジストリ内のフローを、変更がある場合にのみ作成します。それ以外の場合は作成されません。
包括的なレポート: バリアント構成ごとに詳細なレポートを生成し、情報に基づいて意思決定できるようにします。すべての実行と実験に関する詳細なメトリック収集、実験、およびバリアント一括実行を可能にし、CSV および HTML ファイルでデータドリブンの意思決定をできるようにします。

カスタマイズのその他の機能:

BYOF (bring-your-own-flows) を提供します。 LLM を取り入れたアプリケーションに関連する複数のユースケースを開発するための完全なプラットフォーム。
構成ベースの開発を提供します。広範なボイラープレートコードを記述する必要はありません。
プロンプトの実験と評価の両方をローカルとクラウド上で実行できます。
プロンプトのローカル評価用のノートブックを提供します。ローカル実験用の関数のライブラリを提供します。
デプロイ後のパイプライン内でのエンドポイントテストで、その可用性と対応性を確認します。
デプロイ前にプロンプトメトリックを検証するオプションの Human-in-loop を提供します。

プロンプトフロー付き LLMOps には、単純なアプリと複雑な LLM を取り入れたアプリの両方の機能が用意されています。アプリケーションのニーズに合わせて完全にカスタマイズできます。

LLMOps ステージ

ライフサイクルは、次の 4 つの異なるステージで構成されます:

初期化: ビジネスの目標を明確に定義し、関連するデータサンプルを収集し、基本的なプロンプト構造を確立し、その機能を強化するフローを作成します。
実験: フローをサンプルデータに適用し、プロンプトのパフォーマンスを評価し、必要に応じてフローを調整します。結果に満足するまで、継続的に反復処理します。
評価と改善: より大きなデータセットを使用するフローのパフォーマンスのベンチマークを測定し、プロンプトの有効性を評価し、それに応じた改善を行います。結果が目的の基準を満たしている場合は、次のステージに進みます。
デプロイ: 効率と有効性のためにフローを最適化し、A/B デプロイを含む運用環境にデプロイし、パフォーマンスを監視し、ユーザーフィードバックを収集し、この情報を使用してフローをさらに強化します。

この構造化された手法に従うことで、プロンプトフローを使用すると、フローを自信を持って開発、厳密なテスト、微調整、デプロイを行い、堅牢で洗練された AI アプリケーションを作成できます。

LLMOps プロンプトフローテンプレートは、コード優先アプローチを使用してこの構造化手法を形式化し、プロンプトフローに関連するツールとプロセスを使用して、プロンプトフローを使用して LLM を組み込んだアプリを構築するのに役立ちます。一元化されたコードホスティング、ライフサイクル管理、バリアントとハイパーパラメーターの実験、A/B 展開、すべての実行と実験のレポートなど、さまざまな機能が提供されます。

この記事のリポジトリは、プロンプトフローテンプレートを使用した LLMOps で入手できます

LLMOps プロセスフロー

これは初期化ステージです。ここでは、フローが開発され、データが準備、キュレーションされ、LLMOps 関連の構成ファイルが更新されます。
Visual Studio Code とプロンプトフロー拡張機能を使用したローカル開発の後、機能ブランチから開発ブランチにプル要求が発生します。これにより、ビルド検証パイプラインが実行されます。また、実験フローも実行します。
PR は手動で承認され、コードは開発ブランチにマージされます
PR が開発ブランチにマージされると、開発環境の CI パイプラインが実行されます。実験フローと評価フローの両方を順番に実行し、パイプラインの他のステップとは別に、Azure Machine Learning レジストリにフローを登録します。
CI パイプラインの実行が完了すると、CD トリガーによって、Azure Machine Learning レジストリからの標準フローを Azure Machine Learning オンラインエンドポイントとしてデプロイし、デプロイされたフローで統合とスモークテストを実行する CD パイプラインの実行が保証されます。
リリースブランチが開発ブランチから作成されるか、開発ブランチからリリースブランチに PR が発生します。
PR は手動で承認され、コードはリリースブランチにマージされます。 PR がリリースブランチにマージされると、prod 環境の CI パイプラインが実行されます。実験フローと評価フローの両方を順番に実行し、パイプラインの他のステップとは別に、Azure Machine Learning レジストリにフローを登録します。
CI パイプラインの実行が完了すると、CD トリガーによって、Azure Machine Learning レジストリからの標準フローを Azure Machine Learning オンラインエンドポイントとしてデプロイし、デプロイされたフローで統合とスモークテストを実行する CD パイプラインの実行が保証されます。

これ以降は、エンドツーエンドのサンプルに従って、プロンプトフロー付き LLMOps について説明します。これにより、プロンプトフローと GitHub を使用して LLM を取り入れたアプリケーションをビルドできるようになります。その主な目的は、プロンプトフローと LLMOps の機能を活用して、このようなアプリケーションの開発を支援することです。

ヒント

LLMOps とプロンプトフローの統合方法を理解しておくことをお勧めします。

重要

プロンプトフローは、現在パブリックプレビュー段階です。このプレビュー版はサービスレベルアグリーメントなしで提供されています。運用環境のワークロードに使うことはお勧めできません。特定の機能はサポート対象ではなく、機能が制限されることがあります。詳しくは、Microsoft Azure プレビューの追加使用条件に関するページをご覧ください。

前提条件

Azure サブスクリプション。 Azure サブスクリプションをお持ちでない場合は、開始する前に無料アカウントを作成してください。無料版または有料版の Azure Machine Learning をお試しください。
Azure Machine Learning ワークスペース。
ローカルコンピューターで実行されている Git。
ソース管理リポジトリとしての GitHub。

Note

Git バージョン 2.27 以降が必要です。 Git コマンドのインストールについて詳しくは、https://git-scm.com/downloads でお使いのオペレーティングシステムを選んでください

重要

この記事の CLI コマンドは、Bash を使ってテストされました。異なるシェルを使うと、エラーが発生する可能性があります。

プロンプトフローを設定する

プロンプトフローでは、接続リソースを使用して Azure OpenAI、OpenAI、Azure AI Search などのエンドポイントに接続し、フローの実行にランタイムを使用します。これらのリソースは、プロンプトフローでフローを実行する前に作成する必要があります。

プロンプトフローの接続を設定する

接続は、プロンプトフローポータル UI または REST API を使用して作成できます。プロンプトフロー用の接続を作成するには、ガイドラインに従ってください。

接続の詳細については、リンクをクリックしてください。

Note

サンプルフローでは "aoai" 接続が使用され、"aoai" という名前の接続を作成して実行されるはずです。

プロンプトフローのコンピューティングとランタイムを設定する

ランタイムは、プロンプトフローポータル UI または REST API を使用して作成できます。プロンプトフロー用のコンピューティングとランタイムを設定するには、ガイドラインに従ってください。

ランタイムの詳細については、リンクをクリックしてください。

Note

後で説明する LLMOps_config.json ファイルでも、同じランタイム名を使用する必要があります。

GitHub リポジトリを設定する

GitHub リポジトリを使用して LLMOps プロセスを設定するために、複数の手順を実行する必要があります。

リポジトリをフォークして構成する

フォークしたリポジトリを GitHub 組織で作成するには、ガイドラインに従ってください。このリポジトリでは、2 つのブランチ (main と development) を使用します。また、コードの昇格とパイプラインの実行には、コードに対する変更の代わりに使用されます。

GitHub と Azure の間で認証を設定する

前に作成したサービスプリンシパルを使用し、GitHub リポジトリと Azure サービスの間で認証を設定するには、ガイドラインに従ってください。

この手順では、サービスプリンシパル情報を格納する GitHub シークレットを構成します。リポジトリのワークフローでは、シークレット名を利用して接続情報を読み取ることができます。これは、Azure に自動的に接続するように GitHub ワークフローステップを構成するのに役立ちます。

リポジトリを複製する

新しいローカルリポジトリを作成するには、ガイドラインに従ってください。

これは、開発ブランチから新しい機能ブランチを作成し、変更を組み込むのに役立ちます。

パイプラインをテストする

パイプラインをテストするには、ガイドラインに従ってください。以下の手順を実行します。

機能ブランチから開発ブランチに PR (pull request) を出します。
PR パイプラインは、ブランチポリシー構成の結果として自動的に実行されます。
その後、PR が開発ブランチにマージされます。
関連付けられている 'dev' パイプラインが実行されます。これにより、完全な CI と CD が実行され、既存の Azure Machine Learning エンドポイントがプロビジョニングされるか、更新されます。

テスト出力は、こちらに示されているものと同様になるはずです。

ローカル実行

ローカル実行の機能を利用するには、次のインストール手順に従ってください:

リポジトリを複製する: 最初に、その GitHub リポジトリからテンプレートのリポジトリを複製します。

git clone https://github.com/microsoft/llmops-promptflow-template.git

env ファイルを設定する: 最上位のフォルダーレベルで .env ファイルを作成し、記載されている項目の情報を提供します。接続名を必要な数だけ追加します。このリポジトリのフロー例ではすべて、aoai という名前の AzureOpenAI 接続が使用されています。 api_key と api_base に対して、値を更新した行 aoai={"api_key": "","api_base": "","api_type": "azure","api_version": "2023-03-15-preview"} を追加します。名前が異なる追加の接続がフローで使用される場合、適宜追加してください。現在のところ、プロバイダーとしての AzureOpenAI によるフローがサポートされています。


experiment_name=
connection_name_1={ "api_key": "","api_base": "","api_type": "azure","api_version": "2023-03-15-preview"}
connection_name_2={ "api_key": "","api_base": "","api_type": "azure","api_version": "2023-03-15-preview"}

依存関係をインストールするために、ローカルの conda または仮想環境を準備します。


python -m pip install promptflow promptflow-tools promptflow-sdk jinja2 promptflow[azure] openai promptflow-sdk[builtins] python-dotenv

こちらのドキュメントに基づいて、フローをテンプレートに取り込みます (書き込みます)。
local_execution フォルダーで提供されている例に似た python スクリプトを記述してください。

Share via

プロンプトフローと GitHub を使用する LLMOps

LLMOps プロンプトフローの機能

LLMOps ステージ

LLMOps プロセスフロー

前提条件

プロンプトフローを設定する

プロンプトフローの接続を設定する

プロンプトフローのコンピューティングとランタイムを設定する

GitHub リポジトリを設定する

リポジトリをフォークして構成する

GitHub と Azure の間で認証を設定する

リポジトリを複製する

パイプラインをテストする

ローカル実行

次のステップ

その他のリソース

Share via

プロンプト フローと GitHub を使用する LLMOps

LLMOps プロンプト フローの機能

LLMOps ステージ

LLMOps プロセス フロー

前提条件

プロンプト フローを設定する

プロンプト フローの接続を設定する

プロンプト フローのコンピューティングとランタイムを設定する

GitHub リポジトリを設定する

リポジトリをフォークして構成する

GitHub と Azure の間で認証を設定する

リポジトリを複製する

パイプラインをテストする

ローカル実行

次のステップ

その他のリソース

プロンプトフローと GitHub を使用する LLMOps

LLMOps プロンプトフローの機能

LLMOps プロセスフロー

プロンプトフローを設定する

プロンプトフローの接続を設定する

プロンプトフローのコンピューティングとランタイムを設定する