Microsoft Project Bonsaiを使用したAIエージェントのトレーニング

AnyLogicは、Microsoftと協力して、Project Bonsaiの深層強化学習および機械教育機能をAnyLogicビジネスシミュレーションモデルに接続することができる、コネクタを開発しました。ビジネス指向のシミュレーションモデルにおけるこの革新的で斬新な使用法は、最先端の適応制御と深層強化学習を実際の製造や運用モデルにもたらします。ビジネスアナリストとエンジニアは、データサイエンティストと同等に、高度な人工知能を利用できるようになりました。


強化学習は、AIエージェントが制御ポリシーを学習して、システムの特定の状態に対して可能な限り最良のアクションを常に選択するマルコフ決定過程としてのフレーミング問題の概念に基づいています。理想的には、このシステムはややランダムで動的であり、報酬ベースの学習アプローチを他の従来の制御理論と比較して優れたものにします。

Project Bonsai を使用すると、AIのバックグラウンドがない場合でも、対象分野の専門家が専門知識をAIモデルに直接組み込み、実際のビジネス上の問題を解決する方法を教えることができます。機械教育と深層強化学習を組み合わせることで、企業は実際のシステムを最適化および自動化するのに十分強力なAIモデルを構築できます。

AnyLogicは、企業向けのシミュレーションモデリングのマーケットリーダーとして、複数のドメインの業界リーダーにおいて、複雑な問題をシミュレーションするためのツールとして使用されています。Project Bonsaiの深層強化学習と機械教育機能の追加により、適応制御ポリシーを対象とした新しいタイプのシミュレーションベースのソリューションを提供します。

PROJECT BONSAI プラットフォームプレビュー

以下のワークフローは、AnyLogic 8.7でアップデートされた内容を反映するように更新されており、 AnyLogic 8.7の強化学習実験に関する情報を追加しています。詳細については、AnyLogic Helpを参照してください。以下の古いワークフローは引き続き機能します。

簡単に接続できるProject Bonsaiラッパーモデル

シミュレーションモデルの学習環境(Bonsaiの“シミュレーター”)への変換を簡素化するために、提供されているラッパーモデル(すべての接続要件が組み込まれているカスタマイズされたAnyLogicモデル)を使用できます。ルートエージェントをラッパーにドラッグアンドドロップするだけで、通常のAnyLogicモデルをBonsai対応のシミュレーターに簡単に変換できます。

ラッパーモデルは、Bonsaiプラットフォームとの接続を確立し、強化学習に必要なインターフェイス(各エピソードステップの観察とアクションスペース)を追加するのに役立ちます。Bonsai対応シミュレーターの準備に必要な手順を説明するラッパーとそのユーザーガイドは、以下のリンクからダウンロードできます。


ラッパーとユーザーガイド
AnyLogic Bonsaiプラットフォームワークフロー

ウェビナー: AnyLogicとMicrosoft Project Bonsaiを使用した深層強化学習

Microsoft Project Bonsaiを使用すると、AIのバックグラウンドがない場合でも、対象分野の専門家が専門知識を活用してAIエージェントを教育し、実際のビジネス上の問題を解決できます。これは、Project BonsaiとAnyLogicシミュレーションを一緒に使用するための主要な概念とワークフローを紹介するウェビナーです。

ウェビナーは、AnyLogicとMicrosoftが協力して、ビジネスアプリケーションに深層強化学習と機械教育をもたらします。Microsoft Project Bonsaiチームの主要プログラムマネージャーであるDavid CoeとAnyLogic AI Program LeadであるArash Mahdaviが、シミュレーションを使用してAIエージェントをトレーニングし、シミュレーションにAI制御を実装するためのエンドツーエンドのワークフローを示します。

モデルのサンプル


以下の例は、Bonsaiプラットフォームで学習環境(シミュレーター)として使用するためにリファクタリングされた2つのAnyLogicサンプルモデルです。それらはすでにラッパーに組み込まれており、トレーニングに使用する準備ができています。以下のリンクからこれらのモデルにアクセスできます。包括的なドキュメントは、関連するREADME.mdファイルでも提供されています。

  • 01

    活動基準原価計算分析(Activity Based Costing Analysis)

    活動基準原価計算分析(Activity Based Costing Analysis(ABCA))モデル
    製品処理に関連するコストが活動基準原価計算(Activity-Based Costing(ABC))を使用して計算および分析される、単純な工場フロアモデル。入ってくる各製品は、いくつかのリソースを取得し、機械によって処理され、伝達され、後でリソースを解放します。製品によって蓄積されたコストは、分析と最適化のためにいくつかのカテゴリに分類されます。目標は、高い全体的なスループットを維持しながら、製品あたりのコストを削減することです。

  • 02

    製品配送

    製品配送モデル
    サプライチェーンには、2〜10日ごとにランダムな量の製品を注文する3つの製造施設と15の販売業者が含まれます。販売業者から注文を受け取ると、各製造施設は、注文を満たすのに十分な製品が作成されるまで待機し(現在の在庫に十分な数がない場合)、注文を満たすために積載されたトラックを送ります。目標は、平均納期を最小限に抑えながら、製品あたりのコストを最小限に抑える最適なポリシーを見つけることです。これは、各センターの生産率とトラックの数に加えて、どのセンターを開くかを変えることによって行われます。

AIのトレーニングとテストのためのシミュレーションーメールパック

AnyLogicシミュレーションは、ビジネスにおけるAIのトレーニングおよびテストプラットフォームです。AnyLogicの汎用シミュレーションを使用すると、AIモデルをトレーニングおよびテストするための詳細で堅牢な仮想環境を構築できます。独自のマルチメソッドシミュレーション機能は、機械学習で使用するための包括的なツールを提供します。多数の業界で使用されているこのオープンAPIを備えたクラウド対応のプラットフォームは、今日のAI開発を強化および加速しています。この強力な機械学習ツールの詳細については、AIメールパックとホワイトペーパーを是非ご覧ください!

AIパックとホワイトペーパー