DifyをAWS上に構築するワークショップをやってみた(3.エージェントの開発編)
こんにちは、洲崎です。
生成 AI アプリケーションをノーコードで構築できるツールである Dify をAWS上に立ち上げるワークショップがあったのでやってみました。
ボリュームがあるので、4部に分けて紹介します。
1部:Difyのデプロイ、初期設定、シンプルなチャットボットの構築
2部:RAG チャットボットの構築
3部:エージェントの開発 ←今回はこちら
4部:ワークフローの開発
実際に行うワークショップはこちらです。
エージェントとは
ワークショップを行う前に、生成AIにおける「エージェント」について、簡単に触れておきます。
エージェントとは、生成AIの能力を活用して自律的にタスクを実行する機能のことを指します。
エージェントは与えられたタスクに対して「思考」し、適切な行動を取ります。
例えば、「予算10万円で国内旅行プランを立てて予約してください」というリクエストに対し、エージェントは以下のように対応します。
1.ユーザーの日程や好みをヒアリング
2.旅行サイトを検索し、最適な宿泊先を提案
3.詳細な旅行プランを作成
4.ユーザーの承認後、実際に予約を実行
このように、エージェントは個人専属のアシスタントのような働きを行います。
その上で生成AIの活用を簡単に整理すると、以下の3つに分けられます。
LLMのみ:大規模な学習データをもとに自然言語で回答を生成
LLM + RAG:特定のデータソースを検索し、その結果を元に回答を生成
LLM + エージェント:タスクを与えられると、AIが自ら思考し実行
エージェントは、この中で最も高度で柔軟な対応が見込まれます。
Difyのエージェント開発
Difyではエージェントに利用するツールとして、さまざまなものがすでにビルドインされています。
本ワークショップでは「Web検索ツールを用いて、ユーザーの代わりにWeb検索した結果をまとめて教えてくれるリサーチエージェント」を体験することができます。
やってみる
では、早速Difyでエージェントの構築をやってみます。
ツールの確認
Difyで利用できるツールは、「ツール画面」から確認できます。
DuckDuckGoをクリックすると、詳細を確認できます。
Googleのツールもありますが、APIキーを払い出して、Difyに設定する必要があります。
そのため、今回は簡単に試せるDuckDuckGoでやってみます。
エージェントの開発
スタジオ画面に遷移し、「最初から作成」をクリックします。
「エージェント」を選んで、名前をつけて、「作成する」をクリックします。
エージェントの編集画面に遷移します。
右上のLLMのモデルが「Claude 3 Haiku」になっていることを確認します。
「ツール」にある「追加」をクリックします。
Web検索ツールのDuckDuckGo Searchを追加します。
エージェントの指示として、オーケストレーションの下にある「手順」に以下の内容を入力します。
「あなたはリサーチエージェントです。
ユーザーから質問を受け取ったら、duckduck go を使って調べ物をして回答してください。」
ツールの下にある「機能を追加」から、「会話の開始」を有効にします。
以下のように、選択肢を追加します。
自由入力でも、選択肢からクリックでも利用できます。
これで、設定完了です。
試しに、「Amazonとは」をクリックすると、DuckDuckGoのサーチを利用して、Amazonについて回答してくれました。
エージェントログをクリックすることで、ログの詳細を見ることができます。
トレースを見ると、どのように考えて行動したのかを確認することができます。
「DuckDuckGo Search」を見ると、正しく検索を実行できている確認がとれました。
最後に
Difyのエージェント機能を触ってみました。
生成AIの界隈では、「2025年はエージェントの年」などと言われていますが、実際にエージェントでどういうことができるかは最新の情報を収集しながら触って確かめていきたいと思います。
次回はいよいよDifyの注目機能、ワークフローを試してみます。