AIエージェントはAIと機械学習の便利なアプリケーションですが、どのように作られているのでしょうか?これは、AI エージェントの構築の全ステップを説明する複数部構成のブログシリーズです。
まず最初に、AI エージェントとは何でしょうか? AIエージェントは、特定の目標を達成するために、環境を認識し、情報を処理し、計画を立て、意思決定を行い、行動を起こすソフトウェアエンティティです。AI エージェントは、単純なルールベースのソフトウェアや固定ワークフローから、完全に自律的なシステムまで多岐にわたります。
AI エージェントの主な特徴:
- パーセプション — センサー、API、ナレッジベース、または入力データストリームを使用して環境からデータを収集します。
- 処理と意思決定 —ロジック、ルール、またはAIモデルを適用して入力を分析し、適切な応答を決定します。
- メモリー —ユーザーとのやり取りの記録を保存および管理し、将来の意思決定に役立てることができます。
- アクション — 決定に基づいてアクションを実行します。これには、レスポンスの生成、タスクの自動化、他のシステムとのやり取りなどが含まれます。
- 自律性 — ワークフローエージェントは、複雑で反復的なタスクを自動化して生産性を高めます。自律型エージェントは、絶え間ない人間の介入なしに複雑なタスクを処理します。
- 適応性 —一部のAIエージェントは、インタラクションから学び、時間の経過とともに改善することができます。
手順を文書化することで、誰でもフォローできる MVP AI エージェントが完成します。これは パート 1: ビジョンと計画では、楽しみながら2つのAIエージェントのアイデアを考え出し、どちらを構築するかを決める前に、実行可能な最小限の製品(MVP)を作成するために何が必要かを探ります。
2 つの AI エージェントのアイデアを探る
成功は、計画的なビジョン、達成可能な手段、資源の効率的な利用という3つの重要な要素から生まれます。— GMIのモットー
まず、次の 2 つのアイデアのビジョンを探ります。
- コンベンション・リサーチ・アシスタント: 業界のイベントを発見し、関連する費用と参加による期待収益を計算するためのAIエージェント
- コスチュームシーカー: 写真や画像を見て、スタイルや服を理解し、オンラインで服のオプションを検索して、特定されたスタイルを購入するためのオプションを生成するAIエージェント
これらは両方とも、以下に詳述する具体的なユースケースを伴うプロジェクトです。
コンベンション・リサーチ・アシスタント
業界のコンベンションやカンファレンスに遅れずについていくのは大変です。この AI エージェントは、以下の方法でプロセスを合理化することを目指しています。
- Webスクレイピングとデータ集約を通じて、関連する業界慣習を見つけます。
- 旅行、航空券、宿泊、その他の費用を含む費用の見積もり。
- 聴衆、ネットワーキングの機会、講演者のラインナップなどの要素に基づいて期待投資収益率(ROI)を計算します。
- ユーザーが情報に基づいた意思決定を迅速に行えるように、簡潔な要約を生成します。
これが実現可能な MVP である理由
- 大会のスケジュールと詳細は、多くの場合、構造化された形式でオンラインで入手できます。
- Webスクレイピングと単純なデータ処理は比較的迅速に実装できます。
- コスト見積もりモデルは単純で、公共の旅行やチケットの価格データに基づいています。
- ROI の見積もりは、基本的なヒューリスティックから始め、時間をかけて調整していくことができます。実際、これは AI エージェントの仕事の中で最も難しい部分だと考えています。おそらく、各規則の期待値を採点する方法をエージェントに教える必要があるからです。
コスチュームシーカー
このAIエージェントは、写真や絵から人の服装の画像を撮影し、その見た目に合った購入可能な衣料品を見つけようとします。主な機能には以下が含まれます。
- 画像認識と分類により、衣料品をタイプ、色、スタイルごとに分類できます。
- コンピュータービジョンとウェブクロールを使用して、類似の衣料品をオンラインで検索します。
- 照明や角度のばらつき、適合する製品の入手可能性などの課題への対処
なぜこれを構築するのが非常に難しいのか
これを構築するのは楽しいでしょうが、技術的な複雑さを伴う単純なアイデアの素晴らしい例です。
- ファッションアイテムの画像認識には、広範なデータセットでトレーニングされた高度なディープラーニングモデルが必要です。
- さまざまなオンラインストアで完全に一致する、または非常に類似した一致を見つけることは、複数のAPIとカスタム検索エンジンが関与する複雑な問題です。
- 衣料品は在庫切れになったり、価格や在庫状況が異なることが多く、リアルタイムの正確性が課題となっています。
AI エージェントを過度に複雑にするのは避けたいので、このエージェントは作成しないことにしました。これはまだ、楽しいプロジェクトとして今後どこかで作成したいものです。
AI エージェントの定義
アイデアを選択したら、以下を明確に定義することが不可欠です。
- ザの 特定の問題 エージェントが解決します。
- ターゲット ユーザー そして彼らの ニーズ。
- 成功指標 効果を測定するため。
この明確さにより、測定可能な目標を掲げた、焦点を絞った開発プロセスが保証されます。今回のケースでは、以下の内容を簡単に定義できます。
- 解決する問題: 業界特有のイベントのROI評価を手作業で自動化します。
- ユーザーとニーズ: これを使うのは私たちです!この場合、チームメイトに、事前に調査したコンベンションや業界イベントのリストを、AI エージェントが期待値をまとめて関連コストと比較検討してもらう必要があります。最後に決定を下すのは人間であり、AI エージェントの仕事は非難を与えることです。
- 成功指標: ワークフローを加速し、生産性の向上に役立ちましたか?また、AI エージェントが誤った/正しくない/不正確な情報を提供すると作業が増えるという失敗状態もあります。もしかしたら、彼らの以前のワークフローを AI 支援のワークフローと比較できるかもしれません。
上記のすべてが私たちの ビジョン。今度は、aを使ってどのように実行するかを計画する時です プラン。
要件の特定
機能的な AI エージェントを構築するには、以下が必要です。
- データソース (例:業界イベントリスト、衣料品小売業者API、画像データベース)。
- コア AI モデルとテクニック (例:要約用のNLP、服装認識用のコンピュータービジョン)。
- インフラ 情報を収集、処理し、ユーザーに提示するため。
これを簡単にするために、いくつかのオープンソースツールを使用します。
- Dify.ai — これは、ジェネレーティブAIアプリケーションを構築するためのローコードプラットフォームです。
- ディープシーク R1 —これは軽量でオープンソースのLLMモデルです。これは目前のタスクにはやり過ぎかもしれませんが、ねえ、私たちはクールな新しいおもちゃで遊びたいと思っています。また、GMI Cloudは現在DeepSeek-R1をホストしているので、私たちは自分たちのことをドッグフーディングしています!
予想される課題と合併症
すべてのAIプロジェクトには独自のハードルがあります。私たちのプロジェクトが抱える主な課題には、次のようなものがあります。
- データ可用性: 一部の情報はペイウォールの背後にある場合や、高度なスクレイピング技術が必要な場合があります。
- 技術的実現可能性: コンベンションアシスタントは比較的シンプルですが、衣装検索アシスタントには複雑なAIと検索アルゴリズムが必要です。
- 精度とパフォーマンス: イベントのROIを正確に見積もったり、衣装を正確にマッチさせたりするには、時間をかけて大幅に改良する必要があります。
- 既存の AI モデルの制限: 事前にトレーニングされたモデルをユースケースで効果的に活用するには、微調整や追加データが必要になる場合があります。
- 強固なインフラストラクチャ: このプロジェクトではおそらく基本的な改良を行う予定ですが、エージェントを継続的に改良するには優れたインフラが重要です。
これらの課題を予測することで、AIエージェントビルダーは実現可能性と開発戦略について情報に基づいた意思決定を行うことができます。
パート 2: MVP の構築 — プロセス
パート2では、イベントリサーチAIアシスタントのMVPを構築するための手順を文書化していきますので、どうぞお楽しみに!


