エージェントを構築し、世界を創造する。すべて無料で。
本日、GMI Cloud は MiniMax のファーストティア・ローンチパートナーに正式選任され、
MiniMax M2 と Hailuo 2.3 / 2.3-Fast を Day-0 で利用できるようになったことを発表します。
いずれも GMI Cloud Console から無料でデプロイ可能 です。
今回の同時リリースは、
エージェント型推論(agentic reasoning) と
生成的創造力(generative imagination)
という 2 つのフロンティア領域をつなぐものです。
- M2:コード生成、ツール呼び出し、自律エージェントのために設計されたモデル
- Hailuo 2.3:映画レベルのリアリズムと人間らしい物理表現を実現する次世代 text-to-video モデル
開発者とクリエイターが 同一の計算キャンバス上で創作できる時代 が到来しました。
MiniMax M2 — エージェントのために生まれ、スピードのために最適化されたモデル

MiniMax M2 は、エンドツーエンドのエージェントワークフローに向けて設計された、オープンソースのインテリジェンスエンジンです。
コード生成からシェル実行、リサーチ自動化、ツールの長鎖呼び出しまで、
M2 は フロンティアモデルに匹敵する性能を、圧倒的に低いコスト で実現します。
主要特徴
- Claude 3.5 Sonnet の価格のわずか 8% で利用可能
- 推論速度は 約 2 倍
- Artificial Analysis Index(AAI 61)で 世界トップ 5
- SWE-Bench Verified(69.4)、GAIA(75.7)、BrowseComp(44.0)で高い性能
- Cursor、Claude Code、Cline、DroidAgent など開発者ワークフローとの高い親和性
MiniMax のベンチマークでは、
M2 は DeepSeek V3.2 や GLM-4.6 を 70% 以上のタスクで上回る
との結果が得られています。
しかも、1 タスクあたり約 $0.55 と、極めて高いコスト効率を維持しています。
開発者にとって理想的なバランス
コパイロット、リサーチアシスタント、または複数ツールを連携するオーケストレーターを構築する開発者にとって、
M2 は 知能、スピード、コスト効率の理想的なバランス を備えています。
M2 は以下の方法で GMI Cloud 上にデプロイできます:
- 専用エンドポイント として利用
- MaaS(Model-as-a-Service) として利用
また、モデルウェイトは Hugging Face 上で公開 されており、ローカル環境でもデプロイ可能です。
→ MiniMax M2 を無料で利用する(GMI Cloud)
MiniMax Hailuo 2.3 & 2.3-Fast — 物理、モーション、想像力が解き放たれる次世代モデル

M2 がエージェントの「頭脳」を担うモデルだとすれば、
Hailuo 2.3 は「映像表現」を担うモデル です。
Hailuo 2.3 は、人間の動作物理と映画的なカメラワークを組み合わせ、
生命感のある映像表現 を可能にする次世代の text-to-video モデルです。
主なハイライト
- Text-to-Video / Image-to-Video の両方に対応
- 解像度:768p / 1080p
- 動画長:6〜10 秒(1080p は 6 秒)
- Hailuo 2.3-Fast:768p のレンダリングが 約 55 秒
- 強化された VFX(Pixar スタイル、超現実的ライティング、水面・光反射など)
- 顔と物体の整合性向上、テキスト・ロゴアニメーションの精度向上
- プロンプト遵守性の大幅改善
初期ユーザーからは:
「テレビ放映クラスのリアルさ」
「手持ちカメラの揺れまで再現されていて驚いた」
などの評価が寄せられています。
カメラの微細なブレ、感情表現、動きの自然さ。
これらの進化により、Hailuo 2.3 は AI 映像生成の新たな基準を打ち立てています。
幅広いクリエイティブ用途に対応
- ミュージックビデオの絵コンテ制作
- 映画予告のプロトタイピング
- アニメーション / アニメ風演出の生成
- シネマティックシーンの一発生成
プロ向けの映像表現が、誰でも手軽に扱える時代へ。
→ Hailuo 2.3 で動画生成(GMI Cloud・無料)
Speech 2.6 / 開発者向け詳細 / GMI Cloud インフラ / イベント案内 / 結語

MiniMax Speech 2.6 — 超高速・人間的・スマートな音声生成モデル
GMI Cloud では、リアルタイム音声対話に特化した MiniMax Speech 2.6 も利用開始となりました。
多言語・高表現力・高速レスポンスを兼ね備え、音声アプリケーションに必要なすべてを提供します。
主な特徴
- 超高速応答:<250ms の低遅延でリアルタイム会話が可能
- 高度なテキスト正規化:URL、メール、日時、数字なども自然に読み上げ
- フルボイスクローン + LoRA 音声微調整
- 40+言語対応:コードスイッチングで自然な多言語会話を実現
“いつでも流暢に。どの言語でも。”
→ MiniMax Speech 2.6 を試す(GMI Cloud)
開発者向け — インフラ構成と実行環境
今回のモデル群を支えているのが、GMI Cloud の 最新インフェレンス基盤 です。
GMI の推論スタックは:
- コンテナ化された GPU クラスター
- 弾力的スケーリング(Elastic Scaling)
- GPU リクイディティ(需要に応じた GPU 配置最適化)
を組み合わせ、必要なときに必要なスループットを確保 します。
モデル別の最適化
MiniMax M2
- GMI Cloud インフェレンスエンジンにネイティブ対応
- SGLang にフル対応し、
- トークンスループット最適化
- 低レイテンシ実行
を実現
MiniMax Hailuo 2.3
- GMI の高帯域 GPU 基盤を活用し、
安定した高画質動画生成(映像インフェレンス)を実行
開発者とクリエイターのための統合推論基盤
テキスト、コード、動画を単一のスケーラブルなアーキテクチャで統合することで、
GMI Cloud は以下を可能にします:
- 開発者:リアルタイムのエージェント・アプリケーションを構築
- クリエイター:映像生成ワークフローを高速化
- 企業:M2/Hailuo/Speech を本番環境で一貫した品質で運用
また、GMI Cloud ではリージョンをまたいだ ベアメタル / コンテナインスタンスの柔軟な構成 が可能で、
MiniMax モデルの実験・微調整・スケールを一元的に行えます。
OSS 開発者は Hugging Face で M2 の Weight を取得でき、
クリエイターはコンソール UI から Hailuo 2.3 の Video Endpoints に直接アクセスできます。
Build AI Without Limits.(限界のない AI をあなたの手に)
M2 と Hailuo 2.3 は単なる“新モデル”ではありません。
エージェント知能とクリエイティブ生成の融合
という、新しい AI の方向性を象徴しています。
- 開発者には、より自由なエージェント構築の基盤を
- クリエイターには、映画級映像表現という新しい創作媒体を


