MolmoAct 2
MolmoAct 2は、推論能力を持つロボット制御を実世界環境にもたらすオープンソースのロボティクス基盤モデルです。Ai2によって構築され、業界のベンチマークで独自の代替品を上回る性能を発揮しながら、研究者が研究、拡張、展開できるよう完全に透明性を保っています。
製品のハイライト
- 適応的3D推論:MolmoAct 2-Thinkは深さ認識トークンを使用し、必要な場合のみ空間構造について深く推論するためのインテリジェントなルーティングを行い、速度を犠牲にすることなくパフォーマンスを向上させます。
- 37倍高速な推論:アクション呼び出しのレイテンシーを6,700ミリ秒からわずか180ミリ秒(ベース)または790ミリ秒(適応的推論あり)に短縮し、ほぼリアルタイムのロボット応答を実現します。
- すぐに使える両手操作:前身とは異なり、MolmoAct 2はベースモデルに直接両腕の協調能力を内蔵しており、タスクごとの微調整は不要です。
- 完全にオープンなエコシステム:モデルの重み、トレーニングデータセット(720時間のMolmoAct 2-Bimanual YAMデータセットを含む)、コード、およびオープンなMolmoAct 2-FAST Tokenizerがすべて公開されています。
- 具現化推論のバックボーン:Molmo 2-ERを基盤として構築され、13の具現化推論ベンチマークで平均63.8のスコアを達成し、GPT-5、Gemini 2.5 Pro、およびその他の主要システムを上回ります。
ユースケース
- 研究室の自動化:CRISPR遺伝子編集ワークフロー、サンプル処理、機器操作などの精密で反復的なタスクのためにウェットラボ環境に展開—スタンフォード大学医学部の研究者とテスト済み。
- 家庭用・サービスロボティクス:環境固有のトレーニングなしで、非構造化の家庭環境でのキッチン整理、テーブルバッシング、タオル畳み、物体操作を処理します。
- 研究開発:新規アダプターアーキテクチャや適応的推論メカニズムを含む、完全なオープンVLA(ビジョン-ランゲージ-アクション)パイプラインの研究と拡張。
- 低コストロボット展開:SO-100/SO-101などの手頃な価格のオープンソースハードウェアとの互換性を活用し、アクセス可能なロボティクスソリューションを構築します。
対象ユーザー
ロボティクス研究者、AIエンジニア、および具現化AIのための透明で高性能な基盤モデルを求める学術機関。また、独自のロックインなしに信頼性の高い操作能力を必要とする研究室やサービス業界の自動化エンジニアにも最適です。