テクノロジー
グーグルは、「エージェントの時代」に向けて、画像や音声の出力、ツールの統合をサポートした最新世代のAIモデル「Gemini 2.0」を発表した。エージェント型AIモデルとは、適応的な意思決定によってタスクを独立して遂行できるAIシステムのことだ。プロンプトから買い物をしたり、予約を入れたりするようなタスクの自動化を考えてみよう。
Gemini 2.0は、Clash of Clansのようなゲームでのリアルタイム提案から、プロンプトに基づいたギフト選びやショッピングカートへの追加まで、あらゆる分野であなたを助けることができる複数のエージェントを特徴とする。
他のAIエージェントと同様に、Gemini 2.0のエージェントは目標指向の行動を特徴とする。タスクベースのステップリストを作成し、自律的にそれを達成することができる。Gemini 2.0のエージェントには、Android携帯用のユニバーサルAIアシスタントとして設計され、マルチモーダルサポートとGoogle検索、レンズ、マップの統合を備えたProject Astraが含まれる。
Project Marinerは、ウェブブラウザ内で単独でナビゲートできる、もうひとつの実験的AIエージェントである。Marinerは現在、Chrome拡張機能として「信頼できるテスター」向けに早期プレビュー版が提供されている。
AIエージェント以外では、Gemini 2.0 Flashがグーグルの新しいAIモデルの最初のバージョンである。Gemini 1.0および1.5モデルと比較して、レイテンシーが低く、ベンチマーク性能が向上し、数学とコーディングにおける推論と理解が改善されている。また、Google DeepMindのImagen 3 text-to-imageモデルによってネイティブに画像を生成することもできる。
Gemini 2.0 Flash Experimentalとは? ウェブで入手可能 モバイルGeminiアプリでも近日公開予定です。テストしたいユーザーは、ドロップダウンメニューからGemini 2.0 Flash Experimentalを選択する必要があります。
Gemini 2.0 Flash Experimental on web
開発者は、Google AI StudioとVertex AIからも新しいモデルにアクセスできる。Googleはまた、1月にさらなるGemini 2.0モデルのサイズを発表する予定であることも確認した。