11.2 C
Tokyo
2025年 1月 20日 月曜日

マルチモーダル画像・音声出力、エージェント型AI機能を搭載したGoogle Gemini 2.0を発表

Must read

テクノロジー

グーグルは、「エージェントの時代」に向けて、画像や音声の出力、ツールの統合をサポートした最新世代のAIモデル「Gemini 2.0」を発表した。エージェント型AIモデルとは、適応的な意思決定によってタスクを独立して遂行できるAIシステムのことだ。プロンプトから買い物をしたり、予約を入れたりするようなタスクの自動化を考えてみよう。

テクノロジー Google Gemini 2.0発表、マルチモーダル画像・音声出力、エージェント型AI機能を搭載

Gemini 2.0は、Clash of Clansのようなゲームでのリアルタイム提案から、プロンプトに基づいたギフト選びやショッピングカートへの追加まで、あらゆる分野であなたを助けることができる複数のエージェントを特徴とする。

他のAIエージェントと同様に、Gemini 2.0のエージェントは目標指向の行動を特徴とする。タスクベースのステップリストを作成し、自律的にそれを達成することができる。Gemini 2.0のエージェントには、Android携帯用のユニバーサルAIアシスタントとして設計され、マルチモーダルサポートとGoogle検索、レンズ、マップの統合を備えたProject Astraが含まれる。

テクノロジー マルチモーダル画像・音声出力、エージェント型AI機能を搭載したGoogle Gemini 2.0を発表

Project Marinerは、ウェブブラウザ内で単独でナビゲートできる、もうひとつの実験的AIエージェントである。Marinerは現在、Chrome拡張機能として「信頼できるテスター」向けに早期プレビュー版が提供されている。

AIエージェント以外では、Gemini 2.0 Flashがグーグルの新しいAIモデルの最初のバージョンである。Gemini 1.0および1.5モデルと比較して、レイテンシーが低く、ベンチマーク性能が向上し、数学とコーディングにおける推論と理解が改善されている。また、Google DeepMindのImagen 3 text-to-imageモデルによってネイティブに画像を生成することもできる。

Gemini 2.0 Flash Experimentalとは? ウェブで入手可能 モバイルGeminiアプリでも近日公開予定です。テストしたいユーザーは、ドロップダウンメニューからGemini 2.0 Flash Experimentalを選択する必要があります。

テクノロジー Gemini 2.0 Flash Experimental on web
Gemini 2.0 Flash Experimental on web

開発者は、Google AI StudioとVertex AIからも新しいモデルにアクセスできる。Googleはまた、1月にさらなるGemini 2.0モデルのサイズを発表する予定であることも確認した。

ソース

引用元へ

- Advertisement -spot_img

More articles

- Advertisement -spot_img

Latest article