マルチモーダル画像・音声出力、エージェント型AI機能を搭載したGoogle Gemini 2.0を発表

テクノロジー

グーグルは、「エージェントの時代」に向けて、画像や音声の出力、ツールの統合をサポートした最新世代のAIモデル「Gemini 2.0」を発表した。エージェント型AIモデルとは、適応的な意思決定によってタスクを独立して遂行できるAIシステムのことだ。プロンプトから買い物をしたり、予約を入れたりするようなタスクの自動化を考えてみよう。

テクノロジー Google Gemini 2.0発表、マルチモーダル画像・音声出力、エージェント型AI機能を搭載

Gemini 2.0は、Clash of Clansのようなゲームでのリアルタイム提案から、プロンプトに基づいたギフト選びやショッピングカートへの追加まで、あらゆる分野であなたを助けることができる複数のエージェントを特徴とする。

他のAIエージェントと同様に、Gemini 2.0のエージェントは目標指向の行動を特徴とする。タスクベースのステップリストを作成し、自律的にそれを達成することができる。Gemini 2.0のエージェントには、Android携帯用のユニバーサルAIアシスタントとして設計され、マルチモーダルサポートとGoogle検索、レンズ、マップの統合を備えたProject Astraが含まれる。

テクノロジーマルチモーダル画像・音声出力、エージェント型AI機能を搭載したGoogle Gemini 2.0を発表

Project Marinerは、ウェブブラウザ内で単独でナビゲートできる、もうひとつの実験的AIエージェントである。Marinerは現在、Chrome拡張機能として「信頼できるテスター」向けに早期プレビュー版が提供されている。

AIエージェント以外では、Gemini 2.0 Flashがグーグルの新しいAIモデルの最初のバージョンである。Gemini 1.0および1.5モデルと比較して、レイテンシーが低く、ベンチマーク性能が向上し、数学とコーディングにおける推論と理解が改善されている。また、Google DeepMindのImagen 3 text-to-imageモデルによってネイティブに画像を生成することもできる。

Gemini 2.0 Flash Experimentalとは？ウェブで入手可能モバイルGeminiアプリでも近日公開予定です。テストしたいユーザーは、ドロップダウンメニューからGemini 2.0 Flash Experimentalを選択する必要があります。

Gemini 2.0 Flash Experimental on web

開発者は、Google AI StudioとVertex AIからも新しいモデルにアクセスできる。Googleはまた、1月にさらなるGemini 2.0モデルのサイズを発表する予定であることも確認した。

ソース

引用元へ

マルチモーダル画像・音声出力、エージェント型AI機能を搭載したGoogle Gemini 2.0を発表

Must read

The Sinking City 2』、PS5でのサプライズリリースを目指していたが、ウクライナ戦争のため延期に

中国ウェハー価格が約4％上昇、3週間の小康状態に終止符

CJ・ストラウドケガ最新情報：テキサンズQB、対ブロンコス戦でヒット後、脳震盪プロトコルに入る

Apple AirPods Pro 3のレビュー

More articles

返事を書く返事をキャンセル

Latest article

The Sinking City 2』、PS5でのサプライズリリースを目指していたが、ウクライナ戦争のため延期に

中国ウェハー価格が約4％上昇、3週間の小康状態に終止符

CJ・ストラウドケガ最新情報：テキサンズQB、対ブロンコス戦でヒット後、脳震盪プロトコルに入る

Apple AirPods Pro 3のレビュー

リップルニュース初のスポットXRP ETFは2週間以内に稼働するとNovaDius社長が発表

About Us

Popular Category

Editor Picks

The Sinking City 2』、PS5でのサプライズリリースを目指していたが、ウクライナ戦争のため延期に

中国ウェハー価格が約4％上昇、3週間の小康状態に終止符

マルチモーダル画像・音声出力、エージェント型AI機能を搭載したGoogle Gemini 2.0を発表

Must read

More articles

返事を書く 返事をキャンセル

Latest article

About Us

Popular Category

Editor Picks

返事を書く返事をキャンセル