AI(人工知能)

生成AI「Gemini」とは?使い方も解説!Googleはやっぱりすごかった

Googleは日本時間2023年12月7日に新たな生成AI「Gemini(ジェミニ)」を発表しました。
その性能はベンチマークのデータ上、ChatGPTを超え、専門家である”人”さえも超えています。

具体的にどのような性能なのかと、使い方を解説します。

Gemini(ジェミニ)とは?

Gemini(ジェミニ)は日本時間2023年12月7日にGoogleが発表した新たなマルチモーダル型の生成AIのモデルです。

最大かつ高性能 AI モデル、Gemini を発表 – AI をすべての人にとってより役立つものに

これまでGoogleは、GoogleによるAIチャットボットであるBardに「PaLM2」と呼ばれる大規模言語モデルを採用していましたが、それを「Gemini」に変更しました。

なお、Geminiは英語での発音はジェミナイに近いのですが、日本での呼称は「ジェミニ」とGoogle Japanが回答したそうです。

Gemini(ジェミニ)の能力

Googleの説明によると、ベンチマーク値で、32項目中30項目でGPT-4Vを超え、57の一般的な主題に対するスコアでは、それぞれの専門家である人のスコアさえも超えています。

次の画像をGeminiに提示して、どちらに進むべきか尋ねると、「右側だと敵であるクマに出会うので、お友達がいる左側が良い」と答えるそうです。

次の動画で紹介されています。

この動画を見ると、あたかも即座に映像を見ながらGeminiが回答しているように見える方もいるかもしれませんが、そんなわけはなく、画像にしてやりとりをした結果を示しているのみです。

How it’s Made: Interacting with Gemini through multimodal prompting

この動画をフェイクだと非難する声もあるようです。

Google’s best Gemini demo was faked

私はこの動画を見た時に、当然ながら編集されたものだということは分かりましたし、フェイクだとは思わなかったですけどね。

Gemini(ジェミニ)の展開のされ方

Geminiは以下の3つのモデルで提供される予定で、すでにGemini Proに関しては、テキスト入力だけではありますがBard(英語版)で使えるようになっています。

Gemini Ultra非常に複雑なタスクに対応する、高性能かつ最大のモデル
Gemini Pro幅広いタスクに対応するモデル
Gemini Nanoモバイル端末向けで効率的に動くモデル

Gemini(ジェミニ)の使い方

Bardに搭載されたGeminiを使うには、現時点ではBardの英語版を利用する必要があります。その手順をご説明します。

まず、Googleにログインした状態で右上に表示される9個のドットからなるメニューをクリックし、表示されるメニューから「アカウント」をクリックします。

次に、左側に表示されるメニューから「個人情報」を選択します。

下の方にある「ウェブ向けの全般設定」という欄で、言語が日本語になっている場合は「英語」にします。地域も聞かれるので「United States」にしておきます。

変更前
変更後

これで、BardにアクセスすればGeminiを使うことができます。最初に画面が英語で表示されますが、日本語で入力すれば日本語で答えてくれます

実際に利用してGeminiとChatGPT-4を比較した結果

試しに

「一眼レフ ぼかし レンズ 選び方 撮影のコツ」という検索キーワードでGoogleで上位を獲得できる記事をあなた自身の言葉を使って実際に書き出して

という指示を、Bard(Gemini版)と、ChatGPT-4に行って比較してみました。
AIが行った補足を除き、記事部分のみ抜粋してお示しします。

Bard(Gemini版)

Bard(Gemini版)は次のような出力を返しました。
英語で入力しないとダメだと思われるので、英語で「Use your own words to actually write an article that will rank high on Google for the search keyword “How to choose a SLR blur lens and shooting tips.”」と入力して出力された英語のご紹介となります。

How to Choose an SLR Blur Lens & Shooting Tips for Dreamy Defocus
Blur. It’s a word that conjures images of soft, dreamy backgrounds, isolating subjects and adding depth to your photos. But how do you achieve this magical effect? The answer lies in choosing the right SLR lens and mastering some key shooting techniques.

Choosing the Right Lens: Aperture is King

The single most important factor in achieving blurry backgrounds is aperture. Measured in f-stops, a lower number indicates a wider aperture and shallower depth of field. This means only a small area will be in focus, while the rest fades away into a pleasing blur.

Here’s a breakdown of ideal aperture ranges for different blur effects:

Softly blurred background: f/2.8 – f/4.0
Dreamy, ethereal blur: f/1.8 – f/2.0
Extreme, artistic blur: f/1.4 or wider
Popular SLR lenses for achieving blur include:

Prime lenses: 50mm f/1.8, 85mm f/1.8, 105mm f/2.8
Zoom lenses: 24-70mm f/2.8, 70-200mm f/2.8
Beyond Aperture: Other Factors to Consider

While aperture is crucial, other factors influence blur:

Focal length: Longer focal lengths compress perspective, emphasizing background blur.
Subject distance: The closer you are to your subject, the more blurred the background will appear.
Sensor size: Smaller sensors like those in APS-C cameras create less blur than larger full-frame sensors.
Shooting Tips for Blur Perfection:

Master aperture priority mode: This gives you control over aperture, allowing you to choose the desired blur level.
Focus accurately: Precisely nailing focus on your subject is essential for a clean, pleasing blur.
Stabilize your camera: Camera shake can blur the entire image, defeating the purpose. Use a tripod or fast shutter speed for sharp results.
Experiment with distance: Move closer to your subject or zoom in for more pronounced blur.
Embrace bokeh: Bokeh refers to the aesthetic quality of the out-of-focus areas. Choose lenses known for their pleasing bokeh patterns.
Practice and refine: Experiment with different settings and compositions to find your own blur style.
Remember: Choosing the right lens is just the beginning. Mastering shooting techniques and understanding the interplay between aperture, focal length, and distance will unlock your creative potential and help you capture stunning, blurry masterpieces.

ChatGPT-4

ChatGPT-4は次のような出力を返しました。文字数は603文字です。

一眼レフカメラでのぼかし効果を最大限に活かすレンズの選び方

レンズの焦点距離を理解する
広角レンズ(24mm以下):広い範囲を撮影でき、被写界深度が深くなります。ぼかしは比較的少ないです。
標準レンズ(24mm~70mm):自然な視野を提供し、多目的に使用できます。
望遠レンズ(70mm以上):遠くの被写体を引き寄せ、強いぼかし効果が得られます。

絞り値(F値)の低いレンズを選ぶ
F値が低いレンズ(例:F1.4、F2.8)は、より開いた絞りを提供し、背景を美しくぼかします。

プライムレンズとズームレンズ
プライムレンズ:固定焦点距離を持ち、F値が低く、シャープな画質を提供します。
ズームレンズ:焦点距離が調整可能ですが、F値が高くなることが多いです。

レンズの品質と価格
レンズの品質は価格に影響されますが、高価格のレンズが常に必要とは限りません。予算内で最適なレンズを選びましょう。
一眼レフカメラでのぼかし効果を活かした撮影のコツ

被写体と背景の距離を意識する
被写体を背景から離して撮影すると、ぼかし効果が強調されます。

絞りを調整する
絞りを開ける(例:F1.4、F2.8)ことで、背景のぼかしを強くできます。

焦点距離を活用する
望遠レンズを使用すると、背景のぼかしがより目立ちます。

撮影位置を変えてみる
高い位置から撮影したり、被写体に近づいてみたりすることで、ぼかし効果の違いを楽しめます。

比較結果

他にも、プログラミングを作ってもらうなど比較してみました。ChatGPTの方が良いと思うものも多かったですが、Bardはかなり進化したと感じます。
ChatGPT-4は月額20ドルのChatGPT Plusを利用しないといけませんが、Bardは無料なので、無料で利用したい方はChatGPTだけではなく、Bardも試してみてはいかがでしょうか?

なお、上で比較したようなSEO記事を書くにはまだまだどちらも不十分です。BringRiteraはベースはChatGPTですが、当方独自のノウハウを踏まえて裏で自動的にやり取りを繰り返しているため、同じテーマで次のような記事を最短わずか4クリック、あとは待つだけで10分程度で書きあげます。

一眼レフカメラで背景を美しくぼかすための最適なレンズ選びと撮影のコツ

クレジットカード不要でお試し利用できるので、ご興味ある方はぜひお試しください。

まとめ

今後も目が離せないAI技術の日進月歩。GoogleはGeminiで「やっぱりすごい」というのを見せてくれましたね。

著者のイメージ画像

株式会社BringFlower
稲田 高洋(Takahiro Inada)

2003年から大手総合電機メーカーでUXデザインプロセスの研究、実践。UXデザイン専門家の育成プログラム開発。SEOにおいても重要なW3Cが定めるWeb標準仕様策定にウェブアクセシビリティの専門家として関わる。2010~2018年に人間中心設計専門家を保有、数年間ウェブアクセシビリティ基盤委員も務める。その後、不動産会社向けにSaaSを提供する企業の事業開発部で複数サービスを企画、ローンチ。CMSを提供し1000以上のサイトを分析。顧客サポート、サイト運営にも関わる。
2022年3月にBringFlowerを開業し、SEOコンサル、デザイン、ウェブ制作を一手に受ける。グッドデザイン賞4件、ドイツユニバーサルデザイン賞2件、米国IDEA賞1件の受賞歴あり。
プロフィール詳細