Contents - 目次
Geminiの使い方。画像生成の例。
Googleの生成AI Geminiの画像生成。
テキストから画像生成。
Googleの生成AI、「Bard(現Gemini)」が画像生成をスタート。
ChatGPTやCopilotのように、テキストによる指示で画像が生成ができる。
(※2024年2月8日に、BardからGemini(ジェミニ)に名称が変更。)
Geminiによるテキストから画像生成。2024年8月。
テキストから画像生成の例。
Geminiの画像生成が再開。
一時的にストップしていたGeminiの画像生成が、2024年8月下旬から再開。以前よりバージョンアップしたImagen 3を使用した生成画像となっている。
プロンプト入力欄にそのままテキストを入力すると、すぐに画像が生成される。
(※2024年2月時と比べるため、同じプロンプトを使用。)
Create a picture of puppies in a basket.
テキストから画像生成の例 その2。
Create a picture of a cat with adorable eyes.
テキストから画像生成の例 その3。
可愛い2匹の猫が遊んでいる画像をお願いします。
テキストから画像生成の例 その4。
可愛い2匹の猫が遊んでいる風景を、イラスト風のタッチで描いてください。
写真のような画像になるので、「イラスト風のタッチで」でと指定。
Geminiの画像生成について。
2024年8月31時点。
- 日本語での画像生成も可能。
- 一度に生成される画像は1枚。
- 特にスタイルなどを指定しなければ、写真のような(写実的な)画像が生成される。
- サイズやアスペクト比の指定は不可。2048px × 2048pxの正方形で生成される。
- 人物の画像生成は、Gemini Advancedが必要。
Geminiの画像生成の料金について。
画像生成の料金。
Geminiの画像生成は2024年2月時点では「Imagen 2」を使用しており、2024年8月の再開時には「Imagen 3」とバージョンアップしている。現時点では無料で生成できる。
Geminiの画像生成の枚数について。
画像生成の回数制限。
回数制限については、Geminiに聞いてみたところ無制限とのこと。
Geminiへのプロンプトについて。
指示や情報の例。
具体的な指示があれば、できる限りそれに沿って絵を描けるそう。
例えば以下の情報があると、絵を生成しやすいとのこと。
- どんな絵を描いてほしいか。(例:赤い丸を描いてください。)
- 絵のサイズ。(例:サイズは200px × 100pxにしてください。ただし実際には2048px × 2048pxの正方形となる。)
- 絵のスタイル。(例:シンプル、リアル、イラスト風、アニメ風など。)
プロンプトは自然言語によるテキスト形式。
テキストの例。
絵画の構図、色、線画、質感などの詳細を指定。
- 「富士山を夕焼けの背景で描いてください。」
- 「猫と犬を水彩画で描いてください。」
- 「〇〇風の抽象画を赤と青で描いてください。」
(※実在の人物やキャラクターなどを使用して公開すると、著作権侵害などの可能性があるので注意が必要です。)
Geminiによるテキストから画像生成。2024年2月。
テキストから画像生成の例。
Create a picture of puppies in a basket.
Googleの例の中の「Create a picture of puppies in a basket.」というテキストを送ってみると、次のような画像が生成された。
一回の生成は2枚だが、「さらに作成」をクリックすると、もう2枚生成される。
写真のようになっているのは、「picture」が「絵」よりも「写真」を優先させていのかもしれない。
テキストから画像生成の例 その2。
Create a picture of a cat with adorable eyes.
ちょっと思ってたのと違うという場合、指示を追加していくことができる。
「マンガ風に」や、「別のパターンも」という感じでお願いできる。
「ルネサンス風」と、「印象派風」でお願いした場合。
浮世絵にはまだ対応していない様子。
ただ、生成AIは日々進化しており、近い将来、より高度な画像生成が可能になると思われる。
テキストから画像生成の例 その3。
Draw a picture of a human wearing sunglasses relaxing on the beach with the sea at sunset.
「夕暮れ時の海辺でサングラスをかけた人がリラックスしている」でお願いした場合。
「サングラスを外して」と追加すると、サングラスをかけていないバージョンが生成される。
Gemini利用時の注意点。
Gemini アプリのプライバシー ハブ。
年齢制限について。
画像生成は、18歳未満のユーザーは利用できないとのこと。
Gemini アプリのプライバシー ハブ – Gemini Apps ヘルプ
また、Gemini自体の利用は、13歳以上が対象とのこと。(日本の場合。)
Gemini ウェブアプリにログインする – Gemini Apps ヘルプ
Google アカウントの年齢制限 – Google アカウント ヘルプ
生成画像の質問。2024年2月。
Bard(現Gemini)に聞いてみると、下記のような回答があった。
- 円、四角形、三角形などの図形。
- 顔、花、動物などのシンプルなイラスト。
- 風景、建物などの簡単な絵。
簡単な画像生成だけかと思いきや、上記のようにむしろ写実的な画像や、〇〇風のタッチ、テイストの表現もできる。
Image:Gemini by Google AI
以上、参考になれば幸いです。
※Webデザインは実務数年、職業訓練校講師数年、フリーランス数年、計15年以上のキャリアがありますが、一気にがぁっと書いているので「です・ます調」ではありません。(元々はメモ書きでした。) ※事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ訂正いたします。 ※写真は主にUnsplashやPixabayのフリー素材を利用させていただいております。その他の写真や動画もフリー素材やパブリックドメイン、もしくは自前のものを使用しております。
AI 関連メモ。
ChatGPT 関連メモ。
- ChatGPT searchとは?使い方や、有料と無料、Googleとの違い。
- Chrome拡張機能、ChatGPT searchの使い方。自然言語、日常会話で検索。
- ChatGPTに検索機能。ChatGPT searchでWeb検索が可能に。
- MacとWindowsでもChatGPTと音声会話。Advanced Voiceが利用可能に。
- Advanced Voiceによる音声会話。ChatGPTとプラトニックな関係に?
- OpenAI o1の使い方。考えてから答える新しいChatGPTモデル。
- Voice Engineという名の、音声合成技術。日本語の精度は?
- SearchGPT。ChatGPTがAI検索エンジンに。使い方の例と順番待ちへの登録方法。
- GPT-4o miniが登場。ChatGPT無料版はGPT-3.5からバージョンアップ。
- ChatGPT無料ユーザーにもメモリ機能が。記憶や使い方の例。
- iPhoneやiPad、MacでChatGPT(GTP-4o)が。Apple Intelligence。
- 生成AIとWebデザイン、ChatGPTを活用したコーディングに必要なもの。
- ChatGPT最新モデル GPT-4oが無料でも。使える主な機能。
- ChatGPT(GPT-4o)で、PDF要約の精度を検証した結果。
- GPT-4o。ChatGPTと画像見ながら音声で会話?有料でも無料でも。
- ChatGPT無料版でも画像生成が可能に。有料版だけじゃない!?
- ChatGPT(チャットGPT)にアーカイブ機能が。復元も削除も。
- ChatGPT(チャットGPT)を日本語化。日本語設定の方法。
- ChatGPT(チャットGPT)との音声会話と、音声の変更方法。
- ChatGPTアプリのインストールとログイン方法、チャットの使い方。
- ChatGPT(チャットGPT)のスペルチェック、文章校正がむっちゃ楽。
- ChatGPT(チャットGPT)へのログイン方法。ログインできないとき。
- ChatGPTにプラグイン。広がる機能と使い方。最新情報へも。
- ChatGPTがLINEに?「AIチャットくん」の始め方、そして使い方。
- ChatGPTの始め方と使い方と。初心者向けシンプル版。
- ChatGPTはSVGアイコンを作れるのか?
- ChatGPTの文章作成やコーディング、SEO対策は変わるか?
DALL·E 関連メモ。
Sora 関連メモ。
- OpenAI Soraの短編映画。アーティストや映画制作者たち。
- OpenAIのSoraの公開デモから、Soraの仕組みをできるだけシンプルに。
- OpenAIからSora(動画生成AI)が広がる。デモやWebCMから一般公開へ。
Gemini 関連メモ。
- Google AI Studioの「Gemini 1.5 Pro 002とGemini Experimental 1114」にできること。
- Gemini 1.5 Pro 2Mモデル。Waitlistの登録手順。日本語上手なGoogle生成AI。
- BardからGeminiに。使い方はどう変わる?日本語対応は?
- Bard(Gemini)が絵を描けるように。テキストから画像生成の方法。
- Bard(Gemini)の画像認識の使い方。日本語対応済み、Googleレンズで画像読み取り。
- 最新情報を日本語かつ無料で使いたいときは、GoogleのBard?
- ChatGPTとBardの違い。なぜAIは日本語チャットが苦手なの?
- Bard(Gemini)が日本語対応。ログイン方法や最新情報など、使い方の例。
- BardでGemini。Googleの最新AIを無料で使う方法。
- GoogleのBardは、OpenAIのChatGPTを越えられるだろうか?
Copilot、Bing 関連メモ。
- ChatGPTとCopilotの違い。料金や、できることと、できないこと。
- Copilotとは? GPT-4とDALL·E 3が無料で使える生成AI。
- SkypeのBingチャット。GPT-4を日本語かつ無料で使える。& 注意点。
- BingのGPT-4、チャットの使い方。使えない?(今はまだ。)
- MacでGPT-4(ChatGPT最新版)を使う場合、Edgeが必要なのかも。
Llama 関連メモ。
- Llama 3.1登場。MetaのオープンソースAIとダウンロードサイト。
- Meta Horizon OSとApple Vision Pro。オープンかクローズか。
- Llama 3。無料でオープンソースなMeta AI最新モデル。
- Llama(ラマ)の使い方や日本語は? ダウンロード手順とブラウザ実装サイト。