AIを使った画像生成を試してみたことはありますか?私は何度も試したことがあるのですが、なかなか思うような画像が作れず断念した経験を持ちます。
今回は、「ChatGPT×DALL·E3 ビジネスのためのAI画像生成:プレゼンからSNS、広告、ロゴまで!仕事に閊える画像を商用OK作り放題。8つのスタイル、44のプロンプト ChatGPTでビジネスが加速するAI仕事術」(2023年)を読んで、画像生成について学んだので、まとめたいと思います。
本書で紹介されているのは、以下の方法です。
マイクロソフトのアカウントがあれば無料です。DALL・E 3を使用していて商用利用も可能です。やってみましたが、ちょっと生成に時間がかかりましたね。
ChatGPT
DALL・E 3を使用し、画像生成ができるモードは有料になります。対話しながら作れるため、髪型など一部を変更したり、「シード値」を利用して、同一人物で複数のバリエーションを作れたりするそうです。便利そうですね。
Adobe Firefly
無料プランでは月に25回、定額プラン(Creative Cloudなど)ではもっと多くのクレジットが付与されるそうです。私はPhotoshopユーザーなので実際にやってみましたが、生成スピードも速く一度に4パターン生成されるし、コンテンツのタイプも色々あって使い勝手が良さそうです。私が遊ぶのであれば、こちらですね。
Midjourney
芸術性の高い画像が生成できる人気のサービスだそうです。今は有料プランしかなく、全て英語表記だそうです。
Stable Diffusion
上級者向けサービスで、プログラミング的な操作も必要だそうです。商用利用可能で、無料だそうですよ。
画像の指示に必要な呪文をプロンプトと言います。基本的には、「①縦横比」+「②スタイル」+「③生成するもの」を提示します。プロンプトは「英語」で書いた方が精度が高くなる傾向があるため、一度Google翻訳などで英語にしてから入力したほうが良さそうです。また、Adobe Fireflyでは必要なさそうですが、DALL・E 3では「ベクター風イラスト」や「ピクセルアート」などイラストのタイプとその呪文を整理しておくと良いなと思いました。
また、数字の指示は苦手だそうです。私も指が6本あったり、足が3本あったりして諦めた経験がありますが(笑)、苦手だったのか〜と納得でした。
AIの画像生成では、呪文をもとに新しく画像を生成するため、同じ画像で背景を変えたり、一部を変更するのは得意ではありません。専用のソフトが必要になるのだそうです。
こちらも、私にはPhotoshopがあるので、背景の削除も合成も問題なしです!
前述したように、同じ画像で一部を変えるのはAIではなかなかうまくいきません。その場合のテクニックとして、画面を分割して、色々な表情やポーズを出力させるというのがあるそうです。とても便利だなと思いました。
Adobe Fireflyでも色々試したのですが、同じ表情ばかりになって、上手くいきませんでした。そして、指定したわけでもないのにどれも中国風(ちょっと目がこわい)。ソフトによって、クセや得意不得意があるようですね。
AI画像生成では、ビジネス系は結構良い感じにできるようですが、医科歯科係の画像は何度試してみてもまだうまくできません。まだまだイラストレーターさんの需要はありそうですね。しかし、近い将来、データが蓄積すれば、高品質の写真やイラストが一瞬でできるようになるのだろうと考えられます。
ものすごい時代に生まれたなとつくづく思います。