先日から、やらねばならないことからの現実逃避で、リモート用のバーチャル背景を生成して遊んでいました。
これは無料配布していますので、よかったら使ってください。
水槽がたくさんある背景はリクエストがあって作ったのですが、その際に小動物のリクエストもあったのです。でも、画像生成AIはマニアックなものに弱いのです。
今回はそれを比較検証してみましょう♪
今回は「スチームパンクの衣装を着たフクロモモンガ」というお題。プロンプトの定番的なものは一切書かずに、ただ、それだけで描いてもらいました。
Midjourneyは「Sugar glider in steampunk costume」と英文です。
画像サイズは大きすぎる場合以外、スケールアップなどなしでそのままダウンロードしたものをアップしているので統一感ありません。
Adobe Firefly
さすがAdobeさん。映像はとてもきれいです。
しかし・・・・・フクモモじゃないwww
以前もフクロモモンガを描いてもらった時にどうみてもウォンバットだったことがあり、Adobeさんは著作権的な面ではとても安心ではあるのですが、逆に、ベースとなっている素材が限られているので、マニアックなものは描けないようです。
今後に期待です。
Midjourney
これも、フクモモじゃないですね。Midjourneyはときどき、それっぽく描けることもあるのですが、尻尾はなぜかアライグマのように縞々です。
ChatGTP(DALL・E3)
ChatGTPについては、多くの人が使っているものの、画像生成はいまいちという声も多く聞かれます。たしかに、バグは多いです。・・・が、一番長い時間、ChatGTPを使っているせいか、わたしの好みやきらら舎世界観を把握していてくれていて、通常はチャットを新しくすると、プロンプトはリセットされるのですが、結構「わかってくれてるなあ」という信頼感はあります。
これも、かわいいですよね。画風を指定しなかったので、フォトリアリスティックではなく、アニメ寄りになったようです。
ただ、問題があります。どうしてもフクロモモンガの飛膜を正しく描けないのです。
これもスチームパンクの機械仕掛けの翼などではなく、フクロモモンガの飛膜として描いていると思われます。
同じくOpenAIの動画生成AI、Soraでも、フクロモモンガにはこれと同じ飛膜が描かれます。時にコウモリのようであったり、スズメのようであったり・・・・・(笑)
Google Gemini(Imagen 3)
一応、飛膜は広げているんだけど・・・・・・フクモモじゃないです。
もしや?と思い、シンプルに、フクロモモンガを描いてくださいといって描いてもらいました。
やはり・・・・・
齧歯類のほうのモモンガのようです。
Grok
ちょっといいかも。
フクロモモンガ=自然 としているようだったので、少し場所のプロンプトを加えて、再度描いてもらったものがこちら。
かなりいい感じです。
うちのフクモモに無理やり服を着せて撮影したっぽく見えます。
GrokはXで使えるAIで、最新バージョンはGrokであるGrok-3。2025年2月にリリースされ、前世代のGrok-2に比べて約10倍の計算リソースを投入し、大幅な性能向上を実現しています。
画像生成だけではなく、数学、科学、プログラミングなどの複雑な問題にも対応し、主要なベンチマークで他のトップモデルを超えると話題になっています。
今のところ、安心して使うならAdobe Firefly。
遊ぶならMidjourneyかChatGTP(DALL・E3)。一番期待しているのがGrokという感じです。
しかしそれも、生成するモノによって使い分けるといいと思います。
Grokは今のところ、無料で使えていますが、そのうち課金しないと使えなくなるでしょう。イーロン・マスクさんは「サーバがダウンするまでは無料」と言っています。
今のうちに、広く、Grokのすっげーところを周知させて、Grokなしでは生きて行けない人を作り出し、課金していくのだろうな・・・。
その証拠に、最新のGrokが登場する前まで、X Premium+料金はGrok-3の提供開始に伴い、米国では月額22ドルから40ドルへと約82%の値上げが行われました。
日本国内でも価格改定が行われ、月額3000円いかなかったくらいなのに、Web経由でも月額料金が6,080円に設定されています。
どんどん進化しているAI。今後に期待です。合わせて、進化したAIを悪用するケースに対して、セキュリティや法律の改定をしっかりやっていってほしいと思います。
コメントを残す