「週刊 スタジオ翁」ニュースレターの登録はこちら

ChatGTP×DALL-E 3でリリース用のジャケットを大量生産してみた

記事内に商品プロモーションを含む場合があります

最近、こんな記事を発見しました。

ChatGPTに画像生成ツール「DALL·E 3」追加。ツールを使ってみて見えてきた懸念 – Wired

AI画像生成ツール「DALL-E」がChatGPTと連動するようになり、誰でも簡単に画像生成ができるようになったので、これでシングルやアルバムのジャケット(アートワーク)を作ってみることにしました。

今まで、「Midjourney」や「Stable Diffusion」でジャケット制作を試してきたのですが、どのようにプロンプト(指示)を打ち込めばうまくいくのかわからず、実際に使えそうな画像を作れなかったんですよね。

ChatGTPと連動することのメリットは、「良い感じのプロンプトをChatGPTが作ってくれる」という点です。これにより、細かい指示を出さなくても、自分のイメージに近い画像を簡単に作れるようになりました。

今回、色々試してみてうまくいったので、最新のリリース曲のジャケットには、DALL-E 3で作った画像を採用しています。

すごく便利な反面、使いづらい部分もあるので、実際に使ってリリースまでやってみた身として、使い心地やデメリットなどをご紹介していきたいと思います。

ChatGPT×DALL-E 3でどんな画像ができたのか?

一番気になるのは、「結局、どんなジャケット画像ができたんだよ?」という部分だと思います。

なので、まずは僕が、アンビエント曲のジャケットとして作ってみた画像をいくつか紹介します。

これが、最終的にシングルのジャケットにすることにした画像です。

ミニマルで可愛らしいデザインですよね。

ちなみにリリースはこちら。

この時のプロンプトは、

「minimalist album covers with a few geometric shapes, using a soft color palette suitable for an ambient album」

(アンビエント・アルバムに適したソフトなカラーパレットを使い、幾何学的な形をいくつか使ったミニマルなアルバム・ジャケット)

ですが、これは僕が考えたのではなくChatGPTに作ってもらっています。

詳しくは、後述します。

他にも、いろんな画像を作ってみました。

プロンプトを考える上でのコツがあると思うのですが、全くの素人でも、これくらいならChatGPTと会話していくことで、どんどん画像を生成できます。

出来が良すぎて、ちょっと怖いですよね。

下手に安い人間のデザイナーに頼むより、数倍良いものが上がってきます。

AI画像生成ツールが、ChatGPTと一緒に使えるメリット

今までのAI画像生成ツールだと、「一発プロンプトを書く→画像生成」で終わりだったと思いますが、ChatGPTが組み合わさることで「対話による画像生成」ができるようになります。

どういうことかというと、一度、ChatGPTで画像を生成したら終わりではなく、その結果をふまえた新たな指示を出すことにより、画像をどんどんブラッシュアップしていくことができるのです。

例えば、

「青い背景を赤色にして」

「もっとオブジェクトを少なく、ミニマルな感じにして」

といった風に、どんどん自分のイメージに近づけることができるのです。

この記事の序盤で「ChatGPTが的確なプロンプトを生成してくれる」と書きましたが、このように対話によって画像を作っていく際、こちらの言葉を考慮して、プロンプトを自動で再生成してくれるこの機能のことを指しています。

他に、ChatGPTと一緒に使えるメリットとしては、「参考画像を読み込ませて画像生成できる」という点があります。

参考画像そっくりにはならないですが、全体の雰囲気はかなり近いところまで持って行けるので、それをベースにいろんな指示を追加し、好みの画像を作ることもできます。

Stability.AIでも、参考画像を読み込ませてそれに近い画像を生成することはできますが、ChatGPTでは、そこからさらにプロンプトを追加して画像を追い込めるのがメリットです。

ChatGPT×DALL-E 3のデメリット

AI画像生成の分野は発展途上なので、デメリットもたくさんあります。

先ほどの、「プロンプトを与えるたびに、微妙に画像が変わってしまう」という点もありますし、指示を的確に反映してくれない時もあります。

例えば、「この真ん中にある対象物を、画像の右下に小さく配置して欲しい」と言っても、ずっと真ん中から移動してくれなかったり、「画像にいる男性を消して欲しい」と言っても男性がずっと残ってしまったり…

細かい指示は苦手なのか、もっと的確なプロンプトがあるのか、日本語だと正確に指示を反映してくれないのか・・・

いろんな理由があると思いますが、人間ほど言葉を理解して画像に反映させてくれるほどの知能は、まだまだなさそうです。

DALL-E 3はジャケット制作に使えるか?

DALL-E 3は、ジャケット(アートワーク)の制作に十分使えるツールだと思います。

実際、僕もこれからのリリースは、すべてDALL-E 3でやってしまおうと考えています。

AI画像生成はまだ発展途上ですが、人間にジャケットデザインを頼むのは、時間的にも金銭的にもなかなか大変ですよね。

もちろん、今はまだ人間に頼んだ方が、グッと心に来るデザインができるのですが、音楽で稼ぐことが難しいこの時代、ジャケットにお金をかけられるアーティストは少ないでしょう。

「これからガンガン作曲して有名になる!」という人は、まず初期のリリースはDALL-E 3でジャケット制作を行い、アーティストとして売れて収入も入ってくるようになったら、人間にデザインをお願いするという形もアリだと思います。

これからは、作曲、ミキシング、マスタリング、ジャケット制作、リリースまでのすべてを1人で行う、いわゆるDIYアーティストが主流になってくると思うので、そういった時代を見据えて、今から音楽制作だけでなくジャケット制作にも手をつけてみるのもこれからの時代を生き残る上で大事になってくるのではないでしょうか。

ChatGPTは月に3,000円くらいかかりますが、ジャケット画像を誰かに頼むコストに比べたらかなりお得だと思いますので、これからリリースを重ねていきたい方は、ぜひChatGPTに登録してDALL-E 3を試してみてください。

ChatGPT

週に1度配信しているニュースレターでも、最近はDIYアーティストのための情報を中心に発信していっています。よければ、そちらもご覧になってみてください。

今日も最後までご覧いただき、ありがとうございました。

ニュースレターやってます。

最新の音楽AI事情、DTMに役立つコンテンツ、世界の音楽ニュースなどを毎週金曜日にニュースレターで配信しています。

無料です。

https://studiookina.beehiiv.com/

この記事の著者

Isseyのアバター Issey 作曲家、音響エンジニア

23歳で音楽制作を始め、「Ohme」「Issey Kakuuchi」名義で国内外のレーベルからリリースを行なっている。 クラブやライブイベントの音響エンジニアとしてキャリアをスタートさせ、現在は映画の作曲、MA、アーティスト活動に加えて、音楽アプリ、オウンドメディア、医療クリニックへの楽曲提供など、様々な分野で活動している。

著書: AI時代の作曲術 - AIは音楽制作の現場をどう変えるか?