公開日 2022/10/22 07:00
画像生成AIに「めちゃくちゃ音質の良いオーディオシステム」を描いてもらった結果
小口径ユニットがお好きなご様子
画像生成AIも、すっかり一般社会に溶け込んだ感のある昨今。特に、8月に無償公開された「Stable Diffusion」が拍車を掛けた印象だ。
Stable Diffusionの実行環境をダウンロードし、ローカル環境で使えるようになっただけでなく、写真加工ソフトに搭載されたり、チューニングして二次元イラストを生成するサービスが作られたり、日本語でも使えるサービスができたりなど、可能性がどんどん広がっている。
当サイトではこれまで2回ほど、画像生成AIに「ヘッドホンを着けたネコ耳美少女」を描いてもらい、記事化した(1回目/2回目)。けっこう完成度的に謎なものも多かったが、なかには鑑賞に堪えるものもあった。
だが、AIの学習速度はめざましい。今回、LINEからリクエストすると、Stable Diffusionをベースにしたイラストを返信してくれる「イラストお絵描きばりぐっどくん」で、同じように描いてもらったところ、「もうこれでいいじゃん」と言いたくなるクオリティのものが出てきた。
そこで今回は、ちょっと趣向を変えてみた。MidjourneyでもStable Diffusionでも、初期段階では、ハイファイオーディオ関連のリクエストをすると、何がなんだかよくわからない結果が返ってきて、とても記事化するどころではなかった。AIがオーディオ関連の画像を学習していなかったのだろう。
今ならどうだろうということで、「お絵描きばりぐっどくん」(少しややこしいが、二次元イラストが得意な「イラストお絵かきばりぐっどくん」とは別のもの)に、オーディオ関連の絵を描いて欲しいと依頼してみた。日本語で依頼できるのが、すごくラクだ。
さて、まずは「超高級なオーディオシステム」と、非常にシンプルな文言で依頼をしてみた。待つこと数秒。出てきたのがコレだ。
…なんとなく、AIが言いたいことはわかる。スピーカーにはたくさんユニットが付いてるし、真ん中のウーファーはデカい。なぜトゥイーターっぽいものが一番下にあるのか気になるが…。
それにしても、右にある物体群はなんなんだ。一番上にある横長の物体は、スピーカーのようにも見えるが、ウーファーらしきものが溶解しており、よくわからない。オーディオラック(?)の下にある物体群も、ケーブルがわけのわからない生え方をしていたりなど、意味不明だ。AI、たぶん途中で諦めたな。
違う方向から攻めてみよう。次に「めちゃくちゃ音質の良いオーディオシステム」を描いて欲しいと頼んでみた。その結果がコレ。
…なんなん、これ。なぜテレビ? しかもブラウン管? どうして4対3? なんで画面部分がサランネットみたいなので覆われてるの?
そして最大の謎。下の方に1個だけ付いてるジャックはいったい何?何を差せばいいの?
…と、突っ込みどころが満載だが、これは後から考えてみたら、私のお願いの仕方、書き方が悪かった可能性が高い。「めちゃくちゃ」が「absurd」などと訳されて実行されていたら、この結果もうなずける。
「オーディオシステム」という書き方がざっくりしすぎているのかもしれない。もうちょっと詳しく指示してみよう。ということで、次なるお願いは「メチャクチャ音質の良いスピーカーとオーディオプレーヤー、プリアンプ、パワーアンプ」。何を描いて欲しいかを、具体的に頼んでみた。すると、やはり見違えるほど結果が良くなった。
なぜアンプらしきものの上にスピーカーが乗っかっているのかとか、ノブが曲がってて不安に感じるとか、細かな突っ込みどころはある。ただ、それらは些細なことだ。しっかりとオーディオシステムらしきものが描かれている。
この結果を見て、俄然調子が出てきた。次は機器のアップではなく、部屋に置かれた高級オーディオを描いてもらいたくなった。そこで「調音された、豪華なオーディオルームに置かれたトールボーイスピーカーとオーディオシステム」とお願いした。
…なんとこのAI、「調音されたオーディオルーム」というイメージを、しっかり表現してきた! 天井には調音材らしきものが貼られているし、壁も吸音材なのかな、と思われる材質に見える。
そして、そこにそびえ立つ、2つの巨大なスピーカー。どうやらこのAI、スピーカーはペアで使うものという常識は持ち合わせていないようで、2台のスピーカーは大きさもユニット構成もまったく異なっているが、ともかくも、立派なスピーカーをがんばって描いてくれた。大満足だ。
実験ついでに、AIの見解を知りたいと思い「世界で一番音の良いオーディオシステム」というお題で描いてもらった。
出力されたのは、なんと意外なことに、小口径のドライバーユニットが2つだけ、というもの。とても、世界一の音を奏でるとは想像もつかないが、小口径の方がレスポンスが良いからね、とAIは言いたいのかもしれない(違うとは思うが)。
ということで、だいぶというか、かなりこなれてきた画像生成AI。たった数ヶ月でここまで進化するとは驚きだ。すでに二次元イラスト共有サイトなどでは、AIが描いたイラストをどう扱っていくべきか、熱い激論が交わされている。
こういった劇的な進化を目の当たりにしていると、こういうアホな記事を書くAIはまだ現れないだろう、と楽観もできなくなってきた。仕事を奪われないよう、引き続きがんばっていきたい。
Stable Diffusionの実行環境をダウンロードし、ローカル環境で使えるようになっただけでなく、写真加工ソフトに搭載されたり、チューニングして二次元イラストを生成するサービスが作られたり、日本語でも使えるサービスができたりなど、可能性がどんどん広がっている。
当サイトではこれまで2回ほど、画像生成AIに「ヘッドホンを着けたネコ耳美少女」を描いてもらい、記事化した(1回目/2回目)。けっこう完成度的に謎なものも多かったが、なかには鑑賞に堪えるものもあった。
だが、AIの学習速度はめざましい。今回、LINEからリクエストすると、Stable Diffusionをベースにしたイラストを返信してくれる「イラストお絵描きばりぐっどくん」で、同じように描いてもらったところ、「もうこれでいいじゃん」と言いたくなるクオリティのものが出てきた。
そこで今回は、ちょっと趣向を変えてみた。MidjourneyでもStable Diffusionでも、初期段階では、ハイファイオーディオ関連のリクエストをすると、何がなんだかよくわからない結果が返ってきて、とても記事化するどころではなかった。AIがオーディオ関連の画像を学習していなかったのだろう。
今ならどうだろうということで、「お絵描きばりぐっどくん」(少しややこしいが、二次元イラストが得意な「イラストお絵かきばりぐっどくん」とは別のもの)に、オーディオ関連の絵を描いて欲しいと依頼してみた。日本語で依頼できるのが、すごくラクだ。
さて、まずは「超高級なオーディオシステム」と、非常にシンプルな文言で依頼をしてみた。待つこと数秒。出てきたのがコレだ。
…なんとなく、AIが言いたいことはわかる。スピーカーにはたくさんユニットが付いてるし、真ん中のウーファーはデカい。なぜトゥイーターっぽいものが一番下にあるのか気になるが…。
それにしても、右にある物体群はなんなんだ。一番上にある横長の物体は、スピーカーのようにも見えるが、ウーファーらしきものが溶解しており、よくわからない。オーディオラック(?)の下にある物体群も、ケーブルがわけのわからない生え方をしていたりなど、意味不明だ。AI、たぶん途中で諦めたな。
違う方向から攻めてみよう。次に「めちゃくちゃ音質の良いオーディオシステム」を描いて欲しいと頼んでみた。その結果がコレ。
…なんなん、これ。なぜテレビ? しかもブラウン管? どうして4対3? なんで画面部分がサランネットみたいなので覆われてるの?
そして最大の謎。下の方に1個だけ付いてるジャックはいったい何?何を差せばいいの?
…と、突っ込みどころが満載だが、これは後から考えてみたら、私のお願いの仕方、書き方が悪かった可能性が高い。「めちゃくちゃ」が「absurd」などと訳されて実行されていたら、この結果もうなずける。
「オーディオシステム」という書き方がざっくりしすぎているのかもしれない。もうちょっと詳しく指示してみよう。ということで、次なるお願いは「メチャクチャ音質の良いスピーカーとオーディオプレーヤー、プリアンプ、パワーアンプ」。何を描いて欲しいかを、具体的に頼んでみた。すると、やはり見違えるほど結果が良くなった。
なぜアンプらしきものの上にスピーカーが乗っかっているのかとか、ノブが曲がってて不安に感じるとか、細かな突っ込みどころはある。ただ、それらは些細なことだ。しっかりとオーディオシステムらしきものが描かれている。
この結果を見て、俄然調子が出てきた。次は機器のアップではなく、部屋に置かれた高級オーディオを描いてもらいたくなった。そこで「調音された、豪華なオーディオルームに置かれたトールボーイスピーカーとオーディオシステム」とお願いした。
…なんとこのAI、「調音されたオーディオルーム」というイメージを、しっかり表現してきた! 天井には調音材らしきものが貼られているし、壁も吸音材なのかな、と思われる材質に見える。
そして、そこにそびえ立つ、2つの巨大なスピーカー。どうやらこのAI、スピーカーはペアで使うものという常識は持ち合わせていないようで、2台のスピーカーは大きさもユニット構成もまったく異なっているが、ともかくも、立派なスピーカーをがんばって描いてくれた。大満足だ。
実験ついでに、AIの見解を知りたいと思い「世界で一番音の良いオーディオシステム」というお題で描いてもらった。
出力されたのは、なんと意外なことに、小口径のドライバーユニットが2つだけ、というもの。とても、世界一の音を奏でるとは想像もつかないが、小口径の方がレスポンスが良いからね、とAIは言いたいのかもしれない(違うとは思うが)。
ということで、だいぶというか、かなりこなれてきた画像生成AI。たった数ヶ月でここまで進化するとは驚きだ。すでに二次元イラスト共有サイトなどでは、AIが描いたイラストをどう扱っていくべきか、熱い激論が交わされている。
こういった劇的な進化を目の当たりにしていると、こういうアホな記事を書くAIはまだ現れないだろう、と楽観もできなくなってきた。仕事を奪われないよう、引き続きがんばっていきたい。