公開日 2022/10/29 07:00
自由すぎる発想
お絵描きAIの「オーディオの知識」を検証してみたら衝撃の結果に
風間雄介
前回の記事では、画像生成AIに、オーディオ関連の絵(というか写真のように見えるが)を何枚か描いてもらった。
かなり雑に見える絵もあったが、「けっこうわかってるな」と感じられるものもあり、あらためて最近の画像生成AIの進化のすごさを実感させられた。特に「調音された、豪華なオーディオルームに置かれたトールボーイスピーカーとオーディオシステム」とお願いしたときに出力された絵には驚かされた。
そこで思ったのが、Stable Diffusionをベースにした画像生成AIサービス「お絵描きばりぐっどくん」は、かなりオーディオについて詳しいのでは…?ということ。オーディオ機器のデータについても、しっかり学習しているように思える。
そこで今回は、AIがオーディオ関連の知識を持っているのかテストしてみよう。あえて「ちょっと難しいかな」と思うものから出題してみることにした。最初に描いてもらったのは、ずばり「オーディオ用電源」だ。
正直、オーディオ用電源といっても色々なものがある。だから少し意地悪なオーダーなのだが、据え置き型の電源機器を描いてくるあたり、着眼点が良い。
上側の機器には、なんとなく電気の波形と見えないこともない意匠があしらわれており、「それっぽさ」をうまく表現している。唯一、アンテナなのか何なのか、屹立した黒い棒状のものが描かれているのが気になるが、まあ、細かいことは気にしないようにしよう。
さすがは「お絵描きばりぐっどくん」。かなり難しいと思われるお題を、なかなかの精度で返してきた。ならば、次のお題は楽勝だろう。「真空管アンプ」だ。
…もうこれは、満点に近い出来と言ってよいのではないだろうか。サイケデリックなカラーリングはオーディオらしくないが、突っ込みどころはそのくらい。そのほかはあまり文句のつけようがない。
ハードウェア関連はバッチリなようだと当たりを付けて、もう少し難しいお題を与えてみる。「同軸2ウェイスピーカー」だ。正直に言って、これは少しマニアックなので、まずムリだろうと思いつつオーダーした。
すると、なんということだろう。出力されたこの絵は、まさに同軸2ウェイスピーカーユニットそのものではないか。真ん中のユニットの固定のされ方が少し不自然だが、ユニットの真ん中にユニットがあるという特徴がしっかり表現されている。
AIさん、あんたすすごいよ。もうオーディオに関すること、かなり知っちゃってるじゃん。感心しながら、次はオーディオ関連のアクセサリーを描いてもらうことにした。軽いジャブ程度の気持ちで「スピーカーケーブル」を描いて欲しいとお願いした。
うーん、判断に困るな。まず、ケーブルであるということは一目でわかる。スピーカケーブルは総じて長めのものが多いので、それについてもクリアしている。ただ、端子が1つしかないのはどうなんだ。これでは音を伝送できない。
では「両端に端子があるスピーカケーブル」とお願いしたら良いのか。実際に試して、出てきたものを見ると、やはりケーブルと端子の関係そのものがわかっていない様子だ。
一般に言われることだが、AIは、人間ならば当然知っているはずの常識がない。だからこういう自由な発想の絵が出力される。学習が進めば自然な絵が描けるようになる可能性も高いが、まだそこまでに至っていないようだ。
と、細かな突っ込みばかりするのも無粋だ。画像生成AIの実力は、いまのところこの程度ということで理解しておきたい。
最後に描いてもらったのは「オーディオ用インシュレーター」だ。正直これは、かなり正確なものを描いてくる可能性もあると思ったが、出力されてきたのはまったく斜め上のものだった。
何なんですか、これは。根本的に何かを勘違いしているように思える。それっぽいアルファベットをたくさん描いて、引き出し線も多くしてごまかしてもムダだぞ。この上にプレーヤーやアンプを置いても、音が良くなるはずとはとても思えない。正確性という意味では厳しいが、AIの自由すぎる発想力は実感できた。
最後にかなり破壊力のあるものが出てきたが、総じて「お絵描きばりぐっどくん」のオーディオに関する知識はかなり深いようだ。前回も書いたが、AIの進化のスピードはすさまじい。そのうち、AIが設計した音の良いオーディオ機器で音楽を楽しむ未来が到来しても不思議ではない。
かなり雑に見える絵もあったが、「けっこうわかってるな」と感じられるものもあり、あらためて最近の画像生成AIの進化のすごさを実感させられた。特に「調音された、豪華なオーディオルームに置かれたトールボーイスピーカーとオーディオシステム」とお願いしたときに出力された絵には驚かされた。
そこで思ったのが、Stable Diffusionをベースにした画像生成AIサービス「お絵描きばりぐっどくん」は、かなりオーディオについて詳しいのでは…?ということ。オーディオ機器のデータについても、しっかり学習しているように思える。
そこで今回は、AIがオーディオ関連の知識を持っているのかテストしてみよう。あえて「ちょっと難しいかな」と思うものから出題してみることにした。最初に描いてもらったのは、ずばり「オーディオ用電源」だ。
正直、オーディオ用電源といっても色々なものがある。だから少し意地悪なオーダーなのだが、据え置き型の電源機器を描いてくるあたり、着眼点が良い。
上側の機器には、なんとなく電気の波形と見えないこともない意匠があしらわれており、「それっぽさ」をうまく表現している。唯一、アンテナなのか何なのか、屹立した黒い棒状のものが描かれているのが気になるが、まあ、細かいことは気にしないようにしよう。
さすがは「お絵描きばりぐっどくん」。かなり難しいと思われるお題を、なかなかの精度で返してきた。ならば、次のお題は楽勝だろう。「真空管アンプ」だ。
…もうこれは、満点に近い出来と言ってよいのではないだろうか。サイケデリックなカラーリングはオーディオらしくないが、突っ込みどころはそのくらい。そのほかはあまり文句のつけようがない。
ハードウェア関連はバッチリなようだと当たりを付けて、もう少し難しいお題を与えてみる。「同軸2ウェイスピーカー」だ。正直に言って、これは少しマニアックなので、まずムリだろうと思いつつオーダーした。
すると、なんということだろう。出力されたこの絵は、まさに同軸2ウェイスピーカーユニットそのものではないか。真ん中のユニットの固定のされ方が少し不自然だが、ユニットの真ん中にユニットがあるという特徴がしっかり表現されている。
AIさん、あんたすすごいよ。もうオーディオに関すること、かなり知っちゃってるじゃん。感心しながら、次はオーディオ関連のアクセサリーを描いてもらうことにした。軽いジャブ程度の気持ちで「スピーカーケーブル」を描いて欲しいとお願いした。
うーん、判断に困るな。まず、ケーブルであるということは一目でわかる。スピーカケーブルは総じて長めのものが多いので、それについてもクリアしている。ただ、端子が1つしかないのはどうなんだ。これでは音を伝送できない。
では「両端に端子があるスピーカケーブル」とお願いしたら良いのか。実際に試して、出てきたものを見ると、やはりケーブルと端子の関係そのものがわかっていない様子だ。
一般に言われることだが、AIは、人間ならば当然知っているはずの常識がない。だからこういう自由な発想の絵が出力される。学習が進めば自然な絵が描けるようになる可能性も高いが、まだそこまでに至っていないようだ。
と、細かな突っ込みばかりするのも無粋だ。画像生成AIの実力は、いまのところこの程度ということで理解しておきたい。
最後に描いてもらったのは「オーディオ用インシュレーター」だ。正直これは、かなり正確なものを描いてくる可能性もあると思ったが、出力されてきたのはまったく斜め上のものだった。
何なんですか、これは。根本的に何かを勘違いしているように思える。それっぽいアルファベットをたくさん描いて、引き出し線も多くしてごまかしてもムダだぞ。この上にプレーヤーやアンプを置いても、音が良くなるはずとはとても思えない。正確性という意味では厳しいが、AIの自由すぎる発想力は実感できた。
最後にかなり破壊力のあるものが出てきたが、総じて「お絵描きばりぐっどくん」のオーディオに関する知識はかなり深いようだ。前回も書いたが、AIの進化のスピードはすさまじい。そのうち、AIが設計した音の良いオーディオ機器で音楽を楽しむ未来が到来しても不思議ではない。
- トピック
- AI