• ブランド
    特設サイト
ガジェット 公開日 2022/12/19 16:41

入力テキストを音楽にするAI「Riffusion」公開。文字を画像化し音に変換

音を絵で表すスペクトログラムを学習
Gadget Gate
Munenori Taniguchi
  • Twitter
  • FaceBook
  • LINE
音楽を生成するAIというのはすでに何種類か存在するが、Seth Forsgren氏とHayk Martiros氏が趣味のプロジェクトとして開発した「Riffusion」は、テキストの構文をもとに音の視覚的な表現であるスペクトログラムを作成し、それをオーディオとして再生するという、一風変わったAIモデルだ。

テキスト入力で画像を生成するAIとしては、拡散モデルを使った「DALL・E 2」が少し前に話題になった。そのDALL・E 2と同じ種類の「Stable Diffusion 1.5」が、この音楽生成AIのベースとなっている。

音を画像で表現するスペクトログラムは、X 軸で時間、Y 軸で音の周波数を表し、色で音の振幅を表現する。ForsgrenとMartirosは、サウンドを表現するスペクトログラムのサンプルを大量に作成し、その画像にblues guitar、jazz piano、afrobeatなどといった、関連する音楽を示すワードを紐付けた。

そして、これを使ってAIモデルをトレーニングすることで、ある音が「どのようなものか」「どのように再現したり組み合わせられるか」などといったことが次第にわかり、スペクトログラムと拡散モデルによって、音色を他の音色に変えるようなことも可能になったという。

Riffusionのウェブページでは、画面の左側に、入力されたテキストによって生成されたスペクトログラムが連続して表示され、それをもとにしたオーディオをリアルタイムで再生するようになっている。音楽スタイルを組み合わせてこれまでにない音楽ジャンルを生み出すことも可能だ。

ただ、自分で入力したテキストでは思ったような音楽が出力されないこともある。そのときは、テキスト入力窓の左にあるサイコロのアイコンをクリックすれば、プリセットされた構文が表示されるのでこれを実行してみると良いだろう。きっと、ああなるほどな、と思える音楽が再生できるはずだ。

Forsgren氏は「Haykと私は単に音楽が好きなもの同士というだけだったので、Stable DiffusionというAIがオーディオに変換できるほど、ちゃんとしたスペクトログラムを生成できるのかもわからなかった」とTechCrunchに述べ「ひとつのアイデアが次のアイデアへと次々につながっていった」結果、Riffusionができあがったとしている。

音楽生成AIモデルはRiffusionが初めてというわけではない。少し前にはロンドンのAIスタートアップHarmonaiが、やはりStable Diffusionをベースに拡散モデルを使った「Dance Diffusion」なる音楽生成AIを公開している。また仕組みは違うが、2020年にはOpenAIが、ニューラルネットワークで音楽を生成する「Jukebox」を発表していた。さらにノンストップで音楽を生成するSoundrawのようなサービスもすでに存在する。

RiffusionはこれらのAIに比べると、もっとホビーの領域にあるものであり、生成される音楽もまだまだリスニング用途に耐えるものではない。それでも潜在拡散モデルの応用例としては、注目を集めそうだ。

Source: Riffusion
via: Ars Technica

この記事をシェアする

  • Twitter
  • FaceBook
  • LINE

トピック

クローズアップCLOSEUP
アクセスランキング RANKING
1 「Amazon プライムデー」本セールが7月16日0時からついにスタート!安くなるものを事前チェック!
2 ヨドバシやビック、Amazonプライムデーより安い超特価セール実施中!見比べないと損をする
3 【レビューあり】Amazonプライムセール、JBLの人気サウンドバー「BAR 1000/800」が激安!
4 Amazonプライムデー先行セールで「半額」「半額以下」で買えちゃうイヤホン・ヘッドホン
5 Amazonプライムデー、FireTV Stick 4K/4K Maxが過去セール超えの大幅割引中
6 Amazonプライムデー、オーディオテクニカのTWS、ヘッドホン、マイクが多数お買い得に!
7 Amazonプライムデー、読み放題・聴き放題などサブスクも無料に! 登録すべきキャンペーンまとめ
8 Prime Videoの有料チャンネル「アニメタイムズ」が60日間無料。7/17まで
9 ノジマとオーディオスクエアのシナジーで“テレビの音の最適解”を案内。存在感を増すネットワーク&HDMI対応アンプ
10 <ポタフェス>FIIOやiFi audioに「本邦初公開」多数/Noble Audio「FoKus TRIUMPH」は今夏発売
7/16 10:43 更新
MAGAZINE
音元出版の雑誌
オーディオアクセサリー193号
季刊・オーディオアクセサリー
最新号
Vol.193
オーディオアクセサリー大全2024~2025
別冊・ケーブル大全
別冊・オーディオアクセサリー大全
最新号
2024~2025
プレミアムヘッドホンガイドマガジン vol.21 2023 WINTER
別冊・プレミアムヘッドホンガイドマガジン
最新号
Vol.21
プレミアムヘッドホンガイド Vol.31 2024 SPRING
プレミアムヘッドホンガイド
(フリーマガジン)
最新号
Vol.31(電子版)
VGP受賞製品お買い物ガイド 2024年冬版
VGP受賞製品お買い物ガイド
(フリーマガジン)
最新号
2024年夏版(電子版)
DGPイメージングアワード2023受賞製品お買い物ガイド(2023年冬版)
DGPイメージングアワード受賞製品お買い物ガイド
(フリーマガジン)
最新号
2023年冬版(電子版)
音元出版の雑誌 電子版 読み放題サービス
「マガジンプレミアム」お試し無料!

雑誌販売に関するお問合せ

WEB
  • PHILE WEB
  • PHILE WEB AUDIO
  • PHILE WEB BUSINESS
  • ホームシアターCHANNEL
  • デジカメCHANNEL
AWARD
  • VGP
  • DGPイメージングアワード
  • DGPモバイルアワード
  • AEX
  • AA AWARD
  • ANALOG GPX