• ブランド
    特設サイト
ガジェット 公開日 2022/12/19 16:41

入力テキストを音楽にするAI「Riffusion」公開。文字を画像化し音に変換

音を絵で表すスペクトログラムを学習
Gadget Gate
Munenori Taniguchi
  • Twitter
  • FaceBook
  • LINE
音楽を生成するAIというのはすでに何種類か存在するが、Seth Forsgren氏とHayk Martiros氏が趣味のプロジェクトとして開発した「Riffusion」は、テキストの構文をもとに音の視覚的な表現であるスペクトログラムを作成し、それをオーディオとして再生するという、一風変わったAIモデルだ。

テキスト入力で画像を生成するAIとしては、拡散モデルを使った「DALL・E 2」が少し前に話題になった。そのDALL・E 2と同じ種類の「Stable Diffusion 1.5」が、この音楽生成AIのベースとなっている。

音を画像で表現するスペクトログラムは、X 軸で時間、Y 軸で音の周波数を表し、色で音の振幅を表現する。ForsgrenとMartirosは、サウンドを表現するスペクトログラムのサンプルを大量に作成し、その画像にblues guitar、jazz piano、afrobeatなどといった、関連する音楽を示すワードを紐付けた。

そして、これを使ってAIモデルをトレーニングすることで、ある音が「どのようなものか」「どのように再現したり組み合わせられるか」などといったことが次第にわかり、スペクトログラムと拡散モデルによって、音色を他の音色に変えるようなことも可能になったという。

Riffusionのウェブページでは、画面の左側に、入力されたテキストによって生成されたスペクトログラムが連続して表示され、それをもとにしたオーディオをリアルタイムで再生するようになっている。音楽スタイルを組み合わせてこれまでにない音楽ジャンルを生み出すことも可能だ。

ただ、自分で入力したテキストでは思ったような音楽が出力されないこともある。そのときは、テキスト入力窓の左にあるサイコロのアイコンをクリックすれば、プリセットされた構文が表示されるのでこれを実行してみると良いだろう。きっと、ああなるほどな、と思える音楽が再生できるはずだ。

Forsgren氏は「Haykと私は単に音楽が好きなもの同士というだけだったので、Stable DiffusionというAIがオーディオに変換できるほど、ちゃんとしたスペクトログラムを生成できるのかもわからなかった」とTechCrunchに述べ「ひとつのアイデアが次のアイデアへと次々につながっていった」結果、Riffusionができあがったとしている。

音楽生成AIモデルはRiffusionが初めてというわけではない。少し前にはロンドンのAIスタートアップHarmonaiが、やはりStable Diffusionをベースに拡散モデルを使った「Dance Diffusion」なる音楽生成AIを公開している。また仕組みは違うが、2020年にはOpenAIが、ニューラルネットワークで音楽を生成する「Jukebox」を発表していた。さらにノンストップで音楽を生成するSoundrawのようなサービスもすでに存在する。

RiffusionはこれらのAIに比べると、もっとホビーの領域にあるものであり、生成される音楽もまだまだリスニング用途に耐えるものではない。それでも潜在拡散モデルの応用例としては、注目を集めそうだ。

Source: Riffusion
via: Ars Technica

この記事をシェアする

  • Twitter
  • FaceBook
  • LINE

トピック

クローズアップCLOSEUP
アクセスランキング RANKING
1 文化庁、BDレコーダーに掛かる私的録音録画補償金額を認可。1台当たり税抜182円が上乗せへ
2 テクニクス、新完全ワイヤレスイヤホン投入を予告。ティザー映像を公開
3 アップル初売りが新年1/2からスタート。対象iPhone購入で最大3万円のギフトカードをプレゼント
4 なぜ? 実は「大きいほど人気」なPolk Audioのスピーカー、全3シリーズの“大型モデル”比較試聴でわかった魅力
5 CD再生は “クロック” でさらに化ける!プロ機譲りの実力機、MUTEC「MC-3+」の音質グレードアップ技
6 評論家イチオシ!LUMIN「P1 mini」レビュー。「驚くほどの音質の良さが体験できた」
7 名盤『交響組曲宇宙戦艦ヤマト』の新たな船出。リミックスという選択に挑んだエンジニアの声を訊く
8 VGP2025・優秀賞獲得モデルから厳選!審査員5名が “絶対推し” のデノン/マランツ/B&W/DALI
9 アキュフェーズのフラグシップアンプ「E-800S」が堂々初登場3位<ハイファイオーディオ売れ筋ランキング11月>
10 Qobuz開始の波及効果大。ネットワークオーディオ関連の需要拡大<販売店の声・売れ筋ランキング11月>
12/27 12:04 更新
MAGAZINE
音元出版の雑誌
オーディオアクセサリー193号
季刊・オーディオアクセサリー
最新号
Vol.195
アナログ Vol.86 2024 WINTER
季刊・アナログ
最新号
Vol.86
オーディオアクセサリー大全2025~2026
別冊・ケーブル大全
別冊・オーディオアクセサリー大全
最新号
2025~2026
プレミアムヘッドホンガイドマガジン vol.22 2024冬
別冊・プレミアムヘッドホンガイドマガジン
最新号
Vol.22
プレミアムヘッドホンガイド Vol.32 2024 AUTUMN
プレミアムヘッドホンガイド
(フリーマガジン)
最新号
Vol.32(電子版)
VGP受賞製品お買い物ガイド 2025年冬版
VGP受賞製品お買い物ガイド
(フリーマガジン)
最新号
2025年冬版(電子版)
DGPイメージングアワード2024受賞製品お買い物ガイド(2024年冬版)
DGPイメージングアワード受賞製品お買い物ガイド
(フリーマガジン)
最新号
2024年冬版(電子版)
音元出版の雑誌 電子版 読み放題サービス
「マガジンプレミアム」お試し無料!

雑誌販売に関するお問合せ

WEB
  • PHILE WEB
  • PHILE WEB AUDIO
  • PHILE WEB BUSINESS
  • ホームシアターCHANNEL
  • デジカメCHANNEL
AWARD
  • VGP
  • DGPイメージングアワード
  • DGPモバイルアワード
  • AEX
  • AA AWARD
  • ANALOG GPX