ニュース

公開日 2024/04/04 14:47

オーディオクリップを生成に使う場合は著作権に注意

Stability AI、CD音質で3分間の曲を生成できる「Stable Audio 2.0」発表

Munenori Taniguchi

Stability AIは、同社のAI音楽生成プラットフォームをアップグレードした「Stable Audio 2.0」を発表した。このツールは無料で、同社のウェブサイトで一般公開されている。

このAIは、ユーザーが楽曲をイメージする文章を入力することで、最大3分のオーディオデータを生成できる。前バージョンは最大90秒だった。

3分というのは一般的なシングル曲に多い時間であり、イントロ、ヴァース（Aメロ）、プリコーラス（Bメロ）、コーラス（サビ）、ブリッジ（Cメロ）、そしてアウトロと、完全な構成の楽曲を作れる長さと言えそうだ。

楽曲の生成はテキストプロンプトで行うが、ユーザーが用意したオーディオクリップをアップロードすることも可能だ。システムはこのクリップを分析して似たような調子の楽曲を生成できる。

ただし、アップロードするクリップは著作権に関してクリアでなければならないので注意が必要。オーディオをアップロードするなら、たとえばドラムのパートを口ずさんだものをドラムの音に “清書” したり、十数秒ほどの短い著作権フリーなクリップをもとに時間を延長した楽曲を作るのに良いかもしれない。ちなみにStable Audio 2.0そのものは、ストックオーディオサービス「AudioSparx」のライブラリからライセンスを取得したデータセットのみを使用してトレーニングされている。

Stable Audio 2.0を使ってできあがる楽曲は、最初はクールに思えるかもしれないが、何度も生成していくと、少々気になるところも出てきそうだ。たとえば、このシステムはボーカルパートを追加することができるが、ボーカルに聞こえるだけで人が理解できる言語ではない。クジラの鳴き声のように聞こえる場合もあるようだ。

また、出力された楽曲では、その中で特定のパートが消えたり、別のものに変わってしまったりすることもあるとEngadgetは伝えている。それは、AI生成画像における人物の指や歯がやたらと多かったり、あるはずの部分がなかったりするようなものに例えられるかもしれない。

最大3分とはいっても、おそらくまだAIが生成する楽曲は、生身の作曲家が感情や心の中の情景を反映させて作り上げる作品にはほど遠そうだ。このAI音楽生成プラットフォームに適する使い道としては、ビデオクリップを多少賑やかにするための、当たり障りのないBGMなどになるのかもしれない。

Source: Stability AI, Stable Audio
via: Engadget

1	月額3万円の最強ChatGPTに「電源で音質が変わるか」と聞いたら意外な展開に
2	その男を怒らせてはいけない！ “絶対に死なない”伝説の老兵がツルハシ1本で敵を討つ
3	【完全ワイヤレスイヤホン特集 PART.10】音のプロが選ぶベストバイは？
4	QobuzもAmazonもこれ一台！コスパ抜群、機能も満点。ストリーマーの決定版「WiiM Ultra」を徹底ハンドリング
5	CD再生とファイル再生の架け橋に！Shanlingからリッピング機能付きトランスポート「CR60」が登場
6	「オーディオのオンキヨー」復活へ。新スピーカーとセパレートシステムを年明けのCESで発表
7	AVIOT、『らんま１/２』コラボ完全ワイヤレスイヤホン。完全新録ボイス240種類以上搭載
8	水月雨、『崩壊：スターレイル』とのコラボ完全ワイヤレス。ダイナミック＋環状平面駆動の同軸ドライバー搭載
9	今こそ「ミニコンポ」が面白い！デノン／マランツ／B&Wの令和ライフにマッチする厳選5モデルレビュー
10	トップウイング、ネットワークオーディオの光絶縁を手軽に試せる「OPT ISO BOX」

トップページへ戻る

ジャンル

カテゴリ

ニュース

Stability AI、CD音質で3分間の曲を生成できる「Stable Audio 2.0」発表

新着クローズアップ

クローズアップ

WEB