• ブランド
    特設サイト
公開日 2023/07/18 12:29

「ChatGPT」を活用した新しい音楽レコメンド機能。自然な会話で楽曲検索が可能に

Volumioのベータ版で使用可能
佐々木喜洋
  • Twitter
  • FaceBook
  • LINE

楽曲検索に「AI」を活用、Volumioのベータ版が公開



先日開催されたポタフェスのトップウイングサイバーサウンドグループのブースにおいて、音楽再生ソフト「Volumio」の最新ベータ版を見ることができた。これは先日のVolumioの発表会でもアナウンスされていたが、検索にAIを採用した点が新しい。具体的には最近話題の生成AIのような自然言語に近いプロンプト(指示文)を検索欄で使用して検索が可能という機能のことだ。

ポタフェスで展示された「Volumio」シリーズ

この機能に興味を持って、その後Volumio開発者であるミケランジェロ氏とメールしてこの機能の詳細について聞くことができた。その結果、オーディオと今話題のChatGPTとの興味深い関係がわかってきた。

「Supersearch」(ベータ版)では自然言語で楽曲検索が可能に

このVolumioの新しいAI機能は「Volumio AI」と呼ばれるもので、この6月からベータ版がリリースされている。「Volumio AI」は先に述べたAI検索機能である「Supersearch」の他にも、アーティスト名やアルバム名をAIで関連づける「Related Artists and Albums」、曲が終了した時に似たような曲を続けて再生する(ラジオ機能とも呼ばれる)「Infinity Playback」の3つのAI支援機能から構成されている。これらの機能は「Related Artists and Albums」以外はVolumio Premiumユーザーのみに提供されるが、ChatGPT使用料などの追加料金はない。

スマートフォンアプリでも検索可能

これらの機能の中でも注目すべきはAI検索機能である「Supersearch」だ。このAI検索機能は最近話題のOpenAIであるChatGPTのAPIをVolumioに組み込んだものである。この機能は通常の検索と切り替えて使用することができる。これは検索バーの先頭にトグルスイッチが新設されたので、この切り替えによって「Supersearch」機能を使用することができる。

従来の検索では曲名の一部やジャンル名などの文字列をキーワードとして入力し、その文字列がデータベース中のメタデータの文字と一致するかどうかで検索していた。このChatGPTを応用した「Supersearch」モードにするとChatGPTで会話する時のように自然言語のプロンプト(指示文)で検索指示ができるようになる。

これは例を書いたほうが早いだろう。例えば“a long piece of music with dramatic and quiet parts alternating with dynamic parts”(静かなパートと動的なパートが繰り返される、ドラマティックな長い楽曲)という指示をした。これはプログレッシブロックを念頭においた指示だが、あえてジャンル名を使用せずに特徴を記述してみたわけだ。その結果が下記のスクリーン画像の通りだ。

実際の検索結果。キング・クリムゾンやYES、ピンク・フロイドなどが検索結果に登場する

まさに思った通りの検索結果が得られている。ちょっと驚くほどだ。プログレッシブロックの代表曲が並び、特に検索順位一番のクリムゾンの「エピタフ」はこの記述のイメージにぴったりの曲だ。ちなみに試しにApple Musicの検索欄に同じプロンプトを入力してみると単に「見つかりません。もう一度お試しください。」との表示がなされてしまう。

ChatGPT以外にも他のメタデータソースをハイブリッドさせて正確性を向上



この技術の背景についてミケランジェロ氏から詳しく話を聞いた。まずVolumioはクラウドベースのメタデータのデータベースをこの二年ほど採用しているそうだ。これはVolumio開発者の間では“metavolumio”と呼称されているとのこと。この“metavolumio”クラウドデータベースはアーティスト名やアルバム情報、バイオグラフィーなどが登録されている。メタデータに強いオーディオ向けのソフトウェアとしては日本ではRoonがつとに知られているが、実のところVolumioもその点では相当な実力がありそうだ。

VolumioのCEOであるミケランジェロ氏

そしてChatGPTが巷で話題になった時に、彼らはこの“metavolumio”クラウドデータベースにChatGPTを融合できないかと考えたという。しかしながら実装を試みるといくつかの問題が持ち上がったそうだ。それは他のAI応用システムでも耳にすることだが、まず“hallucinate(幻覚)”と呼ばれる、AIが明らかな誤答をするという問題がある。これは最近生成AIの話題でもよく取り上げられる問題の一つだ。またChatGPTのAPIの反応がとても遅いという問題もあったという。

これらの問題に対して、Volumioの開発者たちはChatGPTだけに頼らずに他のネット上のメタデータソースを対照させて正確性を上げるという手法を考案したという。いわばハイブリッドAI検索と言えるこうした工夫により、正確性だけではなく反応速度も向上させることができたそうだ。また面白いことにユーザーが入力するプロンプト自体を学習させることでさらに精度と反応速度を高めているという。これらの手法を主にクラウド側に適用することで、ユーザー側はファームウエアの更新が必要ないという利点も生まれた。

そしてこのAI機能はユーザーのライブラリの全てを対象として、SpotifyやQobuzなどのストリーミングサービスにおいても機能するように実装ができたということだ。

単に話題のAIを応用したというだけではなく、正確さを上げるために大変な努力をしたということがうかがえる話だ。Volumioユーザーはこの機能の公開を楽しみに待っていてほしいと思う。また今後オーディオの分野でもAIの応用が進んでゆく際に、その試金石ともなりうる試みとして注目すべき機能であると言えるだろう。

この記事をシェアする

  • Twitter
  • FaceBook
  • LINE
クローズアップCLOSEUP
アクセスランキング RANKING
1 ソニー、第2世代フラグシップ・ミラーレス一眼「α1 II」。画質、操作性を着実に強化
2 オーディオファイル待望の物量投入型プリメインアンプ!デノン「PMA-3000NE」をクオリティチェック
3 目黒蓮を“もっとそばに”感じられる特別イベント。「レグザミュージアム〜The 6 STORIES〜」11/21から原宿で開催
4 ボーズ、McIntosh Groupを買収。マッキントッシュ、ソナス・ファベールが傘下に
5 ビックカメラ.com、「2025年新春福箱」の抽選申し込み開始。全66種類、iPadやPS5も登場
6 覚えておくと絶対便利!iPhoneの「計測」アプリでできる、あんなことこんなこと
7 ビクター「HA-A6T」レビュー!5000円切り完全ワイヤレスイヤホンは「価格を上回るクオリティ」
8 高音質と機能性を両立する新たなスタンダード機!AVIOTのANC完全ワイヤレス「TE-V1R」レビュー
9 Meze Audioが打ち出す待望の入門モデル。開放型ヘッドホン「105 AER」&イヤホン「ALBA」の音質に迫る
10 新開発ユニットを巧みに操る懐深いサウンド。ELAC「Debut 3.0」フロア型/ブックシェルフ型を聴く
11/21 10:37 更新
MAGAZINE
音元出版の雑誌
オーディオアクセサリー193号
季刊・オーディオアクセサリー
最新号
Vol.194
オーディオアクセサリー大全2025~2026
別冊・ケーブル大全
別冊・オーディオアクセサリー大全
最新号
2025~2026
プレミアムヘッドホンガイドマガジン vol.22 2024冬
別冊・プレミアムヘッドホンガイドマガジン
最新号
Vol.22
プレミアムヘッドホンガイド Vol.32 2024 AUTUMN
プレミアムヘッドホンガイド
(フリーマガジン)
最新号
Vol.32(電子版)
VGP受賞製品お買い物ガイド 2024年冬版
VGP受賞製品お買い物ガイド
(フリーマガジン)
最新号
2024年夏版(電子版)
DGPイメージングアワード2024受賞製品お買い物ガイド(2024年冬版)
DGPイメージングアワード受賞製品お買い物ガイド
(フリーマガジン)
最新号
2024年冬版(電子版)
音元出版の雑誌 電子版 読み放題サービス
「マガジンプレミアム」お試し無料!

雑誌販売に関するお問合せ

WEB
  • PHILE WEB
  • PHILE WEB AUDIO
  • PHILE WEB BUSINESS
  • ホームシアターCHANNEL
  • デジカメCHANNEL
AWARD
  • VGP
  • DGPイメージングアワード
  • DGPモバイルアワード
  • AEX
  • AA AWARD
  • ANALOG GPX