2mixの分離ソフトが既に多数出ていて、AudioSourceREからはプラグイン版としてボーカルのみ分離するVoxlessが登場。NFRをいただいたので動作チェックしてみての感想を記します。
まず分離精度はかなりいい。
プラグインとして動作する際の重さについては、結構重め。44.1kHzを基準として動作するようにできているため、オーディオI/Oのサンプルレート、またオーディオデータも44.1kHzで動作したほうが断然軽いです。調べないと断言できませんが、もし律儀にサンプルレートコンバートしているのであれば、もっと単純な方法で負荷を減らす方法があるはず…。
オーディオエフェクトプラグインとしてマルチ出力を持っているため、対応DAWではボーカルとオケとで複数書き出しできたりするでしょう。ただ、このプラグインを差した状態のまま楽曲などの制作作業をするってのは(もともとの処理負荷を考えても)現実的ではないので、どの道いったんオーディオファイルとして書き出して作業することになるでしょうから、マルチ出力のメリットってあくまで一時的なものって気がします。対応してないDAWも多いですし。
多少重いとはいえ、STEM 2.0になってリアルタイムでの分離がほぼ問題なく行えるようになってきていて、これを待ってたという境遇の方もおられるでしょう。そうした方にはいいチョイスだと思います。
追記:
その後ちょっと気になって試したのですが、分離処理結果は毎回異なるようです。ハッキリとは言えませんが、これがSTEM2.0における処理速度向上とのトレードオフ部分かもしれません(STEM2.0を採用してるのかわかりませんが)。
これが何にどう影響するかというと、既述のようにプラグインエフェクトからのマルチ出力をバスで受け取れるDAW環境(単純にはLogic不可)ならば、ボーカルとオケとを分離したものを再ミックスして元通りの音が得られる(可逆分離)けれど、そうでないDAWだとその手法が現状不可能です。たとえば混ぜると歪んでしまったりガサガサの音になってしまったりします。
加えて、分離したボーカルステムを逆相にして元の音源と混ぜれば、可逆分離に対応したオケが得られるのがこれまでの定石でしたが、どうもこれも上手くいかないっぽい。微妙にサンプルがズレるのか、それとも何らかの形で速度が不安定になるのか。
ゆえに、可逆分離を想定して導入される方で、もしもLogicをお使いの方がいらっしゃったなら、少なくとも現バージョンでの本ソフトの導入を見送ったほうがいいと思います。
Logicで完全に不可能なんだろうかと思って、一つ思いついたのは、DDMF MetapluginなどのプラグインチェイナーをMIDI制御エフェクトとして立ち上げ、可能ならマルチアウトに切り替え、プラグインチェイナー内にVOXLESSを読み込むってのがあります。Metapluginはモノ/ステレオ/5.1の出力のみですが、5.1出力してバウンスしてチャンネル分離すれば完全に不可能でもないかもしれない。
Metaplugin以外のプラグインチェイナーは、いずれ何か機会があればリストアップするなりしてみますが、いま手元にあるExcite AudioのChain Leader/Followerはプラグインエフェクトとしての動作のみなので不可。