Fadr "SynthGPT"

■目次

Fadr “SynthGPT”
余談: ステム分離プラグインの、動作環境による結果の違い
生成と精魂との差がかえってあらわに

Fadr “SynthGPT”

Fadr.comからSynthGPTなるサービスのアップデート連絡が来てました。

余談: ステム分離プラグインの、動作環境による結果の違い

Stemsなるステム分離ツール（VST3/AUプラグイン）もリリースしてるようです。

初っ端から余談になりますが、こうしたプラグイン方式のステム分離ツールは導入に関して注意を必要とします。要は出力されたステムをまたガチコン合わせたときに完全に元の姿に戻るかどうか。

先刻ご存知の方には余談中の余談になりますが。
DAWの非破壊処理音声（Logicでいえばflexなど）同様のリアルタイム処理する手法だと、DAWで再生開始するたびに結果が異なる場合があり、入力音声の分離出力を考慮していないAudio Unitsを使用するDAWでは、ステム取得するために複数回バウンスするか同一音声ファイルを設定違いで複数トラックに貼って処理するかしないといけない。
そうすると、後でガチコンしたときに元の姿に戻る可能性が低くなってしまいます。
ステムを使用する用途によってはAudio Unitsと相性がよろしくないわけです。

滅多にないことだとは思いますが、ミックスしてくださいと作家さんから送ってこられるステムがLogicで分離ツールを通じて作成されたものだと、エンジニアから「いやいや、そういうステムでなくて。それどころかそのまま混ぜてもヒドい音なんすけど…」と言われるものになる可能性がありますね。まあ、渡す前に自分のとこでの確認もしてないんかい、って話もありますが。
滅多にないとはいえ、あり得ることは考慮しないといけないのがこの世界であります。

生成と精魂との差がかえってあらわに

で、SynthGPT。デモを聞くと、案外悪くない。

BGMとしてふんわり流す用途であれば、リスニングサービスにサブスク料金支払ったりする必要がなくなるレベルの出来ではあると思います。Demo 3の58bpmって、どこが？ってのもありますが。それは措いときましょう。

精魂込めて作られる楽曲と何が違うのか相対的に（差分として）見えてくる面ありますね。自分が感じる部分としては、音色のセンスが決定的に生煮え（Demo 2）な印象なのと、数小節程度ならこれでいいとして一曲を仕立てようとした場合にどうすんねんってとこ。

ガツッとまとめて言えば、このままじゃBGMに使えても流通には乗せらんない。
そうなってくると、これを材料として使うと考えざるを得ませんが、材料とするにあたってオーディオファイル、MIDIファイル、あるいは音色ファイル等の中間ファイルを持つ必要が生じてくるだろうし、ならばそれを想定したAIの仕組みを必要とすることになります。
もしくは出力内容の具体化を可能にしていくために、DAWとプラグインっていう既存の音楽制作方式と一線を画した専用のインターフェース（たとえば音色編集に際しては、SistemaやSyndtSphereのようにベクトルで大まかに指示するとか、SynPlantのように参照対象となる音色を投げ込むなど）を備えさせるなど。そうなるのも充分に面白くはありますがね。

ともかく現段階でモヤっとした部分が多々あり、高額でないとはいえ、これだけの情報で自腹でサブスク登録する気は起きない、ってのが正直なところです。

とはいえたぶん、今後こういうリリーススタイル、増えていくんだろうなあという気はしますね。全部ウォッチしようとしたら破産するぜ、これ。

Fadr “SynthGPT”

余談: ステム分離プラグインの、動作環境による結果の違い

生成と精魂との差がかえってあらわに

関連記事