「週刊 スタジオ翁」ニュースレターの登録はこちら

iZotope RXを超えた?LALAL.AIのボーカル分離技術がすごい

記事内に商品プロモーションを含む場合があります

すごいツールが出てきました・・・

「LALAL.AI」という、声と楽器を分離させるツールなのですが、完全にiZotope「RX」(業界標準ソフト)を超えています。

LALAL.AI

ミュージシャンや歌い手が、録音時に入ってしまったノイズを取り除くのにも使えますし、ビデオグラファーやYouTuberの方が、インタビュー時のノイズを超簡単に取り除いたり、意図せず動画に入ってしまった音楽を取り除き、著作権上の問題をクリアにするのにも使えます。

実際に仕事でも使ってみているのですが、人工知能や機械学習のスペシャリストが集まったチームだからこそ実現した、この圧倒的精度の音声分離ツール「LALAL.AI」は、音に関わるすべての人に有益なツールだと感じました。

今日は、この素敵な音声分離ツールについて書いていきます。

LALAL.AIについて

LALAL.AIは、人工知能や機械学習のスペシャリストが集まったチームで、これまでに「Rocknet」「Cassiopeia」「Phoenix」といった、独自のニューラルネットワークエンジンを開発しています。

少し前までは、ブラウザベースのツールだったのですが、最近はデスクトップアプリやiOS版も出ていて、どんどん使いやすくなっていますね。

大きな特徴は、「ボーカル」「ドラム」「ベース」「アコギ」「エレキギター」「ピアノ」「シンセサイザー」「弦楽器」「金管楽器」「木管楽器」という10種類のステムを認識して分離する技術で、これは世界初であり、精度においてもこれまでのニューラルネットワークだけでなく、市場に出回っている他のすべてのソリューションを凌駕しているとのこと。

なんだか大袈裟に聞こえますが、実際に使ってみれば、これが誇張でないことがわかります。

音源サンプルは後ほど紹介するとして、先にLALAL.AIの概要から説明していきます。

まず、LALAL.AIには、主に「Stem Splitter」と「Voice Cleaner」という2つのツールがあります。

Stem Splitter
Voice Cleaner
  1. Stem Splitter – 1つの音楽から、ボーカル、ドラム、ベース、ギター、シンセなどをステムとして分離する
  2. Voice Cleaner – BGM、ボーカルの雑音、不要なノイズを除去して、声を綺麗にする

Stem Splitterはボーカルを分離させるだけでなく、10種類の楽器を認識して分離します。

Djay」という有名なDJアプリには「Neural Mix」という似たような機能がありますが、こちらは「ボーカル」「リズム隊」「楽器」の3つにしか分離させることができませんし、この手の業界標準ソフトであるiZotope「RX」でも、「ボーカル」「ベース」「パーカッション」「その他」の4つにしか分離させることができないので、LALAL.AIが10種類もの楽器を認識できるというのは、かなり優れた技術であることがわかるでしょう。

iZotope「RX」のMusic Rebalance機能

料金プランは「90分1,900円」というふうに、時間単位で購入できるようになっています。

6種類のプランがあり、最上位の「Enterprise」なら80時間以上もの音源を分離することができますが、大抵の人はそこまでたくさん使うことはないでしょうから、まずは一番安い「Lite pack」か、その次の「Plus pack」で十分だと思います。

Standard Volume Plan
High Volume Plan

精度は本当にいいのか?iZotope RXと比較した感想

LALAL.AIの公式ページには、オーディオサンプルが載っているので、そこからサンプルを拝借してきました。

こちらは、Voice Cleanerを使って、バックグラウンドノイズを取り除いたものです。

オリジナル
LALAL.AIで処理

「サー」というノイズが、かなり綺麗に取れていることがわかります。

ちょっと「ウニャウニャ」と、変なエフェクトがかかったような音になっている部分がありますが、これが精度の悪い分離ツールだともっと目立ちます。

次のサンプルでは、Stem Splitterを使って、ボーカル・ギター・ドラムが入った楽曲を、「ボーカル」「楽器」の2つのステムに分離させています。

オリジナル(ボーカル+楽器)
ボーカルを抽出
楽器を抽出

これはかなりの精度で抽出できていて、不自然なノイズ(アーティファクト)も、ほとんど入っていません。

こういったシンプルな楽曲を処理したり少量のノイズを取り除く分には、他のソフトとあまり変わりませんが、いろんな楽器が入っている曲だったり、バックグラウンドノイズが目立つレコーディングだと性能の差が出やすいです。

僕が使った時も「RXという業界標準ソフトで声を抽出しようとすると不自然だったものが、LALAL.AIだとより自然に取れた」ということがありました。

僕は仕事柄、RXを使うことのほうが多いですが、RXを使ってもうまく声を抽出できない時は、LALAL.AIに頼ることがあります。

RXより自然に処理できるなら、世界最高峰のツールだといっても過言はありません。どのツールを選ぼうか迷った時は、LALAL.AIを選んでおけば間違いないと思いますね。

LALAL.AI

LALAL.AIの活用方法 

公式ページには、LALAL.AIはどんな人に使われるツールなのか?が書かれています。

それが、以下の4つです。

  1. ストリーマー
  2. トランスクライバー
  3. ジャーナリスト
  4. ミュージシャン

このブログをご覧になっている方は、音楽を作る人が多いかと思いますが、音楽に関係のない人でもLALAL.AIを活用する方法はあります。

むしろ、通常の音楽系ソフトよりも操作が簡単で高性能なので、ミュージシャン以外の方にこそ使われるべきツールだと思います。

これら、4つの活用法を具体的にみていきましょう。

1. ストリーマー

ストリーマーとは、YouTuberのような人のことですね。

例えば、YouTubeに動画を上げたいけれど、後ろで音楽が流れているので、著作権の関係上載せられないという人に、LALAL.AIはピッタリです。

映画業界や音楽業界で使われるソフトよりも簡単で高性能ということであれば、LALAL.AIを使わない手はありません。

個人で映像を作ったりインタビューを行ったりする、ビデオグラファーの人にもピッタリのツールだと思います。

2. トランスクライバー

トランスクライブとは、映画やビデオの声を、文字起こしすることです。

映画やビデオからダイアログだけを抽出できれば、それを専用ソフトに入れて自動で文字起こしをしたりできますし、人間が手作業で行うにしても作業効率がグンと上がるでしょう。

3. ジャーナリスト

インタビューなどの録音物は、必ずしも、静かな環境で録られるわけではありません。

周りのノイズを取り除いてクリアな音声にすることで、ジャーナリストは素早く録音物の内容をチェックすることができます。

4. ミュージシャン

自宅で音楽を作る人は、ボーカルレコーディングの際にノイズが入ってしまうこともあるでしょう。

LALAL.AIを使えば、ボーカルへの影響を最小限に抑えつつ、周りのノイズを取り除いてクリアな音に仕上げることができます。

あと、著作権の関係もあるので難しいかもしれませんが、好きな曲のギターリフやボーカルなどの一部を抽出し、自分の曲に使う、いわゆる「リミックス」もLALAL.AIを使えば簡単にできるようになりますね。

個人で楽しむ分には全く問題ないですが、一般にリリースするなら

LALAL.AIにデメリットはあるか?

ここまで散々褒め称えてきたLALAL.AIですが、デメリットがあるとすれば、プラグインとしてDAWの中で使えないということくらいでしょうか。

ここは、「サクッと、ボーカルからノイズを取り除ければOK」というユーザーにはあまり関係のない話ですが、Pro ToolsなどのDAWを使っている人は、業界標準のノイズ処理ソフトであるRXの方が使いやすいと思います。

声や楽器を分離させることに関してはRXを超えていますが、それ以外の、例えば「衣擦れを取り除く」「風の音を取り除く」「オーディオファイルの一部を自然に消す」「ハムノイズを取り除く」といった細かい作業は、LALAL.AIにはできません。

なので、僕も映画の整音をする時はLALAL.AIを使うことはほとんどなく、基本的にはiZotope「RX」で完結させています。

RXでは完全に分離できなかったり、RXを開かず、すぐにノイズを取り除きたいといった時だけ、LALAL.AIを利用している感じですね。

なので、RXを持っている人には、LALAL.AIはあまり必要ないのかなと思います。

まとめ

LALAL.AIにはデスクトップ版やiPhone版もありますが、ブラウザベースで動くので、何かをダウンロードする必要もなく「手軽で高性能」というところが大きな魅力だと思います。

音楽制作をする人はもちろんですが、例えばフィールドレコーディングをする方、インタビューをする方、YouTubeに動画を上げる方などにもピッタリのツールです。

気軽にYouTubeに載せる動画なんかだと、ノイズのことはあまり気にしないかもしれませんが、仕事だったりプロモーションのための映像にノイズが入っているのは、あまり好ましくありませんよね。

最近、動画を撮るようになって、音声のノイズが気になってきたという方には特におすすめ。一番安いプランだと、1,900円で90分の音声を処理できるので、値段もかなり良心的です。

公式ページに行けば無料で試せるので、気になった方は、まず試してみるのが良いかと思います。

LALAL.AI

ニュースレターやってます。

最新の音楽AI事情、DTMに役立つコンテンツ、世界の音楽ニュースなどを毎週金曜日にニュースレターで配信しています。

無料です。

https://studiookina.beehiiv.com/

この記事の著者

Isseyのアバター Issey 作曲家、音響エンジニア

23歳で音楽制作を始め、「Ohme」「Issey Kakuuchi」名義で国内外のレーベルからリリースを行なっている。 クラブやライブイベントの音響エンジニアとしてキャリアをスタートさせ、現在は映画の作曲、MA、アーティスト活動に加えて、音楽アプリ、オウンドメディア、医療クリニックへの楽曲提供など、様々な分野で活動している。

著書: AI時代の作曲術 - AIは音楽制作の現場をどう変えるか?