「ぼかりす」で何を創るのか
初音ミクにリアルな歌声を与える技術として数日前から世間を賑わしている「ぼかりす(VocaListener)」。
これはなんだ?という祭りから、その正体が判明するまで。
現在は、産総研の研究でした、5月28日に発表します、といった中の人が明かしたことでちょいと落ち着いている次第。
なんで今頃これについて書いているのかというと、私はこの「ぼかりす」についてさっぱり興味が無いからだったりする。そういうい事を明言するのもどうかと思うけれども。
おそらく冷めてみている一番の理由は、
- みんなで利用でき、育てる事のできるキャラクターである
- オリジナル楽曲を作って発表するという敷居を下げた
- 初心者でもDTMの楽しさを存分に味わえた
という、初音ミクやVOCALOIDシリーズがもたらした世界を「ぼかりす」は増長してくれない、と思っているからだろう。
その先に見えるものは「KEY THE METAL IDOL」の鬱瀬美浦とPPORであって、時祭イブやシャロン・アップル(最近だとレモンエンジェルプロジェクトか)ではないのだよな。
声色チェンジャーというフィルターが欲しいのではなく、オリジナル作品が作れるジェネレーターが欲しいのですよ。
SFとしてもそこそこ面白かったストーリーゲーム「ポリスノーツ」ではニュースキャスターのデータを蓄積してあって、顔色が悪い時にCG映像で補正をかけたり、そもそも存在しないときは精度が悪くなるけれども全てコンピューター合成で放送を続けるといった世界が描かれている。
人間が不要になるわけではないというのには同意するし、そういった場面ではこういったテクノロジーアシストが普及していくべきだとも思う。
つまり、目指すところが違うんじゃないかなと。
リアルの補助として進歩すべき技術と、リアルから離れた娯楽として進歩すべき技術。
娯楽においてリアルをシミュレートすることで向上していく楽しさは、ある程度現実に近づいたところでフッと面白くも何ともないものに変わってしまう。そこまで行き着くと、今度はリアルで表現できない物に楽しみを見いだしまた歩み始めるものなのですよ。(で、またあるところでUターンして適度なリアルを求めたり)
では純粋に技術として楽しめるかどうかだけれども、別段新しい手法では無かったりする。
私も以前PitchBend抽出を初音ミクに適用させる実験を行っているけれども、これはオリジナルアイディアではない。
私が知っているところでは、2008年1月7日にニコニコ動画に投稿された【鏡音リン鏡音レン】リンリンシグナル【Full Ver.】オリジナル01が、ツールでピッチ抽出を行ってVOCALOIDに適用している。シグナルP伝説のスタート地点ですな。
ニコニコのほうだと説明文が変わっちゃってもう読めないけれども
「あとピッチベンドも書くのがめんどかったので実際に人が歌 ったのをRecしてAutoTuneで音程 のデータを吸い出して、それをVOCALOIDに追従させる事によって、かなり自然な 歌い方に出来たと思います。」
といった手法を説明していた。(Youtube転載分の情報部分で今も読めるよ)
当時は「神調教」という賛辞に混じって「歌からパラメータを取り出すのはチートじゃね?」「高いツール使ってれば当然」と結構荒れた意見も多かったと記憶する。そういったことと関係があるのかわからないけれども、シグナルPは2作目以降ピッチ抽出法を使わずに通常の調整を行う様になった。まあ、このへん手間と結果のバランスを考えての事じゃないかと想像するんだけれども。
なので「ぼかりす」の技術的な部分で盛り上がっている人は「リンリンシグナル」の時点で盛り上がっているべきなんではないかと思ってしまうわけですよ。今回はピッチだけでなく音圧も適用しているから確実に進歩しているけれども。
まあ、今回の「ぼかりす」祭りではそういった技術が積み重なって、多くの人に伝えることのできるデモが完成したということなんでしょうな。
わかりやすいデモ、じゅーよー。
どちらかと言うと本当に興味深いのは1ヶ月に1回は話題や問題を振りまいて陳腐化しない「初音ミク」という存在そのものではないだろうか。実体はなくても確かに存在している、そんな気がする。