月読アイを使ってみよう


我が家にやってきた月読アイちゃんをさっそく酷使していつもの動画を作成。

一番の問題はコメントの数だけ音声ファイルを作る必要があると言うこと。
一番最初のコメント読み上げ動画で AquesTalk を使用したのは、フリーで利用できるというのもあったけれどもそれ以上にDLLを直接使えるAPIが公開されていることが大きかった。コメントを1つ1行でテキストにまとめて記述して、そこから一行ずつ取り出して AquesTalk を呼んでwavファイルを作成するというプログラムを作った。これで500個のコメントをバッチで一気に生成することができた次第。
さて、今回利用する月読アイではDLLを直接利用することができず、Tcl/Tkで作成されたAI-Talkアプリを利用する必要がある。さらに悪いことに今回はコメントが1000個あるといった状況。音声wavファイルを作るには、アプリからテキストを開いて出力ボタンを押し出力ファイル名を指定するといった作業を行う必要がある。それを1000回繰り返すのはなんて苦行それ?
そこで、Windows操作を記録再生、自動化できる UWSC 用のスクリプトを書いて何とか自動化した。

voice_comment1.jpg
動画に合わせてコメント音声を並べる作業だが、一番最初の時は SONAR 上で一個一個音声を置いていくかたちで作成していた。これをタイミング合わせながら500個並べるのに2日ほどかかった覚えがある。
今回は1000個のコメントということでとてもじゃないが手で並べる気は起きなかった。なので今回は時間指定リストとコメント音声ファイルを与えると時間通りに合成して11分弱のwavファイルを吐くようなプログラムを突貫で作成している。作り捨ての一回利用なツールですな。

そんなこんなでできた動画を見てもらうとわかるようにかなりやかましい。10分の動画でコメント500個がちょうど良い音声密度になるのはわかっていたけれども、ニコニコ動画の本プレイヤーでコメント総数を変化させて再生することができなかったのでやむを得ず1000個になっている次第。
あと、wwwとかは「だぶりゅだぶりゅだぶりゅ」と読んでしまうとか、専門用語が正しく読めないとか、「あはは」の「は」を接続詞と認識してしまい「アワハ」になってしまうとかがあって読み上げテキスト自体は手作業で編集修正している次第。けれども「秋月(あきつき電子商会)」を確認するのを忘れていて「シュウゲツ」と読んでいるあたりが最大の失敗なり。




You can follow any responses to this entry through the RSS 2.0 feed. You can skip to the end and leave a response. Pinging is currently not allowed.

Leave a Reply