2012/05/21
あまり多く知られていませんが、英語と日本語だけでなく他の外国語についてもマイクロソフトは無料で音声読み上げエンジンを公開しています。ここではその利用法をご紹介したいと思います。
自分で作った外国語の文章を音声読み上げソフトで読み上げさせたい、そう思った方はいられませんでしょうか。
ここではMicrosoft Speech Platformを用いて外国語のテキスト読み上げを行い、さらにそれをmp3の音声ファイルに変換する手順をご紹介します。
この方法を使えば、私どもの外国語入力ソフトで入力した外国語をすぐに聞くこともできますし、単語帳に音声読み上げで作った音声ファイル名(mp3)をセットすれば、自分なりの音声付きライブラリを作ることもできます。
※ここで紹介する方法は全て無料で実現可能です。対応OSは、Windows Vista以上です。WindowsXpの場合、最新の.Net Frameworkをインストールすればできる可能性もあります。
※補足:マイクロソフトのTSS(Text-to-Speech:MSではTSSを「音声合成」と訳している)の複数言語の読み上げに関する解説ページはこちらです。
【手順】
※以下、各項目ごとに詳しく説明します。
Microsoftのサイトから最新のMicrosoft Speech Platform11をダウンロードしてもいいのですが、言語別の音声合成エンジンもダウンロードする必要があります。ここではその辺の面倒さを解消する「まほろば」さんが作ったソフト「Microsoft Speech Platform 簡単インストーラーVer2.2」を使ってインストールすることをお勧めします。リンクを入れたページに詳しいインストール手順が画像入りで説明してありますので、よく読んでインストールして下さい。
なお、ここでは外国語として「韓国語」を例に取り上げます。このインストーラーを使えば、韓国語のチェックボックスにチェックを入れるだけで、韓国語用の音声合成エンジンをダウンロード、インストールしてくれます。「簡単インストーラー」に指定項目のない言語は、このページの一番下の「対応可能な言語」の中のマイクロソフトへのリンクから、必要な音声合成エンジンをダウンロードすることができ、インストールすれば「TextToWav」で指定できるようになります。
※補足:Microsoft Speech Platformをインストールしただけでは何も起こりません。
外国語を読み上げるためにはプログラムが必要です。ここではNoahさんが作ったフリーソフトの「TextToWav」を取り上げます。他に「電脳スピーチblog」さんのスクリプトも同様のことができますがTextToWavのほうがデスクトップにショートカットを作って普通のプログラムのように使いやすいので、こちらを例にします。
上の「TextToWav」のリンク(Vectorへ飛びます)から、「ダウンロード」ページに入りソフトをダウンロードします。プログラムはzipファイルのですので、ダウンロード後はエクスプローラーでそのサイルを探し、メニューの[ファイル][すべて展開]で、どこかのフォルダに展開(解凍)します。
このソフトはCドライブのProgram Filesフォルダにインストールされるものではありません。ですので、展開したフォルダにあるexeファイルを、マウスの右クリックで[送る][デスクトップ(ショートカットを作成)]で選び、ショートカットを作ります。
「TextToWav」は標準では音声合成の結果をWaveファイルに出力できますが、mp3のファイル形式には出力できません。そこでmp3にエンコードするプログラム(プラグインと言います)を組み込みます。
そのプログラムの名前は「lame」と言います。2012/3/13現在、最新バージョンはVer3.99.5です。こちらのサイトからダウンロードできます。ファイルはzipファイルですので、いずれかのフォルダに展開し、"lame.exe"だけを「TextToWav」を展開したフォルダの下にある[Plugins]フォルダの中にコピーします。
これで準備完了です。
下の画面を見て下さい。これは「TextToWav」の画面です。ここでは入力したハングルを読み上げさせる手順を紹介します。
スピーカーのSWを入れておけば、韓国語で読み上げてくれますね。
※注意点:画面右上のチェックボックスで「SAPI5を使う」はチェックを入れておく必要があります。チェックを外すと「音声合成エンジン」選択用のコンボボックスでアイテムが表示されなくなります。アイテムがなくなったときは「SAPI5を使う」にチェックを入れて再起動するとまた戻ります。
※補足:調節可能な項目は[読み上げる速さ][音量][サンプリング等]です。
「TextToWav」の音声ファイルの変換の形式は[mp3]に指定します。
ファイルの出力先は画面下部の左端の[File]タグをクリックすると指定画面があらわれるので[...]ボタンを押して出力先フォルダを指定します。
ファイル名の基本は数字の連番で、拡張子はmp3となります。ファイル名に識別用の特定のアルファベットの記号を付けたい場合は[タイトル]欄に記号を入力します。
実際にファイルの変換を行うには、画面中央の赤丸ボタン(録音ボタンのような)を押します。確認メーッセージ画面の後、ファイル変換されます。
変換後エクスプローラで出力フォルダを見ると、"dat06.mp3"などのmp3ファイルができています。ダブルクリックするとWindows Media Playerが開き、音声合成された音声を聞くことができると思います。
音声をファイル化しなくても入力したハングルやロシア語、中国語を読み上げさせたい、そのような場合もあると思います。そんな時は私どもの開発した外国語入力ソフトと「TextToWav」を使って簡単に読み上げさせることが可能です。
例)ハングリンUCを使ったハングル読み上げ
手順
※補足:私どもの外国語入力ソフトはクリップボード経由で文字を転送するのですが、転送先アプリケーションが定まってなくても、「TextToWav」がクリップボードの変化を常に調べてくれているので、「標準転送」ボタンを押し、クリップボードにテキストを積むだけで外国語を読み上げてくれます。
下の各言語ごとのランタイム(音声合成エンジン)が無料で利用できます。ランタイムののダウンロードはマイクロソフトのこのページから可能です。
※各言語ごと、電話用音声のランタイムもあります。