Kokoro-FastAPI (kokoro TTS) を使ってローカルで日本語音声を合成してみました
Kokoro-FastAPI を Mac mini にインストールして日本語の合成音声を作ってみました。
インストールすると色々な話者が選択できますが、話者名が j で始まるのが日本語の話者になっているようで、女性話者が4つ、男性話者が一つ入っていました。
Kokoro-FastAPIをインストールするとWebのUIがついてくるのですぐに音声合成が使えます。作った音声をファイルとしてダウンロードする事もできるので、ちょっと音声がほしいなって時には便利。ローカルで使えるので、社内情報などを合成させる時も安心です。
合成させた文章はこちら。英単語の読み上げは苦手のようでしたが、カタカナで書き直せして発話させればなんとかなりました。
こころの音声合成を試してみました。どんな感じかな?
オープンAI 読めるかな。オープンエーアイなら読めるよ。
話者名のリンククリックで音声が聞けると思います。
これらサンプルはWebのUIから作りましたが、APIを叩いてファイルを作る事もできます。CLIの方が便利な時は、下のような感じで使う事もできます。
curl -s http://localhost:8880/v1/audio/speech \
-H "Content-Type: application/json" \
-d '{
"model": "kokoro",
"voice": "jf_alpha",
"input": "この音声は、こころの、バージョン1で、合成してみました"
}' > speech.wav

コメント
コメントはまだありません。