Voicegerのver 3.0.0 Betaをリリースしました。
ずんだもんの声を長文で調整無しで読ませるのに便利です!
ただし、メチャクチャ重いので注意してくださいませ
こちらが、実際の操作になります。
RTX 3090(GPU VRAM 24GB)の環境で動かしています。
CPUでも動きますが、CPUだと1文章の生成に数分以上かかることがあります。
良い点としては、様々な言語を話せるようになっている点です。
これまでの、英語、中国語、韓国語の他に、
ドイツ語、フランス語、ロシア語、スペイン語、ポルトガル語、イタリア語にも対応しています。
ただし、メチャクチャ重いです。
エンジンにQwen-TTSを使っているのですが、量子化モデル(AIのモデルを圧縮した感じのもの)で軽くて精度の高い物がでてきたら載せ替えたいと思っています。
とはいえ、調整無しで長文が出せると、調整を行うことに比べれば時短になることもあるので、試しに使ってみてくださいませ\(💚ず・ω・だ💚)/
AI出力ゆえに、生成するたびに違う雰囲気で出力されるので、まとめて5音声や、10音声を出力できるようにしています。
出力ボタンを押して、のんびり待って、まとめて聞いてみる、とかならギリギリいい感じに使えるかもしれません。
合成に失敗して、たまに変な声になったりすることもあるので、その場合は音声を作り直してください。
