ttslearn: Text-to-speech with Python
Project description
ttslearn: Library for Pythonで学ぶ音声合成 (Text-to-speech with Python)
Installation
pip install ttslearn
リポジトリの構成
- ttslearn: 「Pythonで学ぶ音声合成」のために作成された、音声合成のコアライブラリです。
pip install ttslearn
としてインストールされるライブラリの実体です。書籍のサンプルコードとしてだけでなく、汎用的な音声合成のライブラリとしてもご利用いただけます。 - notebooks: 第4章から第10章までの、Jupyter notebook形式のソースコードです。
- hydra: 第6章で解説している hydra のサンプルコードです。
- recipes: 第6章、第8章、第10章で解説している、日本語音声合成のレシピです。JSUTコーパスを利用した日本語音声合成システムの実装が含まれています。
- extra_recipes: 発展的な音声合成のレシピです。書籍では解説していませんが、
ttslearn
ライブラリの利用例として、JSUTコーパス、JVSコーパスを用いた音声合成のレシピをリポジトリに含めています。
詳細なドキュメントは、https://r9y9.github.io/ttslearn/ を参照してください。
ライセンス
ソースコードのライセンスはMITです。商用・非商用問わずに、お使いいただけます。 詳細は LICENSEファイルを参照してください。
学習済みモデルの利用規約
本リポジトリのリリースページでは、JSUTコーパス・JVSコーパスを用いて学習した、学習済みモデルを配布しています。それらの学習済みモデルは、「非商用目的」でのみ利用可能です。 学習済みモデルを利用する際は、各コーパスの利用規約も併せてご確認ください。
また、作者は、学習済みモデルの利用による一切の請求、損害、その他の義務について何らの責任も負わないものとします。
付録
付録として、日本語音声合成のフルコンテキストラベルの仕様をまとめています。 詳細は、docs/appendix.pdf を参照してください。
問い合わせ
書籍の内容、ソースコードに関する質問などありましたら、GitHub issue にてお問い合わせをいただければ、可能な限り返答します。
お詫びと訂正
本書の正誤表を以下のリンク先でまとめています。
もし、正誤表に記載されていない誤植などの間違いを見つけた場合は、GitHub issue にてご連絡ください。
謝辞
- Tacotron 2の一部ソースコードは、ESPnetを元に作られました。(thanks to @kan-bayashi)
- 発展的なレシピの実装のほとんどにおいて、kan-bayashi/ParallelWaveGANを利用しました。
- 日本語音声合成のテキスト処理には、Open JTalk およびそのPythonラッパーを利用しました。
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
ttslearn-0.2.0.tar.gz
(294.2 kB
view hashes)