[DL輪読会] Efficient Neural Audio Synthesis
20ページ
WaveNetはSoTAな音声合成手法。しかし、自己回帰生成モデルなので、生成が遅い。1秒の音声を生成するために24000回のサンプリングが必要。提案手法”WaveRNN”。ネットワークを大幅に小さくした。計算時間を短くする手法や、並列して生成可能な手法も提案。モバイルCPUでもリアルタイムで音声合成可能にした。
2018年06月01日 12:02
作者:ヒホ
作品情報
閲覧131
コメント
お気に入り1

タグ

DMV

関連スライド