トピックス

音声合成の進歩がすごい。

音声合成の進歩がすごい。高齢者が聴き取りやすい声が作れないだろうか?

NHKのニュース番組でAIアナウンサーが音声を読み上げるなど、音声合成がすごく身近になってきました。

昔の音声合成と言えば、片言でイントネーションも変で聞いた瞬間にわかるものだったのですが、今ではぱっと聞いただけではわからない物も多いです。

じっくり聞けば違和感を感じるものの、さらっと聞き流す分にはなんら問題のないレベルになってきています。

当社は音響・放送機器も取り扱っており、タカコム社のPBS-D600という自動放送機能付プログラムチャイムを使用したことがあるのですが、この機種には音声合成機能があり、女性声のアナウンスを作成できます。タカコム社のWebサイトにてサンプルが視聴できるのですが、良くできています。

 

ここからは少し趣味の領域になりますが、音声wavファイルや、マイク音声のスペクトラムが測定できるWaveSpectraというフリーソフトをつかって音声合成のスペクトラムを見てみました。このソフトずいぶん昔からあるのですが、フリーで代用できるソフトがないのでまだまだ現役で使っています。

まずは比較のために生の女性の声からです。

 

<生の女性の声>

人の声は、倍音を持っており、元の音となる基音、そこから2倍音、3倍音、4倍音・・といった形で倍音が増えていきます。基音の周波数が同じでも、人により倍音の成分がことなるので、個人個人で異なる声に聞こえます。

 

 

<音声合成の女性の声>

こちらは音声合成の声ですが、しっかりと倍音が入っています。イコール、自然な感じな声が再現できていると捉えることができるでしょう。今の音声合成で、気になるのは声そのものではなく、イントネーション、言葉と言葉の繋ぎになります。

音声合成なので、語らせる文章はテキストで入力し、適宜アクセントや言葉と言葉の間を調整するのですが、「ちょっとアクセントが違うな・・でもこれ以上なんとも調整できないな」ということが多々ありました。

ただそれらを差し引いても、アナウンサーを雇って、録音ブースを用意して等々考えると

費用対効果も高く、簡単に修正もできるので非常に便利なものです。

 

 

さて、高齢になると進行する感音性難聴では、高い周波数の音が聞こえにくくなっていきます。

高い周波数が聴き取りにくいということは、ここでいう高い倍音の成分の音が聞こえにくくなるということになります。

逆を返せば、この高い倍音成分の音を疑似的に大きくしてやれば高齢者にとって聞こえやすい声になるかもしれません。但し耳の良い人にとっては違和感のある声になるかもしれませんが。副音声で高齢者に聴き取りやすいAI音声を流してますとか、高齢者が聞きやすいニュースサイトなんてあっても面白そうですね。

 

冒頭で触れた通りNHKがAIアナウンサーを利用しているなど、今後ますます音声合成が活用される機会は増えていくと思います。単に便利だから、だけでなくもう少し付加価値を伴ったサービスも合わせて増えていってくれることを期待しています。

関連記事:アナログデータの保管 アナログからデジタルへの変換

関連記事:魅力的な音の秘密 澄み切った優しい音 真空管アンプ

関連記事:A(ラ)=440Hzってなぜ?

弊社では現在、二種類の集音器を販売しております。商品詳細は下記バナーよりご覧いただけます。

ポケット型集音器の「デカ音くん」は自宅にいながら20日間の無料試聴をしていただけます。

試聴申し込みはwebから簡単申し込みお申し込みは下記のバナーよりお申し込みください。

デカ音くんの無料貸出バナーフォンテックの販売店体験バナー