1989/1
No.23
1. 台湾音響学会 2. 理事就任にあたって -五十嵐先生と私と台湾- 3. 騒 音 計 4. 新装された模型実験室 5. 発音・発語訓練装置の開発(その2)
      <研究報告>
 発音・発語訓練装置の開発(その2)

リオン株式会社研究開発部 政 池 広 身 

1. はじめに
 前号の報告(その1)1)で、難聴者の母音の発音明瞭度と舌動態に特徴的な傾向がみられることを報告している。我々は超音波利用の訓練装置の手始めとしてすでにHR-01を試作している2)。しかし、この装置は音声と舌形状およびインテンシティの録音録画とそれらの再生はできるものの実時間では表示できないという欠点があった。今回試作したHR-03はこの欠点を解消し、実時間で舌形状の動きとインテンシティを表示し、さらに必要に応じ音声の分析もできるものである。

2. 構 成
 本装置は超音波を利用して舌形状を観測しながら発語訓練を行う装置で、超音波を送受して舌位置データを得る舌画部と、マイクロホンより得られる音声信号を処理する音声部および、古画部と音声部の制御と演算を行うコンピュータ部よりなる。Fig.1は本装置のブロックダイアグラムである。

Fig.1 Block Diagram of Trainer

2. 1 舌画部
 高圧パルス部より出力されたパルスは、下顎に圧定された探触子より超音波として体内に入射する。入射角は、Fig.2のように、探触子表面に垂直なビームを中心に舌の先端から奥までを21等分したものであり、等分したそれぞれの線を走査線と呼んでいる。入射した超音波は、その一部は下顎表面および筋肉組織等で反射するが、大部分は筋肉組織を通過し舌表面まで達する。舌表面まで達した超音波は、空気層にぶつかり一部を除いて大部分が反射する。反射波は再び筋肉組織を通過して、その一部が探触子に到達する。得られた微弱な信号の中から下顎表面および筋肉組織等の反射によって得られるノイズ成分の中から、舌表面の反射である信号を検出し、パルスを発生した時刻と舌表面の反射信号を受信した時刻を計測し、それを距離情報に変換することで舌位置データが得られ、メモリに格納される。以上のようにパルスを発射させメモリに格納するまでを一走査とし、これを中心から舌先方向そして中心から舌奥方向と21本の走査線について走査を行うことにより1フレーム分のデータが得られる。得られた舌位置データは、コンピュータからの「只今データ取り込み中」という信号が送られていないことを確認して、その走査線に対応したアドレス上のメモリに格納される。そして、次のフレームのデータを取り始めるという手順を繰り返す。

Fig.2 Scanning lines

2. 2 音声部
 マイクロホンより得られた音声信号はプリアンプで増幅され実効値検波回路を経て対数圧縮回路を通りインテンシティ信号となる。この信号をA/D変換し、インテンシティデータとしてデータI/Oバッファを介してコンピュータに送出する。
 また、音声を録音することを目的として、アナログ信号である音声信号をデジタル信号に変換する必要がある。サンプリング周波数・データビット数および録音時間にもよるがサンプリングしたデータをそのまま使用するPCM方式ではデータ量が多くなりデータ転送およびファイルアクセス時間が長くなりまたデァスクに格納されるデータ数も少なくなり不利である。そこで、ビット削減を目的とした符号化である適応型差分パルス符号変調法(ADPCM)を採用した。増幅された音声信号はローパスフィルタ回路を通った後A/D変換されADPCM分析されADPCMデータとしてメモリに格納される。格納されたADPCMデータは、コンピュータからの指令で送受可能である。さらに、メモリに格納されているADPCMデータは、コンピュータからの指令で、ADPCM合成され、D/A変換後ローパスフィルタ回路を通って再度音声としてスピーカより再生される。
 そして、再生音声を利用してA/D変換されたPCMデータは、コンピュータに取り込まれ、演算されてフォルマント情報を得ることもできる。

 2. 3 コンピュータ部
 コンピュータはNECのPC-9801m2を使用し、装置全体の制御および演算を受け持つ。舌画部に対しては、走査線を示すアドレスをI/Oバッファのインポートを介して送り出し、そのアドレスに書き込まれているデータをアウトポートを介して受け取る。受け取った舌位置データを画面表示させるためにあらかじめ作成しておいたコンピュータ画面に対応したテーブルを参照しX座標Y座標のデータに変換して内部メモリに格納する。以上のようにして1フレーム分である21個のデータの取り込みが終了すると次に描画に移る。描画は舌画のみではなく訓練中の音声のインテンシティもリアルタイムで表示する必要がある。インテンシティの表示は横軸に時間、縦軸にレベルを取っているため、インテンシティデータの取り込みとその描画は等時間間隔で行う必要がある。音声部から送出されたインテンシティデータは約4ミリ秒間隔で取り込んでインテンシティデータとして点で掃引させる古画はイムテンシティ処理の合間の時間を利用して1秒間に16フレームの割合でデータを取り込み描画している。
 フォルマント分析は256個の12ビットPCMデータをA/D変換器よりバッファを介して取り込んだデータに時間窓処理(ハミング窓)をかけた後に自己相関係数を算出する。さらに、偏自己相関係数(PARCOR)および線形予測係数(LPC)を算出して、パワースペクトラムの包絡線ピークを求め、その周波数の低い方から順に第一フォルマント・第二フォルマントおよび第三フォルマントとする。また、PARCOR係数から声道関数を求める試みも行っている。

3. プログラム
 プログラムは生徒が訓練等に使用する生徒用プログラムと、先生が生徒の手本とするためのデータを作成するための先生用プログラムとに別れ、双方自由にリンクできるようになっている。Fig.3は生徒用プログラムのフローチャートである。生徒用プログラムを起動すると、訓練・再生・取込・検索・分析・一覧・登録および終了という内容のメニュー画面となる。操作は全て1から8までのテンキーで行うようになっている。Fig.4は再生画面の一例である。生徒用プログラム操作中に[SHIFT]+[S]キーを押すと先生用プログラムがリンクされ、氏名登録・先生入力・氏名一覧・先生一覧・氏名削除・大きさおよび終了という内容のメニュー画面が表示される。

Fig.3 Flow chart of Main Program
 
Fig.4 Sample of Replay

4. むすび
 この装置によって、発音発語時の重要な要素の一つである舌の形状および動態等が実時間で具体的な横断面図として見ながら訓練できるようになった。訓練を受ける生徒が、鏡で見ることができる口唇等の動きだけでなく、発音発語する直前から直後までの舌の動きも重要な要素であることを認識して訓練できるという点で効果があると思われる。現段階の訓練効果としては、訓練期間がまだ短かいためか、発音明瞭度等に顕著な結果は現れていない。しかし、ほとんど呑の動かない傾向にある聴覚障害の生徒に、Fig.5のような、調音点の変化がみられるようになった3)

Fig.5 Variation of Tongue Position

 尚、本研究は、文部省の助成による筑波大学とリオン株式会社との共同研究である。

参考文献
1) 福山:発音・発語訓練装置の開発(その1)、小林理研ニュース、p.8-11(1988.10)
2) 福山、大野、政池(リオン)、星、松本、今井(筑波大):超音波による発語訓練装置の試作、 音響学会講演論文集、1-5-14(1986.10)
3) 今井、岡、松本、日高、斎藤、志水(筑波大)、星(化研病院)、大野、福山、政池(リオン): 超音波法による発音指導の試み、第22回全日本聾教育研究大会研究集録、 p.132-133(1988)

-先頭へ戻る-