お問い合わせ
image

多言語のAI音声読み上げの課題と調整方法 ー前編ー

アクセシブルコード
profile

S. Liu

アクセシブルコードは、日本語を読めない外国の方や視覚障害者の方に向けて開発された、音声情報を提供する2次元コードです。この2次元コードは、一つのコードで複数の言語のコンテンツを表示でき、音声合成ソフトウェアを利用して各言語で音声を提供しています。ソフトウェアを使用すれば、音声の合成は比較的容易ですが、AIによる読み上げはまだ完璧ではないため、視覚障害者の方々に正確な情報を届けるためには手作業での「音声調整」という工程が必要です。

AI音声読み上げの特徴

AI音声読み上げは昔に比べて、機械的な声や単調な読み方が改善され、音声に少し感情を持たせた読み方も可能になりました。しかし、言語ごとの特徴が異なるため、以下のような部分は機械にとって判断が難しい場合があります。

1. 一つの単語に複数の発音がある場合
同じ単語や漢字には複数の発音が存在することがあり、これはAIが誤りを起こしやすい要因となります。日本語では音読みと訓読み、中国語では「多音字(発音が多数ある文字)」が存在するため、音声確認の際には細心の注意が必要です。

2. 数字の読み方
郵便番号や電話番号などの数字の桁数は国によって異なります。そのため、数字のみの表記はAIが正確に認識できないことがあり、誤った読み上げが発生する可能性が高まります。

3. 単位、符号などの読み上げ
AIは単位や符号などを読み上げる際に誤解しやすいことがあります。その問題を解決するため、単位の読み方を音声で指定するか、符号の代わりに言語で表記するなどの方法で、音声を正確に調整する作業が必要です。

4. 読み上げスビートの調整
AIは表やグラフに対応するのが難しいです。文の繋がりを理解しにくいため、適切なスピードで読み上げることが難しい場合があります。特に、表や複雑な文の場合、速すぎると理解が追いつかないことがあるため、特定の文脈においては手動で音声を調整するなどの工夫が必要です。

言語別音声調整の具体例

■ 日本語の例

原稿調整前調整後
土、日、祝日つち、にち、しゅくじつど、にち、しゅくじつ

調整ポイント:土曜日の「土」を「つち」として読まれていたため、「ど」に調整しました。

■ 英語の例

原稿調整前調整後
542-0081five hundred forty-two eighty-onefive four two zero zero eight one

調整ポイント:郵便番号を認識できず、数値として読み上げられました。正しい読み方に調整しました。

■ 中国語の例

原稿調整前調整後
mLml(アルファベットのまま読み上げる)毫升
维生素B2维生素地下二楼(ビタミン地下2階)维生素B2
一日1次~数次一日1次数次(~は読み上げない、あるいは「なみせん」のままと読み上げる)一日1次至数次

調整ポイント:単位についてアルファベットのままに読まれたり、符号は認識できず読み上げが省略されたりする場合があります。正しい読み方を指定して修正しました。

■ 韓国語の例

原稿調整前調整後
– 피부 발진, 발적, 가려움증
– 현기증
– 메스꺼움, 구토, 식욕 부진
피부 발진, 발적, 가려움증 현기증 메스꺼움, 구토, 식욕 부진(改行のところは音声が止まらず繋がっていた)– 피부 발진, 발적, 가려움증.
– 현기증.
– 메스꺼움, 구토, 식욕 부진.

調整ポイント:リストになっている文章を判断できず、単語がくっついて読み上げられました。句点を追加したり、音声の余白を置いたりするように修正しました。

まとめ

各言語のネイティブはAI音声を聞きながら伝達情報について確認しております。アクセシブルコードでは、これに応じて様々な調整を行い、細かい調整を積み重ね、よりわかりやすい音声を提供しています。