
56
音響解析技術、音響モデル
音声解析で没入感を高める
3-4
なぜ「音」 が没入体験を向上させるのか?
音は、没入体験を向上させるために欠かせない要素です。人間が空間を
認識するときはさまざまな感覚器官を使っています。つまり、人間が空間
を立体または3 次元であると認識するためには、映像だけでなく音も非常
に重要な要素の一つなのです。
XR技術に採用される主な音響解析技術
音響解析技術には多くの種類があります。中でも、一般的なのは空間オ
ーディオ技術です。空間オーディオ技術とは、リアルタイムで音の位置や
動きを解析してユーザーの聴覚に自然な形で再現する技術です。
具体的には、音が上下左右前後から聞こえるようにすることで、ユーザ
ーに360 度の音響体験を提供する3Dオーディオ技術があります(図
3-7)。また、ユーザーの頭の動きに応じて音の方向を調整し、現実世界
のように音の動きを感じられるヘッドトラッキング技術も必要です。さら
に、音の反響や周囲の物体による音の遮断をシミュレートすることで、よ
りリアルなオーディオ体験を実現する音響レンダリング技術もあり、これ
らの技術によって構成されています。
音素を機械に読み込ませるために必要な音響モデル
音をコンピュータに読み込ませるためには、音を音素に分解して音響モ
デル
を構築する必要があります。音響モデルとは、隠れマルコフモデルや
N-gramモデルなどの専門的な要素が絡み合う領域ですが、簡単にいうと
音声をテキストに変換するための統計データのようなものです。
この