MRが楽しい

MRやVRについて学習したことを書き残す

MRTKの言語認識のキーワードに関する動作を調べる (その2 数字の音声コマンド)

本日は MRTK の技術調査枠です。
MRTKの言語認識で数字を指定した際にどのような動作をするか調査したので記事にします。

MRTKの音声認識

MRTK を使って音声認識を利用する詳細な手順は以下の記事を参照ください。
bluebirdofoz.hatenablog.com

今回は音声認識の単語に数字を登録してみた場合の動作を確認しました。

音声コマンドに数字を登録した場合

以下の通り、3種類の数字を登録して動作を確認してみました。
また今回は条件の重複が発生しないように別々のプロファイルに切り替えて試しました。
・「1」「2」「3」「4」という単体の数字

・「11」「23」「100」という複数桁の数字

・「one」「two」「three」という英単語での数字

動作結果

シーンを再生してそれぞれの数字がどのような発声で認識するかを確認しました。

・「1」「2」「3」「4」という単体の数字の場合
「いち」「に」「さん」「し」という日本語の発声で認識される。
また「4」に関しては「し」でも「よん」でも認識され、複数の呼び方で認識される数字がある。
英語の「ワン」「ツー」という発声では反応しない。(著者の日本語OS環境において)

・「11」「23」「100」という複数桁の数字
「じゅういち」「にじゅうさん」「ひゃく」という複数桁の数字の発声で認識される。
また「ひとひと」「にさん」「いちまるまる」のような1桁ずつの数字の発声でも認識される。
英語の「イレブン」「ワンハンドレッド」という発声では反応しない。(著者の日本語OS環境において)

・「one」「two」「three」という英単語での数字
「ワン」「ツー」「スリー」という英語の発声で認識される。
日本語の「いち」「に」「さん」という発声では反応しない。