T/BDAEA 003-2023
マルチモーダルな人間とコンピューターの対話の技術要件 (英語版)

規格番号
T/BDAEA 003-2023
言語
中国語版, 英語で利用可能
制定年
2023
出版団体
Group Standards of the People's Republic of China
最新版
T/BDAEA 003-2023
範囲
この文書は、環境におけるマルチモーダル・ヒューマン・コンピュータ・インタラクション・テクノロジーの用語、定義、テスト方法、テスト標準および技術要件を規定し、インタラクティブ・システムの使いやすさ、信頼性および相互運用性を確保し、ユーザーにさらなるインテリジェンスとインテリジェンスを提供します。 利便性と快適な旅行環境。 このセクションは、地下鉄、ショッピング モール、銀行、地下駐車場などでのマルチモーダルな人間とコンピューターの対話シナリオに適用できます。 5.4.1 技術要件 (1) キーワード音声認識機能を備えていること 低騒音環境(騒音強度が 50dB 以下)ではキーワード音声認識の単語精度が 90% 以上であること、高騒音環境ではキーワード音声認識精度が 90% 以上であること。 環境(騒音強度が 60dB から 65dB の間)では、キーワード音声認識の単語正解率は 85% 以上である必要があります。 単語正解率の性能指標の定義は GB/T21023-2007 に定義されており、キーワードを識別し、キーワードに基づいて特定のサービスを提供することのみが可能です。 (2) 継続的な音声認識機能を備えていること。 低騒音環境 (音響強度が  50 dB  以下) では、連続音声認識の単語精度は 85% 以上である必要があります。 高騒音環境 (騒音強度が  60 dB の間) では、 ~65 dB)、連続音声認識の単語正確率は 80% 以上です。 単語正解率の性能指標の定義は GB/T21023-2007 に定義されており、キーワードを識別し、キーワードに基づいて特定のサービスを提供することのみが可能です。 (3) インテリジェント顧客サービス音声対話システムのデジタル音声認識要件には、デジタル認識とサービスをサポートすること、さまざまなデジタル表現の認識例をサポートすること、精度率が 99% 以上であることが含まれます。 5.5 音源定位 5.5.1 技術要件 (1) 測位精度: 最大角度誤差: 測位結果と実際の音源位置との間の最大角度誤差は ±5° を超えてはなりません。 (2) 最大空間距離誤差: 測位結果と実際の音源位置との間の最大空間距離誤差は 0.5 メートルを超えてはなりません。 (3) 動的応答: システムは、音源位置の変更後 1000 ミリ秒以内に音源の位置決めを完了し、結果を出力する必要があります。 (4) リアルタイム: システムの音源測位応答遅延は 500 ミリ秒を超えてはなりません。 5.5.2 試験要件 (1) 時間差法試験:複数の小型マイクアレイを用いて、音源信号が各マイクに到達する時間を同時に記録し、時間差を計算して音源の方向を判定する。 (2)振幅差法試験:複数の小型マイクアレイを用いて、各マイクに到達する音源信号の振幅差を同時に記録し、振幅差を計算することで音源の方向を判定します。 (3) ビームフォーミング テスト: ビームフォーミング アルゴリズムと複数のマイクを使用して、音源定位のアルゴリズムの精度と堅牢性をテストします。 (4) 音源追跡テスト: 音源の速度や加速度の変化など、移動する音源を追跡する音源測位システムの能力をテストします。

T/BDAEA 003-2023 発売履歴

  • 2023 T/BDAEA 003-2023 マルチモーダルな人間とコンピューターの対話の技術要件



© 著作権 2024