ES 202 050-2003
音声処理伝送および品質側面 (STQ)、分散型音声認識、高度なフロントエンド特徴抽出アルゴリズム、圧縮アルゴリズム (V1.1.3、フロッピー ディスクを含む)

規格番号
ES 202 050-2003
制定年
2003
出版団体
ETSI - European Telecommunications Standards Institute
状態
 2014-04
に置き換えられる
ES 202 050-2005
最新版
ES 202 050-2007
範囲
「本書は、分散型音声認識システムの一部を形成する、高度なフロントエンド特徴抽出とその送信のためのアルゴリズムを規定しています。 この仕様は、次のコンポーネントをカバーしています:  ——メルケプストラムパラメータを作成するための高度なフロントエンド特徴抽出のためのアルゴリズム;  ——これらの機能を圧縮してより低いデータ伝送速度を提供するアルゴリズム;  ——エラー保護を備えたこれらの機能を送信用のビットストリームにフォーマットする;  ——受信機で高度なフロントエンド機能を生成するためのビットストリームのデコードチャネル エラーを軽減するための関連アルゴリズム。 このドキュメントでは、受信した DSR の高度なフロントエンド機能を利用する「バックエンド」音声認識アルゴリズムについては説明しません。 アルゴリズムは数学的形式またはフロー図として定義されます。 「C」プログラミング言語で書かれたこれらのアルゴリズムを実装するソフトウェアは、このドキュメントに付属する ZIP ファイル es_202050v010103p0.zip に含まれています。 適合性テストは規格の一部として指定されていません。 標準の独自実装の認識パフォーマンスは、適切な音声データベース上の参照「C」コードを使用して得られる認識パフォーマンスと比較できます。 DSR ビットストリームは、DSR アプリケーションをサポートする特定のシステムに導入される場合、他の高レベル プロトコルのペイロードとして使用されることが予想されます。 特に、パケット データ送信の場合、IETF AVT RTP DSR ペイロード定義 (参考文献を参照) が、第 7 項で説明されているフレーム ペア フォーマットを使用して DSR 機能を転送するために使用されることが予想されます。 アドバンスト DSR 標準は、不連続な通信で使用するように設計されています。 送信をサポートし、音声アクティビティ情報の送信をサポートします。 付録 A には、Advanced DSR 標準と組み合わせて使用することが推奨される VAD アルゴリズムが記載されています@ ただし、これは本書の一部ではなく、メーカーは代替 VAD アルゴリズムの使用を選択する場合があります。 」

ES 202 050-2003 発売履歴

  • 2007 ES 202 050-2007 音声処理送信および品質側面 (STQ)、分散型音声認識、高度なフロントエンド特徴抽出アルゴリズム、圧縮アルゴリズム (V1.1.5、フロッピー ディスクを含む)
  • 2005 ES 202 050-2005 音声処理送信および品質側面 (STQ)、分散音声認識、高度なフロントエンド特徴抽出アルゴリズム、圧縮アルゴリズム (V1.1.4)
  • 2003 ES 202 050-2003 音声処理伝送および品質側面 (STQ)、分散型音声認識、高度なフロントエンド特徴抽出アルゴリズム、圧縮アルゴリズム (V1.1.3、フロッピー ディスクを含む)
  • 2002 ES 202 050-2002 音声処理送信および品質側面 (STQ)、分散型音声認識、高度なフロントエンド特徴抽出アルゴリズム、圧縮アルゴリズム (V1.1.1)



© 著作権 2024