T/JSIA 0003-2020
強化学習に基づく知的意思決定システム標準 (英語版)

規格番号
T/JSIA 0003-2020
言語
中国語版, 英語で利用可能
制定年
2020
出版団体
Group Standards of the People's Republic of China
状態
 2021-08
に置き換えられる
T/JSIA 0003-2021
最新版
T/JSIA 0003-2024
範囲
1主な要件 1.1 環境要件: さまざまなアプリケーション シナリオを整理し、共通のインターフェイス設計を備えたシミュレーション環境を提供し、さまざまな強化学習アルゴリズムの比較を可能にします。 そして、シミュレーション環境を通じて実際のシステムをテストします。 具体的には、環境の使用方法、環境の統一カスタムインターフェース仕様などが含まれます。 1.2 観察強化学習は、典型的な「エージェント - 環境」ループの実装です。 対話中に、エージェントがアクションを選択し、環境が観察値と報酬値を返します。 1.3 空間は、効果的なアクションと観察を記述するために使用されます。 これは環境の属性です。 エージェントが環境と対話するとき、環境によってシステムに提供されるインターフェースに従って直接対話できます。 1.4 戦略 戦略の入力は状態とアクションであり、入力状態を考慮して入力アクションを実行する確率を返します。 2 運用設計 2.1 環境構成 環境構成は主に、初期状態の基本的な環境情報を構成し、学習とマイニングのための異なる状態を区別し、強化学習アルゴリズムの実験結果を改善することです。 2.2 視覚的表示 現在のシーンの関連環境情報をリアルタイムで視覚的に表示することで、開発者は効果を観察し、対応するアルゴリズムの最適化を実行することが容易になります。 2.3 インタラクション仕様 インテリジェント エージェントと環境間のインタラクションは、人間とコンピュータのインタラクションと自動インタラクションの 2 つのカテゴリに分類できます。 a) 人間とコンピューターの対話。 人間はシステムによって設計された対応する対話方法に従ってシステムと対話しますが、機械はインテリジェントなアルゴリズムに基づいて対応する出力戦略を直接生成し、インターフェイス上に動的に表示します。 b)  自動インタラクション。 マシンによって生成された対応する戦略に従ってインタラクションの両側が出力され、人間の参加なしにインターフェイス上に動的に表示されます。 2.4 戦略生成 戦略生成モジュールには、設計されたアルゴリズムの効果と比較するための、さまざまなアプリケーション シナリオに対応するベンチマーク戦略が組み込まれています。 2.5 データベース ストレージ データベース操作モジュールの主な機能は、パラメータ設定情報とデータ ファイルをシステムに保存し、ポリシー生成モデルのモデル トレーニングに信頼できるデータを提供することです。 3 使用パフォーマンス要件 3.1 セキュリティ 3.1.1 システムのセキュリティ分析、セキュリティ設計、安全な使用、セキュリティ管理などは、次の原則と要件に従う必要があります。 a) 制限付き権限の原則 システムは、次の原則と要件に従う必要があります。 ユーザーの使用権限、必要最小限の権限範囲を指定し、オペレーターの使用権限と使用レベルを制御し、システム情報の不正使用、変更、アクセスを防止できる必要がある; b) 包括的な確認原則 システムが検証できる必要がある。 収集されたデータと入力データの合法性 情報処理の有効性、正確性、送信されたデータの安全性などを確認する c) セキュリティ追跡原則: システムの情報処理プロセスに対して、安全な追跡機能を備えた完全な追跡目標を設定する必要があります。 記録してプロンプトを表示する; d) システムが引き起こす可能性のある害を、許容できる最小限のレベルまで完全かつ効果的に軽減し、過度の投資コストやシステム リソース コストの支払いを回避する必要がある。 総合的かつ最適なセキュリティを実現するために、効果に見合ったものを提供しません。 3.1.2 システムは、重要なデータやファイルなどが破損するのを防ぐために、重要な情報に対応する操作権限を付与できる必要があります。 3.1.3 システムには、コンピュータ ウイルスの生成、侵入、拡散を防止する機能が必要です。 システムの重要な部分にはウイルス対策を施し、重要なプログラムやファイルは書き込みから保護する必要があります。 3.1.4 システムの電気安全性、環境安全性およびその他の要件は、G881 および G1295 の関連規制に準拠する必要があります。 3.2 機密保持 3.2.1 ユーザーによる意図的または非意図的な不適切な操作によってシステムが損傷することはありません。 3.2.2 システムが機密性のない環境にある場合は、システム内のコマンド情報、文書、インテリジェンスデータなどが厳格なセキュリティと機密性の条件下で送信、処理、使用されることを保証するために、厳格な保護措置を講じる必要があります。 3.2.3 システムは重要な情報を保護するために暗号化技術を使用する必要があります。 3.2.4 システム暗号化ソフトウェア自体には、コピー防止、改ざん防止、静的解析防止などの自己保護手段が必要です。 3.3 信頼性 3.3.1 システムとサブシステムは、定性的要件と許容基準を指定する必要があります。 障害モードや影響分析などの方法を使用して脆弱なリンクを発見でき、エンジニアリング保証や生産品質保証などの手段を使用して致命的な障害の可能性を減らし、システムの信頼性を確保できます。 3.3.2 システムは冗長設計を採用し、必要に応じて主要なモジュールを 2 台のマシンでバックアップして、システムがある程度の耐障害性を確保する必要があります。

T/JSIA 0003-2020 発売履歴

  • 2024 T/JSIA 0003-2024 マルチエージェント強化学習に基づくゲーム意思決定システム標準
  • 2023 T/JSIA 0003-2023 国内リレーショナルデータベース代替テスト仕様書
  • 2021 T/JSIA 0003-2021 江蘇省ブロックチェーン産業人材育成基地評価基準(試行)
  • 2020 T/JSIA 0003-2020 強化学習に基づく知的意思決定システム標準



© 著作権 2024