T/JSIA 0004-2024
健康・医療ビッグデータ データ品質管理仕様書 (英語版)

規格番号
T/JSIA 0004-2024
言語
中国語版, 英語で利用可能
制定年
2024
出版団体
Group Standards of the People's Republic of China
最新版
T/JSIA 0004-2024
範囲
4.2 データ品質管理の基本原則 データ品質管理は次の原則に従う必要があります: a) 適用性: 収集された統計データが有用であり、ユーザーのニーズを満たしているかどうかを指します; b) 正確性: データは真実であり、実際の状況を反映している必要があります。 c) 適時性: データをタイムリーに提供する; d) 比較可能性: 国際比較可能性、国内比較可能性、一貫した統計的精度; 年間を結び付けることができる; e) 完全性: データ要素の内容は完全であり、データ要素の内容を変更することはできない不完全な。 f) 簡潔さ: 情報は簡潔で、それほど正確ではない; g) アクセシビリティ: データおよび関連する統計情報のコンサルティング サービスを入手するのが便利である; h) フルプロセス: 計画、取得、保管、共有、保守、適用および破棄をカバーするデータのライフサイクル全体の各段階; 4.3 データ品質管理のプロセス: データ収集、フォーマット検査、コンテンツ検証、データ統合、およびデータ監査。 5 グレーディングシステム 5.1 データ品質グレーディング a) データ品質グレーディング基準を確立し、報告されたデータの完全性とユーザー評価に基づいて総合的な評価を実施し、結果を動的に更新する必要があります。 b) データ品質レベルには、品質レベル I と品質レベル II の少なくとも 2 つのレベルが含まれている必要があります。 データ品質レベル I: すべてのデータがデータ仕様の要件を満たし、データ形式検証およびデータ内容検証に合格する; データ品質レベル II: すべての必要なデータがデータ仕様の要件を満たし、データ形式検証およびデータ内容検証に合格するが、非必要なデータがデータ仕様要件に完全に準拠していません。 品質レベル II データは、その後のデータ修正および追加記録の主な対象となります。 5.2 データ利用分類:データの意味、内容、適用範囲に基づいてデータ利用レベルを設定し、レベルに応じてデータの公開度やデータ共有範囲を管理する必要があります。 通常、オンライン共有とオフライン共有の 2 つのレベルに設定されます。 a) オンライン共有: ユーザーは、データ エンジニアリング データ センター サービス ポータル、各専用データ センター サービス ポータル、共同で構築された各データ センター サービス ポータルを通じてデータのクエリ、参照、ダウンロードを行うことができます。 、など。 パブリック共有と許可された共有が含まれます。 パブリック共有とは、登録ユーザーがログイン後にオンラインでパブリック データをダウンロードできることを意味します。 承認された共有とは、一部の個人データが承認を通じてオンラインでダウンロードされ、対応する個人データのダウンロード許可が各ユニットの機能に基づいて付与されることを意味します。 b) オフライン共有: アプリケーション共有と拡張共有を含みます。 共有申請とは、ユーザーが該当するデータセンターにデータの利用を申請し、各センターの管轄当局の承認後、セキュリティ技術的手段をサポートしたCD-ROMを通じてデータを取得することを意味します。 拡張共有とは、ユーザーがデータのより専門的かつ詳細な処理を申請し、データ作成者がユーザーの要求に応じてデータの計算と処理を行った後、セキュリティ技術的手段をサポートしてCD-ROMを通じてユーザーに提供することを意味します。 5.3 データ セキュリティの分類 a) 機密データ ドメインの分類 より高い機密性レベルを持つ特定のデータ セットは、機密データ ドメインと呼ばれます。 「グレーディング」には機密データが含まれるため、これらのデータはビジネス指向ではなく、グレードの属性を決定するために独自の属性のみを使用します。 つまり、フィールドの意味は対応するデータ ドメインです。 一般的な分類方法では、機密データ ドメインは、公的機密データ ドメイン (法的観点から)、業界機密データ ドメイン (業界標準の観点から)、および機関の機密データ ドメイン (内部標準の観点から) に分類されます。 公共の機密データ フィールドと業界の機密データ フィールドは通常、規制文書で定義されており、機関の機密データ フィールドを分類するかどうかは、ビジネス システムに対する参加者の理解に依存します。 b) 機密レベルの設定は、ビジネス要因に基づくデータ カテゴリとは異なり、データの機密レベルに基づいて機密レベルが分けられます。 機密レベルの策定方法は、情報漏洩による影響範囲、影響を受ける対象、影響の程度に応じて分けることができます。 c) データカテゴリの策定 通常、業務カテゴリは「祖先カテゴリ」、「親カテゴリ」、「サブカテゴリ」、「孫カテゴリ」以上に分かれており、データドメインを最小限の分類として使用できます。 d) データ ドメインに属するメタデータ 機密データ ドメインを分類した後、フィールドはその後の分類操作のために機密データ ドメインに分割されます。 メタデータを管理できる場合、または機密データ フィールドを分類するときにフィールドが前処理されている場合は、この段階を無視できます。 それ以外の場合は、フィールドを機密データ ドメインに割り当てる必要があります。 このプロセスは、インテリジェントな検出ソフトウェアによって支援できます。 e) データの分類と集約では、メタデータ管理システムを構築することでデータ ドメインを直接分類できます。 メタデータ管理システムが構築されていない場合、業務システムに含まれる各データベースの各テーブルの各フィールドを分類して階層化する必要がありますが、このプロセスはインテリジェントなソフトウェアの支援によって完了できます。 f) 複数セットの分類・格付け 実際のアプリケーションでは、ビジネスの関心事が異なる場合があるため、1 つの分類・格付けシステムを構築する必要はなく、必要に応じて、異なるビジネスに対応するために複数の分類・格付けシステムを構築することができます。 ニーズ。 規制要件を満たすために分類と格付けが行われる場合は、まずコンプライアンス要件を満たす必要があります。 この作業は、法務チームとコンサルティング チームが行い、事業範囲に応じて遵守する必要がある法令を整理します。

T/JSIA 0004-2024 発売履歴

  • 2024 T/JSIA 0004-2024 健康・医療ビッグデータ データ品質管理仕様書
  • 2023 T/JSIA 0004-2023 Green Software Park データ管理能力構築ガイド
  • 2022 T/JSIA 0004-2022 江蘇省の計画レイアウト内の主要ソフトウェア会社の評価仕様書



© 著作権 2024