僕、「データ管理」を学ぶ

今年は、データ管理がお題でして、このGWで少し勉強です。

20年とか30年とか、大学でその理論を研究し続けている人には、かないもするはずはありませんが、
その他大勢の人に分かりやすく伝える役割にはなれるんではないかと、楽観的に勉強してます。

バックアップも8年くらいでなんとかなりましたしー。8年なら、あと2ターンくらいはできそうですねー。

下記は、ネット見ながらのメモです。

〜〜〜〜〜〜〜〜〜〜〜

■データ管理まとめ

・データ管理(=データマネジメント、DM)

・活動方針
  ・期待効果を明確にした部分導入(全体を一度に、では費用と時間で合意が難しい)
  ・システム移行時に合わせて実行
  ・データ運用と情報システム運用は別(情報システムは器)

・立場(責任分担)
  ・経営層
     目的決定
     ガバナンス実行
  ・事業部門
     データオーナー
     品質管理
  ・情報システム部門
     企業/組織全体の横断的なデータ設計/仕組み
     確実なオペレーション/運用

  ・データスチュワード ★2タイプある
     データマネジメントを担う組織/人
     データ品質の維持
     ユーザが安心して活用できるデータの提供

・データマネジメント
  ・データ品質
    精度(意味、正確性)、鮮度(反映タイミング、履歴)、粒度(単位)
  ・データガバナンス
    データを利活用する環境を整えること
    決め事を守らせる仕組みと運営
      管理するデータの決定、責任組織の決定 (事業
      データ品質の定義 (事業、情シス)
      データ登録/参照時のルール決定 (情シス、事業
      データ粒度の定義 (事業、経営)

・データ品質劣化原因
  ・修正漏れ、入力ミス、応急処置の恒久対策漏れ、意味変化への追随遅れ

・MDが必要な活動の例
  ・事業活動の見える化/KPI管理
  ・MDM
    ・データモデリング
  ・コード統合
  ・CRM(顧客関係管理)
  ・チャネル多様化への対応

ツール
  データ構造、標準化規約の維持
    ・データディクショナリ
    ・設計リポジトリ
  データ活用
    ・BIツール
  データ加工、抽出
    ・ETLツール
      Extract - 外部の情報源からデータを抽出
      Transform - 抽出したデータをビジネスでの必要に応じて変換・加工
      Load - 最終的ターゲット(すなわちデータウェアハウス)に変換・加工済みのデータをロード
  マスター管理ツール複数システム缶でのデータ整合性維持)
    ・解析型
    ・マスタ-ハブ型 ★2つあったような
  ERP経営資源である「ヒト・モノ・カネ」を統合的に管理)
  データクレンジング(名寄せなど)
    ・

・データモデリング
  データ構造と標準化規約を設計

・DMBOK
  網羅的な知識体系
〜〜〜〜〜〜
データガバナンス
データアーキテクチャ管理
データ開発
データオペレーション管理
データセキュリティ管理
リファレンスデータとマスターデータ管理
データウェアハウジングとBI管理
ドキュメントとコンテンツ管理
メタデータ管理
データクオリティ管理
〜〜〜〜〜〜

・非構造化データ
  メタデータやタグ情報の付与にて、構造化データと同様に扱うことが可能。
  その付与のコストは大きく、【メタデータやタグ情報の自動検出】の研究もある

ビッグデータ
  統計解析の軸になる【マスターデータの精度】が重要になる。

・データドメイン
  とりうる値や葉に、桁数

・セマンティック
  コンピュータに文書や情報の持つ意味を正確に解釈させ、文書の関連付けや
  情報収集などの処理を自動的に行わせる技術について用られる語である。

・データレイク
   データは実質的に元の形式を維持したまま、とりあえずデータレイクに置いておき、
   必要に応じて問い合わせや、処理を適用すべきだ」という思想

・マスターデータ管理
  マスタを企業/組織内で統一管理・データ活用
〜〜〜〜〜
現状調査・分析
目指すべき姿の検討
統合すべきマスタの選定
ツールの選定
運用プロセスイメージの検討
展開計画の作成
〜〜〜〜〜


・データマネジメント全体俯瞰図(第2.1版)★また後でゆっくり見よう。。
・データマネジメント構成要素(第2.1版)
  ■DM戦略
  1.データマネジメント戦略と評価
  ■DM組織
  2.実行体制の構築/維持
    → 中長期的に成功させるためには、予算化と予算に対する経営層のオーソライズ獲得が重要。
      社内で予算化されず認知されていない活動はいつまでも個人の活動どまりになる。
  ■DM人財
  3.データマネジメントを担う人財像の定義と育成
    → プロフェッショナルスキル(データプランニング、モデリング技術、データクレンジング、名寄せ など)
      モチベーション、キャリアパス
  ■データライフサイクル・オペレーション
  4.データ・プランニング
    → データ管理方針の定義
        ・データソースは一箇所(一事実一元管理:1 Fact, 1 Place)
      データ品質の定義
      データ標準化のルール
        ・文書交換フォームのデータ標準化
        ・システム間交換情報のデータ標準化
        ・蓄積情報のデータ標準化
      データ運用方針
        ・CRUDの管理
        ・データオーナー設定
        ・データ品質の監視
  5.データ・アーキテクチャ設計
    → データモデリング、データ論理設計
  6.データ設計/構築
    → データ統合/移行、データクレンジング
      現状のデータアセスメント
  7.データ運用設計
  8.データ運用
    → データの精度/品質を保証
      データ変更/見直し、消去
      データアーカイブ
        ・データバックアップ データの可用性、整合性、復元可能性を確保
      ユーザー教育
  9.データ品質モニタリング/監査
    → データ品質チェック、
      データ監視(容量、性能、テータ転送、ルール適合性、品質監視、セキュリティ監視)
  10.データ利活用
    → データ分析、仮説検証、BI
      費用対効果測定、データプランニングへのフィードバック
      定着化推進(教育、キャンペーン)



★確認すること
・データ品質管理
   辞書管理
   コードの体系化/統一化
   マスタデータ管理

・データ設計
・データモデリング
   対象業務で扱うデータ構造の全体像を表現すること、ER図など
・コード化?(品質管理の一部?)コード定義とは?

■Gartner Magic Quadrant
Data Integration Tools → SAS
MASTER DATA MANAGEMENT OF CUSTOMER DATA SOLUTIONS
 → インフォマティカ
MASTER DATA MANAGEMENT OF PRODUCT DATA SOLUTIONS
 → Riversand、インフォマティカ
Data Warehouse and Data Management Solutions for Analytics
 → Teradata
Storage Resource Management
Enterprise Information Archiving
 → Veritas


■会社、団体
SAS
インフォテリア
株式会社データ総研
インフォマティカ
リアライズ (NTTデータ
DAMA日本支部
 → http://www.dama-japan.org


■リンク
いい!
データ管理とは 〜 SAS
http://www.sas.com/ja_jp/insights/data-management/data-management.html
http://www.sas.com/ja_jp/software/data-management.html
http://www.sascom.jp/download/pdf/pb_data-management_1501.pdf


マスターデータマネジメント/マスターデータ管理(MDM) 〜 インフォテリア社
https://www.infoteria.com/jp/mdm/solution/column/a01.php
→ 品質、クレンジング、名寄せ
→ 顧客データ統合(CDI)、製品データ統合(PIM)
https://www.infoteria.com/jp/warp/mdm.php
https://www.infoteria.com/jp/contact/mdm/column/?gclid=CLiumIrGtswCFQ9vvAodU9AClQ
 →★登録して

データマネジメントコンソーシアム
http://japan-dmc.org
・★毎年 3月にセミナーがある
・共通語彙基盤


http://www.nttdata.com/jp/ja/insights/innovation_eye/2010110401.html
データマネジメントの4つのステップ
・データの現状を把握する
・自社に必要なデータの状況を定義する
・今あるデータをきれいな状態にする
 → クレンジング
・きれいなデータ状態になるよう入力の管理をする
 → 入力管理、確認体制

http://itpro.nikkeibp.co.jp/article/COLUMN/20101101/353666/

https://enterprisezine.jp/iti/detail/2200
データ統合プラットフォーム
・データウェアハウス
・データマイグレーション
・データ統合
・マスターデータマネジメント
・データ同期
B2Bデータ交換

富士通
今後のICT活用に向けた「データマネジメント」
http://www.fujitsu.com/jp/group/fri/column/opinion/201308/2013-8-2.html
・データ品質担保
 → 辞書管理、コード体系化/統一化、マスターデータ管理
・データ利活用環境
 → システム/ツール
 → 運用ルール/組織 データの管理責任、変更権限
データマネジメントサービス


http://it.impressbm.co.jp/articles/-/12487
データが流れることで、システムとシステム、業務と業務をつないでいる。そのため、
システム中心ではなく、データ中心で業務を横断的に考えなければならない。

インフォマティカ
https://www.informatica.com/jp/products/data-integration.html
★登録でEBOOK
製品
 ビッグデータ活用
   ビッグデータ統合、ビッグデータガバナンスおよび品質、ビッグデータセキュリティ
 クラウド統合
   クラウドアプリケーション統合、クラウドデータ統合、クラウドデータ管理、接続性
 データ統合
 データ品質
 データ・セキュリティ
   データマスキング、テストデータ管理、データアーカイブ
 インフォマティカ プラットフォーム製品
 サービスとしての統合プラットフォーム
 マスターデータ管理


■関係ない系
・DMP(Data Management Platform: データ・マネジメント・プラットフォーム)
広告主を中心とした事業会社が、自社と外部の様々なデータを一元管理・分析する基盤