クラウドエンジニアブログ

データガバナンス ~知識編~

human05

古林

みなさまこんにちは。クラウドアーキテクトの卵です。

前回の話の続きとなりますが、断捨離、および、部屋の改造が終わりました。
このブログも、新しく揃えたリモートワーク環境で書いています。やはり、お気に入りのものに囲まれた環境だと気分が上がりますね!
今回分かったのが、社内の設備(机とか椅子とか)がなかなかいいものだったんだ、ということでした。特に机の奥行はさすがだなぁと。
ちなみに、今のところ、一番の課題(部屋がスッキリした状態を維持することができるか)は顕在化しておりません。


<目次>
  1. はじめに
  2. データガバナンスとは
  3. データガバナンスの必要性
  4. おわりに



1. はじめに

データ系のセミナー / ウェビナーに参加してよく耳にするのが「(お客様のデータ利活用の課題として)データがどこにあるのか分からない。いつの時点のデータか分からない」という内容です。私がデータ系のセミナーに行き始めた 3 年前ぐらいからずっと言われ続けてきていることなので、なかなか根深い問題だと思います。私は単純に「ふーん、うまく整理整頓ができていないんだな」と単純に思っていました。

先日、とあるウェビナーを受講したのですが、その際に「データガバナンス」という言葉を聞きました。

『「データガバナンス」?Azure であれば、ガバナンスと言えば ID 管理系でよく使われる言葉だけど… Azure Policy とか。』

【参考:Azure の管理サービスの概要 – ガバナンス】
https://docs.microsoft.com/ja-jp/azure/governance/azure-management#govern

よくよく聞いてみると、上述したお客様の問題と大いに関連がありました。
先に結論から言ってしまうと、データガバナンスはデータ利活用に必須です。

今回は 2 本立てでブログをまとめようと思います。
まずは知識編として「データガバナンス」とは何かをまとめてみました。


2. データガバナンスとは

データガバナンスとは、平たく言ってしまうと「データの運用ルール」のことです。

実は、「データガバナンス」という言葉自体はそれほど新しいものではなく、2012 年には既に存在していたようです。
(データを追う者としてはお恥ずかしいことに、今回調査してみて初めて知りました。。。)

ここでは、以下 3 つのドキュメントをご紹介します。
いずれも、データガバナンスの定義として、データの管理について触れています。

  • 総務省「社会資本分野におけるデータガバナンスガイド」
    平成 24 年 7 月(= 2012 年 7 月)に出された、総務省の「社会資本分野におけるデータガバナンスガイド」には、以下のように記載があります。

1.1 本ガイドの目的と使い方
(1)ガイドの方向性

本ガイドにおける「データガバナンス」とは、上記のオープンガバメント化の流れに沿った方向に向かって、データの蓄積や公開、および二次利用等を促進する上での好ましい管理の在り方を意味している。

【参考:社会資本分野におけるデータガバナンスガイド】
https://www.soumu.go.jp/main_content/000166474.pdf


  • 一橋大学大学院国際企業戦略研究科 井上由里子教授「ICT先進都市 東京 実現のためのデータガバナンス」
    また、2014 年に出された「ICT先進都市 東京 実現のためのデータガバナンス」の資料には、データガバナンスを「データ利活用の制度的基盤」と定義しています。

2.	データガバナンスとは1

【参考:ICT先進都市 東京 実現のためのデータガバナンス】
https://www.senryaku.metro.tokyo.lg.jp/ict/ictconf/conference/conf_a03/a03_170420_document_04_01.pdf


  • 経済産業省「データ利活⽤とデジタルガバナンス」
    データガバナンスの定義は直接されてはいませんが、2019 年 3 月 に出された、経済産業省の「データ利活⽤とデジタルガバナンス」には、データ利活用の課題と対応の方向性として、以下のように記載されています。

2.	データガバナンスとは2

【参考:データ利活用とデジタルガバナンス】
https://data-trading.org/wp-content/uploads/2019/04/dtaforum7th004_meti_sekine_20190327.pdf

上図の課題認識の部分は、データに関わる者としては納得できる部分が多いのではないでしょうか。
データガバナンスの観点では、特に上図の赤線部分がデータ管理に関わってくると思われます。


3. データガバナンスの必要性

「国や都でデータガバナンスについて協議されているのは分かった。でも、データガバナンスって何で必要なのかがピンと来ない…」
そう思われる方もいらっしゃるかもしれません。
本章では、データガバナンスはなぜ必要なのかを整理してみます。

前章で「データガバナンスとは、平たく言ってしまうと「データの運用ルール」のことです。」と記載しました。
データの運用ルールが無ければ、どんなことが起きるでしょうか?

お客様からの問い合わせや、データ系のセミナー / ウェビナーでよく紹介される事例(お困りごと)は、「データの内容」と「データのセキュリティ」の大きく 2 つに分けられることが多いように感じます。

  • データの内容
    • データが多すぎて、必要なデータがどこにあるのかが分からない。
    • 各システムの更新頻度が異なるため、それぞれのデータがいつの断面の情報かが分からない。
    • データソースの仕様が変わったため、データの意味が分からなくなった。

本ブログの「1. はじめに」に記載した内容が含まれています。
上記の問題を解決するには「データの品質を保つルール」が必要となります。

  • データのセキュリティ
    • データを集めたら、機密データが全社員に公開されてしまった。
    • データをマスキングしなかったら、情報流出だと怒られた。
    • 逆に、データをマスキングした場合、業務で使えないと怒られた。

2 番目と 3 番目の内容は、一見背反しているように見えますね。
(データの管理者は辛いところだと思います。。。)
「誰が、どのデータを取り扱って良いか(もしくは、閲覧不可なのか)」という権限管理が、データにおいても必要と言えるでしょう。
上記の問題を解決するには、「データのセキュリティを保つルール」が必要となります。

もう少し「あるある」な事例をご紹介いたします。

データの利活用に必要なもの・役割は、最低でもこれだけ必要と言われています。
(実際には、もう少し細分化されることもあります。また、会社によって名称が異なることもあります。特に「役割」の部分。)


<データの利活用に必要なもの・役割>
3.	データガバナンスの必要性1

上記の中でも、データ分析の主役であるデータサイエンティストは、みなさまもすぐ思い浮かんだのではないでしょうか。

データサイエンティストは、社内外のいろいろなデータを組み合わせて分析し、最終的に新たなビジネス価値を生むのがお仕事ですが、元となるデータが無い、もしくは、データが使い物にならないと仕事ができません。
特に、社内の各システムのデータを集めて分析しようとした場合、以下のような状況に遭遇したことはないでしょうか。
(私の経験上、いずれも「あるある」です。両方の言い分が理解できるため、何とも言えない気持ちになることもあります。。。)


<データサイエンティスト vs システム管理者>
3.	データガバナンスの必要性2

このような状況も、データガバナンス(=データの運用ルール)が無いから起こってしまいます。この状況のままでは、データ分析の非効率により、十分なデータ利活用が実施できない恐れがあります。組織としてどのようにデータを管理するかを統合的に考えることが不可欠です。


4. おわりに

今回はデータガバナンスとは何かを調査してみました。「ガバナンス」という言葉通り、データ全体に統制を効かせることは、データの利活用を推進していく上で必要となることがお分かりいただけたかと思います。

データの品質やセキュリティを担保し、あらゆるデータを管理することは、データガバナンスが効いている状態に直結すると言えます。
そのためにも、システム的なルールだけではなく、組織・人を含めた全体的な運用ルールが必要となります。
(組織・人の部分が一番難しいことは承知していますが。。。)

では、Azure 上のデータ分析基盤環境において、実際にどのようにすればデータガバナンスが保たれるかについては、次回のブログにまとめようと思います。お楽しみに!

【総合】お問い合わせ

ソリューションに関する全般的なお問い合わせはお気軽にご相談ください。

ピックアップ

セミナー情報
クラウドエンジニアブログ
clouXion
メールマガジン登録