みなさまこんにちは。クラウドアーキテクトの卵です。
前回の話の続きとなりますが、断捨離、および、部屋の改造が終わりました。
このブログも、新しく揃えたリモートワーク環境で書いています。やはり、お気に入りのものに囲まれた環境だと気分が上がりますね!
今回分かったのが、社内の設備(机とか椅子とか)がなかなかいいものだったんだ、ということでした。特に机の奥行はさすがだなぁと。
ちなみに、今のところ、一番の課題(部屋がスッキリした状態を維持することができるか)は顕在化しておりません。
データ系のセミナー / ウェビナーに参加してよく耳にするのが「(お客様のデータ利活用の課題として)データがどこにあるのか分からない。いつの時点のデータか分からない」という内容です。私がデータ系のセミナーに行き始めた 3 年前ぐらいからずっと言われ続けてきていることなので、なかなか根深い問題だと思います。私は単純に「ふーん、うまく整理整頓ができていないんだな」と単純に思っていました。
先日、とあるウェビナーを受講したのですが、その際に「データガバナンス」という言葉を聞きました。
『「データガバナンス」?Azure であれば、ガバナンスと言えば ID 管理系でよく使われる言葉だけど… Azure Policy とか。』
【参考:Azure の管理サービスの概要 – ガバナンス】
https://docs.microsoft.com/ja-jp/azure/governance/azure-management#govern
よくよく聞いてみると、上述したお客様の問題と大いに関連がありました。
先に結論から言ってしまうと、データガバナンスはデータ利活用に必須です。
今回は 2 本立てでブログをまとめようと思います。
まずは知識編として「データガバナンス」とは何かをまとめてみました。
データガバナンスとは、平たく言ってしまうと「データの運用ルール」のことです。
実は、「データガバナンス」という言葉自体はそれほど新しいものではなく、2012 年には既に存在していたようです。
(データを追う者としてはお恥ずかしいことに、今回調査してみて初めて知りました。。。)
ここでは、以下 3 つのドキュメントをご紹介します。
いずれも、データガバナンスの定義として、データの管理について触れています。
1.1 本ガイドの目的と使い方
(1)ガイドの方向性
本ガイドにおける「データガバナンス」とは、上記のオープンガバメント化の流れに沿った方向に向かって、データの蓄積や公開、および二次利用等を促進する上での好ましい管理の在り方を意味している。
【参考:社会資本分野におけるデータガバナンスガイド】
https://www.soumu.go.jp/main_content/000166474.pdf
【参考:ICT先進都市 東京 実現のためのデータガバナンス】
https://www.senryaku.metro.tokyo.lg.jp/ict/ictconf/conference/conf_a03/a03_170420_document_04_01.pdf
【参考:データ利活用とデジタルガバナンス】
https://data-trading.org/wp-content/uploads/2019/04/dtaforum7th004_meti_sekine_20190327.pdf
上図の課題認識の部分は、データに関わる者としては納得できる部分が多いのではないでしょうか。
データガバナンスの観点では、特に上図の赤線部分がデータ管理に関わってくると思われます。
「国や都でデータガバナンスについて協議されているのは分かった。でも、データガバナンスって何で必要なのかがピンと来ない…」
そう思われる方もいらっしゃるかもしれません。
本章では、データガバナンスはなぜ必要なのかを整理してみます。
前章で「データガバナンスとは、平たく言ってしまうと「データの運用ルール」のことです。」と記載しました。
データの運用ルールが無ければ、どんなことが起きるでしょうか?
お客様からの問い合わせや、データ系のセミナー / ウェビナーでよく紹介される事例(お困りごと)は、「データの内容」と「データのセキュリティ」の大きく 2 つに分けられることが多いように感じます。
本ブログの「1. はじめに」に記載した内容が含まれています。
上記の問題を解決するには「データの品質を保つルール」が必要となります。
2 番目と 3 番目の内容は、一見背反しているように見えますね。
(データの管理者は辛いところだと思います。。。)
「誰が、どのデータを取り扱って良いか(もしくは、閲覧不可なのか)」という権限管理が、データにおいても必要と言えるでしょう。
上記の問題を解決するには、「データのセキュリティを保つルール」が必要となります。
もう少し「あるある」な事例をご紹介いたします。
データの利活用に必要なもの・役割は、最低でもこれだけ必要と言われています。
(実際には、もう少し細分化されることもあります。また、会社によって名称が異なることもあります。特に「役割」の部分。)
上記の中でも、データ分析の主役であるデータサイエンティストは、みなさまもすぐ思い浮かんだのではないでしょうか。
データサイエンティストは、社内外のいろいろなデータを組み合わせて分析し、最終的に新たなビジネス価値を生むのがお仕事ですが、元となるデータが無い、もしくは、データが使い物にならないと仕事ができません。
特に、社内の各システムのデータを集めて分析しようとした場合、以下のような状況に遭遇したことはないでしょうか。
(私の経験上、いずれも「あるある」です。両方の言い分が理解できるため、何とも言えない気持ちになることもあります。。。)
このような状況も、データガバナンス(=データの運用ルール)が無いから起こってしまいます。この状況のままでは、データ分析の非効率により、十分なデータ利活用が実施できない恐れがあります。組織としてどのようにデータを管理するかを統合的に考えることが不可欠です。
今回はデータガバナンスとは何かを調査してみました。「ガバナンス」という言葉通り、データ全体に統制を効かせることは、データの利活用を推進していく上で必要となることがお分かりいただけたかと思います。
データの品質やセキュリティを担保し、あらゆるデータを管理することは、データガバナンスが効いている状態に直結すると言えます。
そのためにも、システム的なルールだけではなく、組織・人を含めた全体的な運用ルールが必要となります。
(組織・人の部分が一番難しいことは承知していますが。。。)
では、Azure 上のデータ分析基盤環境において、実際にどのようにすればデータガバナンスが保たれるかについては、次回のブログにまとめようと思います。お楽しみに!
関連ページ
データガバナンス ~実践編~ |