小川卓が「データアーキテクト(データ整備人)を”前向きに”考える会」に登壇
「データアーキテクト(データ整備人)を”前向きに”考える会」はフリーのデータアナリストであるしんゆうさんが主宰する無料イベントです。
今回は4回目の開催であり、その参加者はなんと576人という超人気イベント!
このイベントの趣旨としては
データを整備・抽出・加工したりダッシュボード作ったりとエンジニアとアナリストの間にある「誰かがやらないと別の誰かが困るのに、なぜか誰もやりたがらない役割」であるデータアーキテクト(データ整備人)のスキル・ノウハウ・キャリアなどについて、恨みつらみではなく”前向き”に考えようという会です。
とのこと。
小川卓や私を含めウェブアナリストの皆さんは、必要なデータを選別するためのヒアリング、データの取得設計、実装、取得データの加工、取得データを活用した解析といった作業を行っています。
このように常日頃からデータを取り扱う我々ウェブアナリストにとっても非常に興味深い内容であろう「データアーキテクト(データ整備人)を”前向きに”考える会」に小川卓が登壇しました!
今回はウェブアナリストの前は飛行機の整備士をやっていたので「整備」という言葉にもグッと来ている提案型ウェブアナリストの福田がお送りします。(すみません!どうでも良いですね!)
目次
どうやって「データを整備すると良いことがある」を周りに伝えるか:しんゆうさん
しんゆうさんがご経験されてきた中で、刺さりやすい「データ整備をすると良いことがある」の伝え方を発表されました。
ウェブ解析の意図や重要性を伝えるのに苦労する、というウェブアナリストの命題と重なる部分がありますね。
話を伝えるべき人は実際に困っている問題意識がある人で、
データを整備する
↓
データが使いやすくなる
↓
意思決定の正確さと速さの向上に繋がる
というフローを伝えるのが良さそう、ということでまとめています。
「意思決定の正確さと速さの向上に繋がる」というのは担当者としても上司や経営陣にアピールしやすく予算を取るときにも助けになるキラーセンテンスなのではないか、と感じました。
データ整備に必要な「実装設計書」の作成とコミュニケーション事例:小川卓
小川卓の発表は「実装設計書」の作成とコミュニケーション事例について。
私も提案型ウェブアナリストの時に小川卓からGoogle Tag ManagerやGoogle Analyticsの実装設計書の作り方を習いました。
小川卓が以前より言っているのが
「分析の質は取得しているデータの質に依存する」
ということです。
これは当り前のようで本質を突いている名言なのではないかと思います。
そもそもアナリストやマーケターが分析をしようとしたときに、必要なデータが取得できていなかった場合や、取得していたデータの信頼性が十分ではなかった場合などはそのデータから導き出された分析結果や改善提案で成果を出すことは難しいでしょう。
これら取得しているデータの質を担保するために小川卓が利用しているのが「実装設計書」です。実装設計書の役割としては以下のものが挙げられます。
- データの取得目的の整理
- 実装や設定以来のベースとなる
- 何を取得しているかを把握できる
ドキュメントとして残しておくことで、運用開始後の確認や共有などでも役に立ちそうですね。
小川卓が実際に作成した実装設計書のサンプルがこちらで公開されているので、ご興味がある方はぜひご覧いただければと思います。
また、小川卓の過去記事で「アクセス解析に取り組んでいる私が、目指すべき役割は「interpreter」であるべき…というお話」でも今回のデータ整備人に通じる内容が語られているので、深堀りしたい方はぜひこちらもご覧ください!
もう一度、表計算ソフトを愛でる:高比良めぐみさん
BIツールが充実している現在においても表計算ソフトは強力!という発表でした。
表計算ソフトの使いどころとしては
- 単発のデータ加工に
手元にあるデータを少し加工したりサンプルデータを作る場合などに表計算ソフトは便利
- アウトプット先として
分析環境構築初期段階やBIツール導入前の一時的なアウトプット先として使いやすい
- データソースとして
ビジネスユーザーが直接インプットするマスターデータとして有効
小川卓もGoogleデータポータルなどのBIツールを鬼のように使いこなしていますが、やはりExcelを使っていることも多々あり、その使い方は上記の①②③に該当するような内容でした。
便利なツールが数えきれないくらい乱立している時代ですが、ベストプラクティスを見つけていきたいですね!
スキル0が曖昧な領域を埋めるために人の流れを整備した話:山崎 隆弘さん
日々の分析に必要なデータを格納する「データ管理者」と格納してもらったデータをもとに分析をする「データ活用者」との間に曖昧な領域がある、という定義から始まりました。
この曖昧な領域は、データの流れが多くの人の協力で成り立っており、さらにこの曖昧な領域を担う人はビジネス側とエンジニア側の両方の観点が必要であるという点から、周囲を巻き込むことが必要不可欠とのことです。
周りを巻き込んで「曖昧な領域」を埋めるために山崎さんが行ったステップは三つ
- データに関わるすべての人と関係性を築く
- 関係性ができた人に依頼してもらうように促す
- 依頼をしてくれた人が「曖昧な領域」を埋められるようにする
なんと半年間で約70人の関係者全員とランチに行き関係を作っていったそうです!
これは今回のテーマである「曖昧な領域」を埋めるという目的だけではなく、そのほかの多くの仕事でも参考になる内容ですね!とても勉強になります。
embulk, digdagを用いたデータ基盤構築:土川 稔生さん
私にとっては初耳であった「embulk」と「digdag」というデータ整備に活用できるツールを使ったデータ整備のお話です。今回の登壇者の中では一番テクニカルなお話だったのではないでしょうか。
embulk:オープンソースのバルクデータ転送ツール
digdag:タスクの実行、スケジューリング、モニタリングをするためのツール
取得したデータをembulkにインプットし、加工、それをBigQueryに出力する。これを
digdagでスケジューリングして実行するとのことです。
最初の構築は苦労するかもしれませんが、全て自動で出力される状態に持って行ければ属人化もしないし、工数をずっと減らせるのでとても魅力的ですね!
未来を変える! Withユーザー志向:成瀬エールさん
成瀬さんが提唱するWithユーザー志向とは
「設計/開発する側の都合ではなく、実際に利用する人たちと共にデータの整備や活用をしていく考え方」
です。
一般的にデータを活用するユーザーは“与えられた環境の中だけ”の発想で運用や改善を行うことになりがちなので、その限界をデータ整備人が壊していこう!というお話です。
そのためにはデータ整備人がデータ活用者とのオープンな関係を構築し、データ活用者のこと(現状の運用方法や活用方法など)を知り、またデータ活用者にはデータを知ってもらう機会を増やすということが重要になってきます。
その結果、データ活用者は新たな知識で刺激を受け、こういうこともできそうだ、といった気づきなどから未来を良くする行動を起こしやすくなる、ということです。
日の目を見ることは少ない「データ整備人」ですが、皆さんのお話を聞いていると、かっこよく思えてきました!
業務データ整備における課題と対応について:和田怜さん
ITトレンドの移り変わりに伴ってクライアントサーバー、PCサーバー、クラウドなど社内でシステムが散在しがちになり、さらに日本ではシステムの導入時にカスタマイズをする企業が多いため、データ整備が複雑化しているとのことです。
具体的な不具合としては、
・不統一なマスタデータ
・日次・月次などが混在したデータ
・単位が異なるデータ
などを例に挙げています。(↑これウェブアナリストの皆さんも頷いてしまうのではないでしょうかw)
しかし、実際に改修するとなるとシステムの作り直しと同じくらいの労力がかかったり、別会社化している場合は一社だけではなく関係会社各社の合意を取って進める必要があったりして一筋縄でいかないことも多いそうです。
和田さんの所属する株式会社シマントでは全社的なデータ整備の課題を解決するサービスを展開されているそうです。
“あえて”データ整備人になるメリットを前向きに考えてみた:香村貴之さん
約一年間データ整備人をされてきた香村さんの経験から、データ整備人を前向きに考えることについてお話しされています。香村さんはもともとデータアナリストを目指しているらしく、ご自身の体験に基づいておりとても説得力がありました。
特に印象的だったのは、データ整備人のその後のキャリアについての考察。
「データ整備人」は
- 技術的な専門知識(エンジニア)
- ビジュアライゼーション能力(デザイナー)
- ヒアリング能力(営業)
これらの部分的な要素を混ぜたハイブリッド的な役割、としています。
さらに、データ整備人はデータ活用の中流に位置するため、データエンジニア、UXリサーチャー、データアナリスト、グロースハッカーなど逆にキャリア選択肢の幅が広いとも考えることができる、とのこと。
もしかしたらデータ整備人の知識は広く浅くなのかもしれませんが、だからこそ全体を俯瞰してのディレクションや、関連職種にキャリアチェンジした場合にも重宝される人材に成りうるんだろうな、と思いました。
さいごに
いわゆる縁の下の力持ちである「データ整備人」。
企業のマーケティングや独自システムと比較すると、ウェブ解析においてのデータ整備はまだシンプルなほうかと思います。
しかし、私たちウェブアナリストは解析に使いたい(取得したい)データの洗い出し、解析ツールなどで構築や設定、取得データの可視化や加工、取得データの活用、といった一連の流れをすべて一人で任されることも少なくありません。
これは逆にいうと、私たちのメインディッシュである「ウェブサイトの解析」をするために必要なデータのあれこれが、すべて一人で実現できる環境が整っている、とも言うことができるのではないかと思います。
つまり、データ取得者からデータ活用者までがすべて自分自身ということで、自分の思うがままにデータを取得し、それを自分の思うがままに活用することができる職種ということです。
データ整備について初めて深く考えていく中で、これらの事実に気づいたときに私は改めて「ウェブアナリストかっけーな!!」と思うようになりましたw
データ整備人についてさらに気になる方はぜひ当日の様子を、twitterで#前向き整備人をご覧ください!