統計分析と単純集計は何が違うのか?|ビジネスリサーチラボ対談(伊達 洋駆 × 正木 郁太郎)

ビジネスリサーチラボは、2020年9月に対談公開収録「人事のためのデータ分析・活用のポイント」を開催しました。

統計分析を活用した組織サーベイや人事データ分析を多数手掛ける伊達洋駆(ビジネスリサーチラボ代表取締役)・正木郁太郎(同テクニカルフェロー)が、人事部門でデータ分析を行う際のポイントについて対談しました。今後2回にわたって、当日の様子をレポートします。



登壇者

伊達 洋駆

神戸大学大学院経営学研究科 博士前期課程修了。修士(経営学)。2009年にLLPビジネスリサーチラボ、2011年に株式会社ビジネスリサーチラボを創業。以降、組織・人事領域を中心に、民間企業を対象にした調査・コンサルティング事業を展開。研究知と実践知の両方を活用した「アカデミックリサーチ」をコンセプトに、組織サーベイや人事データ分析のサービスを提供している。共著に『組織論と行動科学から見た 人と組織のマネジメントバイアス』(ソシム)や『「最高の人材」が入社する 採用の絶対ルール』(ナツメ社)など。




正木 郁太郎

2017年東京大学大学院人文社会系研究科博士後期課程修了。博士(社会心理学)。2020年現在、同研究科研究員として在籍。人事・組織に関する研究やHRTech、さらに中等教育などの領域で、民間企業からの業務委託や、アドバイザーなどを複数兼務。組織のダイバーシティに関する研究を中心として、社会心理学や産業・組織心理学を主たる研究領域としており、企業や学校現場の問題関心と学術研究の橋渡しとなることを目指している。著書に『職場における性別ダイバーシティの心理的影響』(東京大学出版会)がある。



はじめに

伊達:


従業データを活用して人事を進める企業が増えています。ビジネスリサーチラボでは十数年にわたって組織サーベイや人事データ分析をサービスとして提供してきました。今、データ分析が盛り上がりつつある中で、私たちに情報提供できる余地があるのではないか。これが今回の対談の背景です。


本日のテーマは「データ分析をより意義のあるものにするにはどうしたらいいか」。これについて対談形式でお話しします。


まず私の自己紹介です。私は、もともとは大学院で経営学の研究を行っていましたが、途中でビジネスリサーチラボという法人を立ち上げて、現在に至っています。


ビジネスリサーチラボでは、社会科学の研究知見を活用し、組織サーベイや人事データ分析のサービスを提供しています。取り扱っているテーマは幅広く、人事全般にわたります。


正木:


正木と申します。同じくビジネスリサーチラボでテクニカルフェローというかたちで、主に技術的・理論的な側面でサポートをしています。


もともと社会心理学の研究をしており、現在は東京大学の社会心理学研究室に研究員として所属しつつ、個人として複数の会社と協働しています。その中の一つが、ビジネスリサーチラボです。



伊達:


正木さんと私の出会いは、もう7・8年前になるはずです。正木さんが大学院に入ったときから、一緒に様々な組織サーベイをやってきました。今も共同やディスカッションを続けている関係になります。


(ちなみに、正木さんの書いた『職場における性別ダイバーシティの心理的影響』という学会賞も受賞した学術書ですが、この中に含まれている調査の幾つかはビジネスリサーチラボで一緒に実施したものです。)


正木さんと実施した分析プロジェクトを二つ紹介しましょう。一つは、大手システム会社をクライアントに組織サーベイを提供した事例です。人事異動を積極的に展開していく準備として、異動後に適応できる人とできない人を分ける要因を分析しました。


もう一つは、OA機器メーカーでダイバーシティに関する意識調査を行った事例です。ダイバーシティ推進の施策を考えたいクライアントに対して、職場風土の影響などを分析しました。



単純集計と統計分析は何が違うのか


伊達:


本日の対談に先立って、幾つかのトピックを用意しています。


第1のトピックは「単純集計と統計分析はどう違うのか」というものです。一つ例を出しましょう。


営業部門と開発部門でエンゲージメントサーベイを行いました。営業部門の方が開発部門よりもエンゲージメントの平均値が高いことが分かりました。これは単純に集計した結果ですので、ここでは「単純集計」と呼んでおきます。対して、その平均値の差が統計的に意味のあるものかを検定するのが「統計分析」に当たります。


正木さんに「単純集計と統計分析の関係性」についてお尋ねできればと思います。如何でしょうか。



正木:


統計分析というのは、ある種大きいカテゴリーのことを指しており、その下に単純集計と、他のいくつかの手法やカテゴリーが含まれているという、そういう関係で理解するのが一番いいのかなと僕は理解してます。


では広く統計分析の中にどういうものが含まれるのかというと、一つは今おっしゃっていただいた平均値を比べるだとか、集計にあたるものです(単純集計)


ただ、営業の部門と開発の部門で平均値に違いがありそうだ、という集計が出たときに、「たまたまじゃないか」という可能性もありうる。どうしてもその日にたまたま曇りだった・晴れだった、それが気分に影響した、というような「誤差」の問題です。


伊達:


晴れているとポジティブな気分になるという研究もありますもんね。



正木:


ありますね。晴れているとポジティブなムードになるとか。その他にもいろいろ細かいバイアスとか、誤差みたいなものが出てくる。


他にも、2つの部門がともに回収率100パーセントならよいものの、片方90パーセント、もう片方は70%パーセントということもありうる。この場合にも「全員に聞いたのでなければ真相は分からない」となってしまう。


こうした「たまたまじゃないか」に反論できるかどうかを、数字で担保してやる方法が、「統計分析」に含まれるもう一つの内容。「統計的に有意か」(統計的検定・推測統計)の話ですね。


結局、集計値の状態に加えて、それが「誤差だ」と割り切ってよいのか、「誤差とは割りきれない」しっかりした差なのかを、裏づけを取るための方法。それが統計的検定という、統計分析に固有の方法です。「有意」「有意じゃない」という言葉は、もしかすると皆さんもどこかしらで聞いたこともあるかもしれません。




伊達:


私が特に大事だと感じたのは「誤差」の話です。聞き慣れない言葉かもしれませんが、組織サーベイや人事データは、実は完璧な測定ができているわけではなく、誤差が含まれています。


この前提を踏まえると、誤差の影響を考慮せずに、データをもとに人事施策を意思決定するのは危険だと分かると思います。


例えば、誤差の大きなデータにおいて、開発部門のエンゲージメントが低かったとします。その結果にもとづいて、開発部長が呼び出され、社長に怒られ、改善策を考えよと言われたり、あるいは、これまでにない人事制度を導入することに決めたりするのは、従業員にとって不利益が発生するリスクがあります。


統計分析と単純集計の違いを考える上で、私がよく挙げるのは「ばらつき」のことです。統計分析ではしばしばデータのばらつきを考慮します。いきなりばらつきと言われても何だろうとなるかもしれません。


先ほどのエンゲージメントサーベイの例を続けると、例えば、営業部門でエンゲージメントの値がどれぐらい分散しているか。みんなが平均に近い値ならばらつきは小さく、低い値から高い値まで様々な人がいるならばらつきは大きいと言えます。統計分析でばらつきを検討する理由は、ばらつきが大きいと誤差が大きい可能性が高まるからです。


エンゲージメントの得点が1点から5点だったとします。営業部門の人は1点から5点までばらつきが大きく、平均点が4点。他方で、開発部門の人もまた1点から5点までばらついており、平均点は3.8点でした。


この二つを比較したら、平均だけ見ると、営業部門のほうが高いわけなんですが、ただ営業部門も開発部門もばらばらな点数をとっています。そのような中で、この二つを比べる意味はあるでしょうか。あまりないと言えますよね。



統計分析を実際に行うのは難しいという人事の方でも、まずはデータのばらつきを見てみるところから始めると良いでしょう。平均値の差を見るだけではなく、それぞれのグループの中での得点の分布をヒストグラムして眺めてみる。厳密な分析ではないですが、その作業を一つ挟むだけでも判断を留保でき、意思決定の精度を少しでも高められるはずです。



統計分析を行った方が良いケース


伊達:


さて、単純集計と統計分析の違いについて話してきましたが、続いて、単純集計ではなく統計分析を行った方が良い場面について考えていきましょう。どのようなケースにおいて統計分析が求められるでしょうか。

正木:


すぐに思いつく論点は二つです。一つ目の論点は「何かと何かの関係性を見たいときなのか、それとも一つの指標だけを見るだけでよいのか」


一つの指標だけを見ればよいときには、単純集計の方が便利です。例えば、100点満点のテストで全員がどのように回答しているのかを見たい場合です。みんな100点と回答しているのか、それとも0から100まで凄まじくばらついているのか、こうした分布を単純に見る場合ですね。あるいは「あの人はどんな回答なんだろう」と個別に確認する場合も、難しい分析は不要です。むしろ、グラフを細かく見ることの方が重要です。


二点目の論点が、「一つの指標に対して解釈が多様にあり得るか、それともシンプルか」という点です。例えば先ほどのエンゲージメントサーベイの例でいえば、その日の天気がどうだとか、たまたま体調が悪かったとか。こういった可能性を除外する必要があるときには、「部署」「エンゲージメント」の指標以外に、「回答日の天気」「体調」などを組み合わせて分析をする必要が出てくる。このように、解釈が複雑になりうる場合は、細かな統計分析をした方がよいと思います。


伊達:


私からも統計分析が必要なケースとして、二点追加します。一つはデータの量が少ない場合です。データの量が少ないと、誤差が含まれる可能性が高く、より慎重な検討を要するからです。


組織サーベイや人事データ分析をしていると、「何人ぐらいのデータを集めればいいですか」という質問をよくいただきます。専門的にはパワーアナリシスなどの方法がありますが、仮にこの質問の背後に「統計的に有意な結果が出るくらい、多くのデータを集めたほうが良い」という発想があれば少し危険です。


有意な結果を出すためにサンプルサイズを調整するのではなく、小さいサンプルサイズのときこそ、立ち止まって考えられるように統計分析をする。そうした考え方が必要です。

もう一つは、分析結果をもとに施策を決める場合です。たまたま得られた誤差の大きな結果によって、何かしらの施策を進めることを決めると、それによって不利益を被る従業員が出てくる恐れがあります。


従業員への不利益を避けるための努力をするのは、プロフェッショナルとしての人事の職業倫理を守る上でも大切です。



統計分析が有効に機能するシーンとそうではないシーン


伊達:


「人はハンマーを持つと全てが釘に見える」といった格言もあり、何でも統計分析すれば解決できると思ってしまいがちです。しかし、実際にはどのようなシーンで、統計分析は機能しやすい、あるいは、しにくいのでしょうか。


正木:


一つの指標の中に複数の意味が込められてしまっている場合には有効に機能しにくいと思います。あるいは、有効に機能させるためには高度な分析が必要です。ありがちなのは「人事評価のデータ」です。



伊達:


人事評価はパフォーマンスを表しているのか、上司から気に入られていることを表しているのか。他にも会社によっていろんな意味合いがありますよね。このように、様々な意味が一つの指標の中に含まれていると、結局何を分析しているか分からなくなってしまいます。


正木:


そうですね。人事評価や、体系化されていない採用面接で「何となくAかな」と評価されて取得されたデータをイメージしてください。このデータを使って、例えば「身長が高い人のほうが採用面接で受かりやすい」という関係の有無を分析する。しかし大体の場合、良くも悪くも差がはっきり出ません。人事評価や採用評価が、そもそも何を測っているのかわからないからです。


人事の方が手元のデータで統計分析に挑戦して、うまく行かずに諦めてしまう。その一番の理由が、実はデータの粗さにあるのではないかと思います。


逆にシンプルな指標、例えば「営業業績」のような指標のほうがうまく分析に使いやすい。シンプルな分析だったとしても、しっかり結果が出る。あるいは、「そうか、やっぱりこれは関係なかったんだ」と納得して見極められる。その意味では、統計分析にトライする面白みや、やりがいはあるかもしれません。分析手法ではなく、データの質の勝負になりますが。


伊達:


なるほど。明確に定義されたデータがある状態が、統計分析に適合したシーンということですね。


私から一つだけ付け加えると、「必要なデータがそろっている」ということです。データの質ももちろん大事です。しかし、そもそも必要なデータがそろっていないという問題もあります。


例えば、ビジネスリサーチラボでは「社内にある人事データを用いて、エンゲージメントの要因(※エンゲージメントを高めたり、低めたりするもの)を見出したい」という相談を受けたことがあります。私が「エンゲージメントに該当するデータとして想定しているものはありますか」と尋ねると、「え?」となってしまいました。


それでも、社内データの一覧を見ていく中で、理論的にエンゲージメントと重複し得るデータをどうにか見つけられました。ただ、次の課題が現れました。エンゲージメントに該当しそうなデータ以外に目をやると、勤怠情報などしかなかったのです。


これを聞いて私は正直「今あるデータのみでエンゲージメントの要因を探るのは無理かもしれない」と思いました。エンゲージメントの要因は多くの研究で検証されていますが、勤怠情報が大きな影響を及ぼすという話はあまり聞きません。つまり、要因の候補に当たるデータが揃っていなかったわけです。


結局、この企業では組織サーベイを実施することで、不足するデータを補う作戦をとり、上手くいったのですが、当初のようにデータが揃っていない状態だと、統計分析をいくら頑張っても結果は出ないでしょう。




後編に続く


※後編では、「データ分析のテーマの決め方」「データの有効な集め方」について検討します。



関連記事①:人事に統計分析が必要なケース3選(伊達洋駆)


関連記事②:「統計的に有意」とは何か?(正木郁太郎)