ビジネスリサーチラボ

open
読み込み中

コラム

確認的因子分析とは何か

コラム

 ある企業の中で「従業員の会社満足度を高めるため、その促進要因を探りたい」と考え、組織サーベイを実施しました。その中で、促進要因として「上司部下関係の良さ」を取り上げ、以下の自作項目5つで、それを測定しました。なお、回答選択肢は「1.あてはまらない~3.どちらともいえない~5.あてはまる」です。

上司部下関係の良さ

  • 「上司との関係は良好だと思う」
  • 「上司は、私のニーズをわかっている」
  • 「私になにかあっても、上司は助けてくれないと思う」
  • 「上司と一緒に食事や飲み会をすることが多い」
  • 「上司は私の強みに合わせた仕事の指示を考えていると思う」

これら5項目の合計得点を上司部下関係の良さを表す得点として扱い、その後のデータ分析に使っていくことになるでしょう。

以上は組織サーベイでありがちな得点算出の手続きですが、一つ問題があります。それは「測定に用いた5項目において、想定された概念のまとまりが本当に認められるのか検証されていない」点です。

ある概念を組織サーベイで測定する際は、多くの場合、質問内容を作成した時点で「この質問は〇〇の概念を測定するためのもの」と決めているはずです。しかし、測定した各質問のデータが、狙った概念を想定通りに測定できているかは、その判断とは別次元の問題です。

組織サーベイにおいて概念を複数項目で測定し、それらの回答値を合算して得点化するなら、「各項目の回答データが、想定した概念をうまく捉えられているか」を検証する必要があります。

本コラムでは、そのための検証や評価を可能とする「因子分析」について解説します。

因子分析とは何か

因子分析とは、測定したデータの背後にある構造を統計学的に推定する分析手法です(Hair et al., 2014)。因子分析では、各項目に対する回答の背後に「因子」を仮定し、その構造を分析することで、各項目がどのようなまとまりを形成するかを検証します。それによって、複数の項目が想定通りの概念にまとまる根拠を得るのです。

因子分析を用いれば、図1のように、ある概念を測定する複数の項目が、狙った概念(共通因子)のまとまりをもつか、項目ごとに評価できます。

図1 因子分析による検証のイメージ

因子分析の内容に関する説明に入る前に、各質問項目への回答データにおいて想定される「要素」のイメージについて紹介していきます。

因子分析における回答データが含む「要素」のイメージ

組織サーベイでは、測定したい概念に対して質問項目を作成して回答を求めますが、ある質問項目に対する回答は、測定したい概念の程度のみによって完全に決定されるわけではありません。

例えば、上司部下関係の良さを測定する質問「上司との関係は良好だと思う」「上司と一緒に食事や飲み会をすることが多い」を考えてみましょう。これらの質問は、確かに上司と部下の関係性が良ければ、「あてはまる」などの肯定的回答になると考えられます。

しかし、組織サーベイの実施直前に大きなミスをして、上司から強く叱責された従業員がいたとします。その場合、普段は上司との関係が良好だったとしても、「上司との関係は良好だと思う」の質問に対して「あてはまる」とは答えづらくなるかもしれません。

また、「上司と一緒に食事や飲み会をすることが多い」の質問は、普段は上司との関係が良好だったとしても、昨今のCOVID-19の感染対策によって、そのような催しが避けられ、「あてはまらない」と回答するかもしれません。

あるいは、サーベイ回答時の回答者の気分や、「どちらともいえない」など特定の選択肢を選びがちな性格、回答の選択間違えなど、上司部下関係の良さとは本質的に関係のない理由で質問への回答が違ってくることも考えられます。

このように考えると、上司部下関係の良さの質問項目に対する回答は、「上司部下関係がどの程度良いか」で決まる要素と、「上司部下関係の良さと関係がない様々な要因」で決まる要素があることが見えてきます。

因子分析では、各質問への回答に含まれる「測定したい概念」の要素と「測定したい概念と関係しない種々の要因」の要素を、統計解析によって推定し評価します。特に因子分析では、測定したい概念の要素を共通因子、測定したい概念と関係しない要因による要素を独自因子と呼びます(図2)。

図2 各質問項目の回答が持つ要素のイメージ[1]

共通因子による要素が十分に多い質問項目は、それへの回答が共通因子の程度に大きく左右されることを表します。そのような質問項目は「回答が測定したい概念を強く反映している」として、測定したい概念をうまく捉えた項目と見なします。

一方、共通因子による要素が少ない質問項目は、それへの回答が共通因子の程度と関係ない要因で大きく左右されることを表します。そのような質問項目は「回答が測定したい概念を反映していない」として、測定したい概念を捉えられていない項目と考えるわけです。

このようにして、因子分析は各質問項目が測定したい概念をうまく捉えられているか否かを評価します。本コラムでは、因子分析のひとつである「確認的因子分析」について紹介していきます[2]

確認的因子分析とは何か

確認的因子分析(Confirmatory Factor Analysis)とは、「複数の質問項目が、測定したい概念を想定通りに捉えられているか」を統計学的に検証する分析です。

確認的因子分析は、測定に用いた質問項目それぞれについて、どの概念の測定をするものか決まっている際に用いる因子分析です。事前に想定された概念が、各質問項目で想定通りに測定できているかを確認する際に用いられる分析なため、確認的因子分析と呼ばれます[3]

確認的因子分析では、各質問項目がどういった因子にまとまるか、その構造を分析モデルとして分析者が指定します。分析モデルに対して、取得したデータを当てはめてデータ解析を行います。

例えば、最初に挙げた上司部下関係の良さの質問5項目に関する分析モデルを考えてみます。これらの質問は「上司部下関係の良さ」という1つの概念を測定する項目であり、上司部下関係の良さの程度によって回答が左右される、と想定していました。

そこで、「上司部下関係の良さを表す共通因子をモデル上で仮定し、それが各質問項目への回答に影響する」ことを表す、分析モデルを設計します(図3)。図3のモデルは解説用のイメージ図ではありません。専用の描画ツールやプログラミングなどで、実際にこの分析モデルを描きます。

図3 上司部下関係の良さの確認的因子分析の分析モデル[4]

この分析モデルを、取得したデータに当てはめて解析することで、5つの質問項目が共通因子によってどの程度回答が影響されるかを評価できます。

確認的因子分析で得られる解析結果には様々なものがありますが、特に注目するのはモデル適合度因子負荷量です。

モデル適合度とは、「分析者が指定した分析モデル全体に対して、取得したデータがどの程度あてはまっているか」を評価する指標です。これも様々な指標が存在しますが、特に心理学の研究で用いられることの多い指標を表 1にまとめました。

表 1 モデル適合度の各種指標

表 1にあるように、モデル適合度は様々な指標と基準値が提案されています。取得したデータにおける分析結果がこれらの基準を満たしていれば、取得したデータが分析モデルとよくフィットしていることを表し、分析モデルに問題がないと解釈できます。

以下のように、実際の分析では最初にモデル適合度を参照し、分析モデル全体を評価します。なお、以降に示す分析結果の具体的数値は全て架空データの解析結果です。ご注意ください。

図4 モデル適合度出力の例

図4の例では、設定した分析モデルの適合度は全て基準を満たしています(AIC, BICは後のモデル比較で用います)。このことから、この分析モデル全体は、取得したデータによくあてはまっていると解釈できます。

モデル適合度が問題ないことを確認したら、各質問項目の回答に対して共通因子がどの程度影響するのかを具体的に見ていきます。その際に確認する指標が因子負荷量です(図5)。

因子負荷量は、各質問項目に共通因子がどの程度含まれているかを表すもので、項目ごとに算出される指標になります。因子負荷量によって、各質問項目が共通因子にどの程度回答が左右されるかが数値で示されるのです。

図5 確認的因子分析で算出される因子負荷量の例

因子負荷量は、例えば、その絶対値が.40より大きければ、その項目は共通因子による要素を十分に持っていると判断します(Devon et al, 2007)。

正の値の因子負荷量は「共通因子の程度が高い人ほど、その質問項目の得点が高くなる」ことを表し、負の値では「共通因子の程度が高い人ほど、その質問項目の得点が低くなる」ことを表します。

5で言えば、「Q1上司との関係は良好だと思う」は正の因子負荷量が見られますが、これは「上司部下関係の良さ(共通因子)の程度が高い人ほど、Q1の得点が高くなる」とわかります。

逆に、「Q3 私に何かあっても、上司は助けてくれないと思う」は負の因子負荷量が見られます。これは「上司部下関係の良さ(共通因子)の程度が高い人ほど、Q3の得点が低くなる」とわかります。

これら2つの項目は、因子負荷量の絶対値も.40より大きくなっています。したがって「これらの項目は、上司部下関係の良さとよく関連している」と判断できます。

他方、「Q4 上司と一緒に食事や飲み会をすることが多い」は、因子負荷量の絶対値が.40を下回っています。この結果から、Q4への回答は、上司部下関係の良さによって回答が左右されず、それとは関係ない種々の要因によって得点が大きく左右されると解釈できます。

Q4の質問項目は、上司部下関係の良さの測定にうまく活用できない項目だと判断されます。このような質問項目が確認されたら、測定精度を上げるために項目を除外したり、「モデル適合度に問題はなく、後述する信頼性係数(α係数)も十分に高いため、この項目を残す」などの判断を行ったりします[5]

仮に、Q4を除外するのなら、Q4を除外した分析モデルを構築し、確認的因子分析を再度実施して、モデル適合度や因子負荷量を再検証します。その分析結果の例が図6です。

図6 Q4を削除して再分析した結果

Q4を削除したことで、モデル適合度のAIC, BICがより小さくなっています。モデルが、取得したデータによりフィットするよう改良されたことがわかります。因子負荷量の絶対値もすべての項目で.40を超えており、ひとつの共通因子に得点が左右される項目のまとまりが見いだされたと判断できます。

以上の検証を経て、上司部下関係の良さに得点が左右される、つまり上司部下関係の良さに得点が強く対応している4項目を絞り込むことができました。これら4項目は、上司部下関係の良さを捉えた項目として、その後の分析に活用できます。

確認的因子分析を行うことで、サーベイで用いた質問項目が測定したい概念を反映したものか、うまく測定できていない質問項目はあるか、検証や洗練が可能となります。

確認的因子分析を用いた様々な分析テクニック

確認的因子分析を応用することによって、様々な検証が可能となります。ここでは、その中でも企業の組織サーベイにおいて有効性の高い2つのテクニックを紹介します。

1)様々な共通因子の可能性を比較検討する

例えば、組織サーベイにおいて「上司からの助言が部下の働きやすさの感覚に及ぼす影響を検証したい」と考え、上司からの助言について測定する項目を作成したとします。

その際、書籍から得た情報を基に、上司からの助言には「問題の解決や対処を志向した助言」「部下の心理支援を志向した助言」があることを想定し、2種類の質問項目をそれぞれ3個ずつ作成しました。具体的には、以下のような内容です。

問題解決的な助言

  • 「上司から有益な助言をもらうことが多い」
  • 「上司は悩みを直接解決できるコメントをくれる」
  • 「上司は必要なことを遠慮なくはっきり指摘する」

心理支援的な助言

  • 「上司から励まされ勇気づけられることが多い」
  • 「上司からのコメントに温かな思いやりを感じる」
  • 「上司のコメントは私の心情に配慮していると思う」

これらの質問項目を含めた組織サーベイを実施して200名の回答が集まり、想定した2種の助言の概念をうまく測定できているかを検証しました。

しかし、そのような折に経営者から「上司の助言を2種類に分けて測定しているが、私は助言の細かな違いよりも、助言されていること自体が大事だと思う。助言の指標は2つに分ける必要があるのか」との疑問が出てきました。

ここにおける経営者のコメントは、「問題解決的な助言」「心理支援的な助言」の2つに分けた助言の概念は、「上司の助言」という1つの概念で捉えるべきでは、という指摘になります。

上司の助言は2つに分けて捉えた方が良いのでしょうか。それとも、1つのものとして捉えた方が良いのでしょうか。

確認的因子分析は、このような課題に対応する分析テクニックがあります。それは、「測定した質問項目について想定される、複数の分析モデルを比較検討」するテクニックです。

この例でいえば、上司の助言を測定した6つの質問項目について、「『問題解決的な助言』と『心理支援的な助言』という2つの共通因子を想定した分析モデル(2因子モデル)」「『上司の助言』という1つの共通因子を想定した分析モデル(1因子モデル)」のどちらがよりデータにあてはまっているか、統計学的に比較・検証できるのです。

具体的には、確認的因子分析で出力される適合度の比較や因子負荷量の値を、2つの分析モデルで比較していきます。

架空の分析例として、2因子モデルの分析結果(図7)と、1因子モデルの分析結果(図8)がそれぞれ得られたとしましょう。

図7 2因子モデルの確認的因子分析の結果

図8 1因子モデルの確認的因子分析の結果

2つの分析結果を比較すると、まず、モデル適合度が異なっています。2因子モデルの適合度はχ2検定の結果を除き、全て基準を超えています。他方、1因子モデルの適合度には基準を満たすものがありません。

AIC, BICの値を見ると、2因子モデルの方が1因子モデルよりも値が小さいことがわかります。この2つの指標は値が小さいモデルが、よりデータとモデルのあてはまりが良いことを表します。

さらに、それぞれのモデルの因子負荷量を見ると、2因子モデルでは各質問項目に対して、共通因子から十分な強さの因子負荷量が見られます。他方、1因子モデルでは、3つの項目への因子負荷量が小さく、共通因子によって得点がほぼ左右されないことがわかります。

以上を踏まえると、上司の助言を測定した6つの質問項目は、全てが1つの共通因子によって得点が左右されるモデル(1因子モデル)よりも、2つの共通因子によって対応した質問項目それぞれの得点が左右されるモデル(2因子モデル)の方が、よりデータとのあてはまりが良いと評価できます。

「上司の助言6項目は、ひとつの概念を測定した項目だと見なすよりも、2つの概念を測定した3項目ずつに分かれると見なす方が、よりデータにフィットしている」と主張するための、統計学的な根拠が得られます。

なお、後述する質問項目と共通因子の個数に関する制約により、この分析テクニックは、最低限必要な質問項目の個数が存在します。加えて当社では、その制約を超えて、ある概念を測定しようと質問項目を作成・準備するなら、1概念につき3項目以上となるよう構成することを推奨しています。

様々な共通因子の可能性を模索する目的があるならば、サーベイ実施の際に相応の質問項目数を準備するよう努めましょう。

2)因子負荷量の大きさを考慮した得点(因子得点)を算出する

次のテクニックは、確認的因子分析をした後に、質問項目の回答値から回答者の得点を算出する方法に関するものです。

確認的因子分析の分析内容を見ると、各質問項目の中でも、共通因子によって得点が左右される要素は、項目ごとにいくらか違っていることがわかります。そのような違いを加味せずに指標の得点を算出してよいかは、少し疑問なところもあるでしょう。

この疑問に関する統計学的な対応は2つあります。ひとつは、絞り込んだ複数の質問項目を用いてα係数を算出し評価することです。

α係数は、複数の質問項目への回答がどの程度一貫しているかを表す指標で、この値が十分に高いと「複数の質問項目を平均・合計して算出した得点は、ひとつの概念を表す得点として構成できている」ことを表します[6]。これにより、複数の質問項目を平均・合計して得点化してよいと見なし、得点化を行うことができます。

もうひとつの対応は、各質問項目に対する共通因子からの因子負荷量を加味した得点を算出する方法です。

確認的因子分析では、想定された共通因子の得点を各回答者がどの程度持っているかを、各質問項目に対する共通因子からの因子負荷量の大きさを含めて得点を算出できます。これを「因子得点」と呼びます。

因子得点は、因子負荷量も加味して得点化している点で概念を正確に捉えた得点と考えられ、指標間の関連がより正確に検証できるメリットがあります。

一方で、因子得点にはいくつか欠点もあります。

ひとつは、再現性の問題です(Hair et al., 2014)。因子負荷量の計算は、取得したデータの情報に基づいています。データを追加すれば因子負荷量の大きさが多少変わることが考えられます。因子負荷量の値が違うと因子得点の値も変わるため、問題になるわけです。

二つ目は、得点の解釈の問題です。因子得点は、得点計算の性質で、平均0、標準偏差1となるように得点が出力されます。元々の質問項目が「1:あてはまらない~5:あてはまる」と測定されていても、その得点範囲を考慮せず因子得点は算出されます。

その結果として、因子得点の値そのものの意味を解釈することはできず、指標の得点の大きさを評価したい目的では、因子得点の活用は困難です。

以上を踏まえると、因子得点は、サーベイ内の分析で用いる想定で、指標間の関連を厳密に検証したい場合に用いるのがよいでしょう。

確認的因子分析の注意点

ここからは、確認的因子分析を行う上での注意点をまとめていきます。

1.想定する共通因子の個数に応じた質問項目の個数が必要

確認的因子分析は、モデルに含めた指標の個数によって、モデル内に描ける矢印や共通因子の個数の限界が定まる性質[7]があります。図9のように、想定する共通因子に個数に応じて、分析に最低限必要な質問項目の数が増えていきます(Ledermann, 1937)。

図9 想定する共通因子の個数に応じた必要項目数

質問項目の個数については、確認的因子分析の問題にとどまりません。

例えば、測定概念1つに対する質問項目が非常に少ないと、得点のバリエーションが減り、回答者の多彩な状態がうまく捉えられなくなります。加えて、質問項目が少ないと、概念の測定において捉えるべき様々な特徴を網羅的に捉えられなくなる可能性も高まります。

総じて、ある概念を測定したいときは、特別な理由がない限り、1概念につき3個以上の質問項目を用いると安全です。組織サーベイによって何らかの概念を測定したいなら、1概念につき3項目以上を入れるよう設計しましょう。

2.ある程度のサンプルサイズ(回答者数)が必要

Hair et al. (2014) では、少なくとも100名以上、あるいは、一度の因子分析に含める指標の個数の10倍のサンプルサイズを確保することが推奨されています。

サンプルサイズが小さいと、各質問項目に含まれる共通因子以外の要素(独自因子)が大きくなり、共通因子がうまく推定できなくなります。あるいは、そもそも分析自体がうまく実行できず、分析エラー(不適解)が生じることも多くなります。

確認的因子分析を行う場合、サーベイ実施時にできるだけサンプルサイズを大きくするよう努めましょう。どうしてもサンプルサイズが100以上集まらなければ、因子分析内部の推定計算法を最尤法から最小二乗法に変える方法もあります。

より精度が高い分析結果を得られる推定法として、確認的因子分析では最尤法と呼ばれる解析ロジックが内部で採用されています。しかし、最尤法はサンプルサイズが大きくないと、分析エラーが生じる可能性が高い方法です。

そのため、やや推定精度が低下しつつもエラーを抑制する分析手法として、最小二乗法を用いる場合もあります。ひとまず最尤法で分析してみて、どうしても分析自体が実行できなければ、最小二乗法に切り替えて分析することも考えられるでしょう。

いずれにせよ、サーベイで十分なサンプルサイズを確保できれば、一貫して最尤法を用いるべきです。できるだけ多くの回答協力を得られるよう、サーベイ実施時やその前の広報や関係づくりに努めましょう。

3.共通因子が「測定したい概念を意味するか」の保証にはさらなる検証が必要

確認的因子分析で検証されるのは、あくまで「分析モデルに含めた質問項目の回答を左右する共通因子が想定できるか否か」だけです。言い換えれば、その共通因子がどんな概念を表しているかは、確認的因子分析では検証されていません。

質問項目は測定したい概念を捉えるよう構成されたものなので、確認的因子分析で想定された共通因子はその概念を捉えられているとも考えられます。しかし、測定したい概念をしっかり捉えられていることを厳密に検証するならば、確認的因子分析の検証だけでは不十分です。

これは、測定の妥当性の議論となります[8]。測定に用いた質問項目が狙った概念を捉えられているかをより正確に検証したいならば、確認的因子分析以外に、様々な角度から妥当性の検証を行うことが求められます。

 

本コラムでは、質問項目が想定した概念をうまく捉えられているかを検証する、確認的因子分析を紹介しました。「サーベイに用いた質問項目が、測定したい概念を捉えられているか」という測定の根本的な問題意識に迫るべく、是非知っていただきたい分析手法です。

 

引用文献

DeVon, H. A., Block, M. E., Moyle‐Wright, P., Ernst, D. M., Hayden, S. J., Lazzara, D. J., … & Kostas‐Polston, E. (2007). A psychometric toolbox for testing validity and reliability. Journal of Nursing scholarship39(2), 155-164.

Gruijters, S. L. K. (2019). Using principal component analysis to validate psychological scales: Bad statistical habits we should have broken yesterday II. European health Psychologist, 20 (5), 544-549.

Hair, J. F., Black, W. C., Babin, B. J., & Anderson, R. E. (2014). Confirmatory Factor Analysis. In J. F. Hair, R. E. Anderson, R. L. Tatham, & W. C. Black (Eds.) Multivariate data analysis (pp. 599-638). Upper Saddle River, NJ: Prentice Hall.

Hopwood, C. J., & Donnellan, M. B. (2010). How should the internal structure of personality inventories be evaluated? Personality and Social Psychology Review14(3), 332-346.

Ledermann, W. (1937). On the rank of the reduced correlational matrix in multiple-factor analysis. Psychometrika, 2(2), 85-93.

脚注

[1] 後の注意点でも触れますが、厳密にいえば、2項目では確認的因子分析ができないため、この図の分析モデルは解析ができません。この図は、あくまで「各項目が持つ要素のイメージ」をつかむためのものとご理解ください。

[2] 因子分析には、他にも「複数の質問項目の背後にいくつの共通因子が仮定できるか、それらの各因子が質問項目それぞれにどの程度影響しているか」を統計学的に検証する「探索的因子分析」が存在します。

[3] 確認的因子分析は検証的因子分析とも呼ばれます。Confirmatoryの訳が異なるだけで同じ分析です。

[4] 今回のような「一つの概念測定を、狙った複数項目を合算してひとつの得点にまとめられるかを確認する」目的の場合、研究では主成分分析を用いて検証されることも見られます。しかし、主成分分析は共通因子と独自因子の両方を取りあげて解析する手法であり、事前に想定した共通因子の存在を探ることが目的ならば、主成分分析は避けることが推奨されています(cf. Gruijters, 2019)。そのため本コラムでは、この分析目的に対して確認的因子分析を適用しています。

[5]各項目が、測定したい概念をうまく測定できているかに関心がなく、「測定した項目全体で、ある概念をうまく測定できているか」のみ確認したい場合、α係数のみ確認するケースも見られます。これは、研究で用いる質問内容(尺度)のほとんどは、すでに先行研究で因子分析などの検証がされており、「各質問内容は、測定したい概念をうまく捉えられるとわかっている」ことを前提としているためです。そうした前提がないのなら、確認的因子分析を行うべきだと考えられます。

[6] α係数については、当社コラム「α係数とは何か」で詳しく解説しています。

[7] 厳密には、これは確認的因子分析の性質ではなく、この分析の土台にある構造方程式モデリングの性質です。

[8] 測定の妥当性については、当社コラム「心理尺度の作り方・考え方:組織サーベイの質問項目作成のポイント」で詳しく解説しています。


執筆者

能渡 真澄
信州大学人文学部卒業,信州大学大学院人文科学研究科修士課程修了。修士(文学)。価値観の多様化が進む現代における個人のアイデンティティや自己意識の在り方を,他者との相互作用や対人関係の変容から明らかにする理論研究や実証研究を行っている。高いデータ解析技術を有しており,通常では捉えることが困難な,様々なデータの背後にある特徴や関係性を分析・可視化し,その実態を把握する支援を行っている。

#能渡真澄 #組織サーベイ

テレワーク(リモートワーク)に伴う
課題のご相談も受け付けています