自由記述(FA)の集計とは
アンケートの質問の多くは、回答が用意されている選択式です。しかし、なかには試験のように言葉や文章で回答するタイプの質問もあります。それが自由記述(FA:Free Answer)です。この記事では、自由記述のアンケートの集計について解説しています。ビジネス戦略としてアンケートを採用したいと考えている企業の担当者様は、ぜひ読んでみてください。
自由記述(FA)について
アンケートにおける自由記述の回答方法は、数値で答える場合と言葉(文章)で答える場合があります。
数値で答える場合は小さなテキストボックスが用意されています。
よくあるのは以下のような質問です。
「あなたの年齢を教えてください」
歳
「今日のランチにいくらお金を使いましたか?」
円
このような質問であれば、選択肢を用意するよりも記入してもらうほうがかんたんです。
しかし、回答者が考えてもすぐには答えられないような数値について知りたい場合は、選択肢を用意したほうがいいでしょう。数値は、選択肢として用意するのが少し大変かもしれませんが、アンケートを組み立てる段階で大まかに数値の範囲を定めて選択肢に落とし込みましょう。
言葉で答える場合は大きめのテキストボックスが用意されています。
「あなたがこのホットプレートを手に入れたら、最初に何を作りたいですか?」(ご自由にお書きください)
このような質問といっしょにテキストボックスが用意されており、回答者はここに言葉や文章を自由に記述します。
数値の自由記述を集計する方法
すでに答えが数値になっている自由記述は、比較的かんたんに集計することが可能です。数値の自由記述で主に確認するのは、「平均値」「中央値」「標準偏差」「最小値・最大値」です。
平均値
平均値は、回答された数値を合計し、データの数で割ったものです。ただし、平均値だけを見て全体の傾向まで考えてしまうと、データを誤って読んでしまうことにつながるので注意が必要です。
中央値
中央値は平均値と混同されることがありますが、まったく異なるものです。回答された数値データを数値の大小を考慮して並べ、その中央に来る数値が中央値です。データの数が偶数の場合は、中央に来た2つの数値を足し、2で割ったものが中央値になります。
データに大きなばらつきがあると平均値からは傾向を読めないので、このようなときは中央値も見ると、全体の傾向が見えてきます。
標準偏差
標準偏差を求める際は通常、MS Excelなどのツールを使います。標準偏差は、平均値からの差である「偏差」の標準的な度合いを表すものです。
回答により得られた各数値と平均値の差が「偏差」なので、この数値はすぐにわかります。「標準偏差」を求めるには、まず「分散」と呼ばれる「偏差を2乗して算出した値」を合計した数値を出します。その分散の平方根が「標準偏差」になります。
最大値・最小値
すべての数値データの中で最大の値と最小の値が、それぞれ最大値、最小値となります。
言葉や文章の自由記述を集計する方法
元から数値データになっている自由記述は、比較的かんたんに集計できそうです。しかし、言葉や文章の回答を数えることはできません。言葉や文章の自由記述を集計するにはどうしたらいいのでしょうか?
一覧表
手間はかかりますが、MS Excelなどのツールを使って一覧表を作ると、言葉や文章の回答から属性(年齢や性別、職業など)の情報を探しやすくなります。
MS Excelの関数(LEN)を使えば、文字数の多い回答から順番に並べて表にすることが可能です。MS Excelに備わる「並べ替え」や「フィルタ」も駆使すると、さらにデータを抽出しやすい一覧表を作れます。
すべての回答をMS Excelに読み込み、さらに特定のキーワードで絞り込んでもいいでしょう。
テキストマイニング
「テキストマイニング」は、自由記述の回答に書かれた文章を単語や文節に区切り、それらが回答に使われた頻度や、単語や文節の関連性を調べることにより、有効な情報を抽出する集計方法です。これまで、構造が複雑な日本語の文章には、テキストマイニングは合わないとされてきましたが、最近は精度が上がり、日本でもかなり普及しています。
アフターコーディング
アフターコーディングは、自由記述の回答を選択肢に分類する集計手法です。すべての回答の中から類似する回答を抽出し、それぞれグループ分けします。グループ分けすることで、定性的なデータを定量的なデータとして分析することが可能になります。
まとめ
自由記述(FA)の集計方法について説明しました。言葉や文章の回答でも、MS Excelに備わる関数やフィルタなどを駆使して重要なデータを抽出し、分析することが可能です。現在は、ソフトウェアの機能が向上していることもあり、ツールにより文章を分析して傾向を探ることも可能になっています。ただし、定性的なデータを定量的なデータにすることにより、人間の目では見極めることの可能な「的を射た意見」を見逃してしまう可能性があることも事実です。