サポートタイムズ

サポートタイムズはカスタマーサポートの“今”を届けるメディアです。(Powered by CallConnect)

Twitter Facebook

データ分析を行う上で知っておきたい指標「平均値/中央値/最頻値」とは?

f:id:sennba3:20170829121145j:plain

一日の呼量やメールでの問い合わせ量を平均値で把握し、適切な人員配置に役立てようとする企業も多いのではないでしょうか?本記事では、データ分析を行う上で知っておきたい指標「平均値/中央値/最頻値」についてご紹介します。

問い合わせ量を予測することになったら?

自社のサポート窓口に「一日あたりどのくらいの問い合わせが来ているのか?」ということを把握したい場面が出てきたとしましょう。 目的は「必要以上のサポートスタッフを稼働させないこと」「人員不足が原因でサポートに遅れを生じさせないこと」です。コールセンターでは、呼量予測と呼ばれ、ごく一般的に行われています。

直近30日間の状況を確認したい場合、皆さんならどうするでしょうか?
例えば、 “直近30日間の合計問い合わせ件数” を “日数” で割ることで把握しようとする場合もあるのではないでしょうか。直近30日間の合計問い合わせ件数が 600件 だった場合、30日 で割ると、一日平均20件の問い合わせがきているということになります。これが、いわゆる平均値と呼ばれる指標です。

しかし、本当にこのような算出方法で本来の目的を達成することはできるのでしょうか?

平均値という1つの値に集約することで、1日あたりの問い合わせ件数はざっくりと把握できるようになりましたが、一日ごとの細かい数字のばらつきは省略してしまったことになります。6日間の問い合わせ件数が(5,10,10,25,30,40)という場合でも、平均値は20件。(2,3,10,10,15,80)という場合でも、平均値は20件です。

平均値は、全てのデータを考慮することができる一方で、極端に小さい、大きい値が含まれている場合に有用性が損なわれやすい指標といえます。 平均値という指標を使う際には、サンプルとなるデータのばらつきに注意が必要です。 特に呼量予測の場面においては、曜日やキャンペーンの実施有無などによって数値が大きく変化することもあるため、注意が必要でしょう。

では、より良いデータ分析を行う上では平均値の他にどのような指標を知っておくと便利なのでしょうか?以下に、2つの指標をご紹介します。

中央値とは?

f:id:sennba3:20170829131045g:plain

中央値とは、データを大きい順(もしくは小さい順)に並べたときの真ん中の値です。データの数が偶数のときは真ん中の値が2つあるため、それらを足して2で割ったものを中央値とします。

例えば、(2,3,10,10,15,80)のように6つのデータがあった場合、中央値は10です。

中央値は、全てのデータを十分に考慮した値とは言い難いですが、少なくとも極端なデータがあることがわかっている時には、平均値を使うより適切な場合があるでしょう。

最頻値とは?

最頻値とは、全データの中で一番出現回数が多い値です。

例えば、(2,3,10,10,15,80)の場合、10が2つ存在しているので、最頻値は10です。

しかし、サンプルとなるデータ数が少ない場合は、最頻値による分析は向いていません。サンプルとなるデータが多い場合に、その中で「一番多いもの」を代表の値として知りたい時に使うのがいいでしょう。

おわりに

今回は、問い合わせ量の予測(呼量予測)を例にあげ、平均値/ 中央値/最頻値について触れました。

全体の傾向を一つの値で表すということは、データを集約しているということになります。データを分解するだけでなく、集約することによっても新たな気づきを得ることができるでしょう。しかし、その際には各指標の特徴を踏まえた上で適切な指標を用いることが大切です。 なぜなら、データを集約する際には、集約することで自ずと失われてしまう情報もあるからです。

今後もサポート体制の整備やサポート業務の品質向上に役立つ情報を積極的に発信していきます。