データ分析

新型コロナ患者数から、傾向を読み取るデータ分析手法(移動平均)

新型コロナのニュースに出ているグラフを見ていて
増えてるのか減ってるのか、良く分からない
と感じないでしょうか?

グラフや表は、そのまま見ていても傾向が読み取れません。
この記事ではデータを元に傾向を読み取る方法をご紹介します。

<スポンサードリンク>



実データだけを見ても傾向は読み取れない

テレビのニュースを見ていて、息子が「増えてるのか減ってるのか、良く分からないね」と。

確かに実データだけを見ても、傾向を読み取るのは困難です。

これは神奈川県が公開しているデータ(CSV)を元に、陽性患者数をグラフにしたものです。(もっと前からもありますが、説明の都合上3月1日~4月30日までを切り出しています)

4月11日に最大76名を記録した後、なだらかに減少しているような気がしなくもないですが、増えたり減ったりを繰り返しているようにも見えます。

移動平均を使うと傾向が見えてくる

実データだけですと傾向が読みにくいので、「移動平均」を使います
具体例で見てみましょう。

移動平均とは、ある一定区間ごとの平均値を区間をずらしながら求めたものです。
今回は一定区間を7日間・14日間にしてみました。(理由は後述します)

上記の3月7日の場合、3月1日~7日の7日間(オレンジの線で囲った部分)の平均を求めています。同じく3月8日の場合は、3月2日~8日の7日間の平均です。
7日間の平均を取って、それをずらしているので7日移動平均と呼びます。

※データを見やすくするために小数点第1位までの表示にしています。

同様に14日間の区間でも求めてみました。

3月14日の場合、3月1日~14日まで(オレンジの線で囲った部分)の平均を取ります。
このように件数(元データ)と7日移動平均、14日移動平均を求めた上で、グラフにします。

これを見ると、7日移動平均(点線)は4月16日をピークに、14日移動平均(破線)は4月20日をピークに、減少傾向に転じていることが分かります。

なお、区間を7日と14日にしたのには意図があります。

7日にした目的は、週末に検査数が少なくなるので、その変化をなだらかにするためです。
(このようにノイズを消す手法をデータ分析における「平滑化」と言います)

14日にした目的は、感染から発症までの期間を2週間と想定したためです。
緊急事態宣言の効果を見ることが目的です。

グラフで意図を伝えるためには

ここまでは事実を淡々と整理しました。
ビジネスでグラフを使うときには、何らかの意図を伝えることが多いはずです。
そのようなときには、グラフに情報を追加することで、意図を伝えやすくします。

私が安倍首相だったら、こんな感じにするでしょうか。

上述の通り、14日移動平均(破線)は緊急事態宣言の効果を評価するために使えます。
したがって、

  • 緊急事態宣言を出したこと(4月7日と16日)を追加
  • その後の14日移動平均が減少していることを強調する矢印を追加

この2つを追加することで、緊急事態宣言は効果があったのだ。
だから引き続き、国民の皆さんは自粛してね、と説明ができるようになります。

実データだけを見せても、なかなかここまでは伝わらないでしょう。

  • 移動平均(目的に合った区間を選ぶ)を使ってグラフ化する
  • 意図を伝えやすくするためにグラフを強調する

ビジネスの現場では、このような流れでグラフを活用しましょう。

売上を分析するにも、同様に移動平均が使えます。

売上の傾向を把握するためのデータ分析(移動平均)売上の傾向、把握していますか?増加傾向にあるのか、減少傾向にあるのかは、月々の売上を見ているだけでは読み取ることができません。そこで役立つのが「移動平均」です。この記事では移動平均の意味と、その使い方・読み取り方について解説します。売上の傾向(トレンド)を把握したい経営者へ。...

他の例ですと、広告などのコスト分析や、株価の傾向(トレンド)を見るのにも、移動平均が利用されています。

そのデータの意味することは?

もう1つだけ補足を。
そもそも「日別の陽性患者数」には、果たしてどれだけの意味があるでしょうか?

日本ではPCR検査数が少なすぎるという批判があります。
その是非はさておき、検査数が少ないということは、罹患しているのに発見されないリスクがあることを示しています。

となると、日別の陽性患者数の信憑性が怪しくなります。
このデータで判断して良いのか?という疑問が生まれてきます

データの分析手法(今回の例で言えば移動平均)を学ぶことは大切です。
しかし、その前提として

  • データそのものが持つ意味は何か?
  • ビジネスの目的に応じたデータ・分析になっているか?

は常に意識したいことです。

まとめ
  • 実データのままでは、増減の傾向が読み取りにくい
  • 移動平均を使うと傾向が見えるようになる
  • 区間の選び方は目的に応じて変わる
  • データの持つ意味を事前に確認する



【編集後記】
なぜかハムストリングスが筋肉痛です。
昨日は軽いジョグ、軽いバイクしかやってないんですが・・


メルマガ『経営は100種競技!』を毎日配信しています。
マーケティングやITを身につけたい。
ビジネスを楽しみたい。
変化・成長したいというビジネスパーソンにお読みいただいています。

渋屋 隆一
プロフィール
マーケティングとIT、そしてデータを使った「売れ続ける仕組みづくり」「業務改善」が得意。コンサルティングや研修・セミナーで中小企業の経営支援をしています。元IT企業でエンジニア→マーケティング。中小企業診断士。
\ Follow me /