4章コホート分析
「3章 時系列解析」では、時系列解析を取り上げました。時系列解析のテクニックを手に入れたので、次は多くのビジネスやその他の用途で使える時系列解析に関連する分析手法について説明します。それはコホート分析です。
初めてコホート分析に出会ったときのことを覚えています。小規模な新興企業で最初のデータ分析の仕事に取り組んでいました。私が取り組んだ購買分析をCEOと一緒に見直しており、CEOが顧客ベースをコホートで分割して行動が時間とともに変化しているかどうかを確認するように勧めました。私はコホートをビジネススクールでのしゃれた考え方でおそらく役に立たないと思い込んでいましたが、CEOなのでもちろん調子を合わせました。結局、コホートは単なる戯れではないことがわかりました。母集団をコホートで分割して時間経過に伴って追跡するのは、データを分析してさまざまなバイアスを避ける有力な方法です。コホートは、部分母集団が互いにどのように異なり、時間とともにどのように変化するかに関する手がかりとなることがあります。
本章では、まずコホートとは何かと特定の種類のコホート分析の基本要素を調べます。例に使う議員データセットを紹介した後、リテンション分析を実施し、コホートの定義や疎なデータの扱いなどのさまざまな課題に対処する方法を学びます。次に、サバイバーシップ、リターンシップ、累積計算を取り上げます。これらはすべて、SQLコードの作成方法という点でリテンション分析に似ています。最後に、コホート分析とクロスセクション(横断)分析を組み合わせて時間に伴う母集団の構成を理解する方法を調べます。
4.1 コホート:便利な分析フレームワーク
コードに進む前に、コホートとは何かを定義し、この種の分析で答えられる質問の種類を検討し、コホート分析の構成要素を説明します。 ...
Get SQLではじめるデータ分析 ―クエリで行う前処理、時系列解析、コホート分析、テキスト分析、異常検知 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.