マーケットバスケット分析とは?一緒に購買される商品の関連性を発見するデータマイニング手法

企画・プロジェクト管理
マーケットバスケット分析とは?ざっくりと3行で
  • 顧客の購買データから「この商品を買った人は同時にこの商品も買う傾向がある」という関連ルールを発見するデータマイニング手法のこと。「バスケット(買い物かご)」の中身を分析することに由来する
  • 「おむつを買う人はビールも買う傾向がある」というウォルマートの有名な発見が代表例で商品の陳列・バンドル販売・ECのレコメンデーション・クロスセルの設計に活用される
  • 3つの指標(支持度・確信度・リフト値)でアソシエーションルールの強さを評価して、ビジネスに有用な商品の組み合わせパターンを抽出する

【深掘り】これだけ知ってればOK!

マーケットバスケット分析の3つの評価指標を理解しよう。支持度(Support):全取引の中で「AとBが一緒に購入された」割合。支持度が高いほど頻繁に起きる組み合わせ。確信度(Confidence):「Aを買った人がBも買う」確率。確信度が高いほどAを買ったらBも買いやすい。リフト値(Lift):Aを買うことでBが購入される確率がどれだけ上がるか。リフト値>1なら正の相関・=1なら独立・<1なら負の相関。

マーケットバスケット分析の代表的なアルゴリズムとしてAprioriアルゴリズムがある。支持度の閾値(最低何%の取引に現れるか)を設定して、頻繁に一緒に購入される商品セットを探索する。Python(mlxtend・apyori)・R・BigQueryMLなどで実装できる。ただし商品数が多い場合は計算量が爆発するため、FP-growthアルゴリズムなどより効率的な手法も使われる。

マーケットバスケット分析の活用事例を整理しよう。スーパーマーケットの陳列最適化:一緒に買われやすい商品を近くに陳列して購買を促進する。ECのレコメンデーション:「よく一緒に購入されている商品」「この商品を買った人はこちらも購入しています」という表示。バンドル販売・セット商品:一緒に買われやすい商品をセット価格で提供。クロスセル戦略:購入後のサンキューメールで関連商品を提案する。

「おむつとビール」の都市伝説について:ウォルマートが1990年代に実施したマーケットバスケット分析で「金曜日の夕方にオムツを買う男性はビールも一緒に購入する傾向がある」という法則を発見したという話が有名だ。実際の真偽については諸説あるが、データマイニングの威力を示す象徴的な話として語り継がれている。このような「直感では気づかない関連性」を大量データから発見することがマーケットバスケット分析の本質的な価値だ。

マーケットバスケット分析の限界を理解しておこう。「一緒に買われている」という相関関係から「因果関係」を結論づけることはできない。また商品数が多い場合や取引データが少ない場合は有意なルールが見つかりにくい。分析結果を実際のビジネス施策に活かすには、データ分析者とビジネス担当者が協力して「なぜその組み合わせが起きるのか」という仮説を立てて検証するアプローチが重要だ。

よくある誤解

マーケットバスケット分析は大規模ECでないと使えないと思っている

中小規模の小売店・飲食店・ECサイトでも、十分な取引データ(数千〜数万件以上)があれば有用な洞察を得られる。Pythonのmlxtendライブラリを使えば比較的簡単に実装できる。

リフト値が高い組み合わせは必ず陳列を変えるべきだと思っている

リフト値が高くても商品の利益率・在庫状況・売り場面積の制約などビジネス上の要因を考慮する必要がある。データ分析の結果はあくまで意思決定の参考情報であり、最終的な判断はビジネス文脈を理解した上で行うことが重要だ。

会話での使われ方

ITKAGYO運営者デプロイ太郎のアイコン画像

ECサイトのマーケットバスケット分析をやってみたら、コーヒーと砂糖のリフト値が3.2でした。「よく一緒に購入されている商品」として表示したらクロスセルが10%向上しました。

ECデータアナリストがマーケットバスケット分析の結果をレコメンデーション施策に活用した場面。

ITKAGYO運営者デプロイ太郎のアイコン画像

この商品と一緒に購入されることが多い商品セットを特定しました。バンドル販売のセット商品として打ち出すと客単価が上がりそうです。

マーチャンダイザーがマーケットバスケット分析の結果をバンドル販売の企画に活用している場面。

ITKAGYO運営者デプロイ太郎のアイコン画像

Aprioriアルゴリズムで支持度1%・確信度50%以上のルールを抽出しました。150件のルールが見つかったので、ビジネスに有意なものを絞り込みましょう。

データサイエンティストがマーケットバスケット分析の結果をビジネス担当者と精査している場面。

【まとめ】3つのポイント

  • 購買データから「一緒に買われやすい商品の組み合わせ」を発見するデータマイニング:直感では気づかない商品の関連性を大量の取引データから発見することで陳列最適化・レコメンデーション・バンドル販売・クロスセルという具体的な売上向上施策につなげられる
  • 支持度・確信度・リフト値の3指標でアソシエーションルールの強さを評価:支持度(頻度)・確信度(A→Bの確率)・リフト値(偶然より何倍多くAとBが一緒に買われるか)を組み合わせてビジネスに有用な商品の組み合わせルールを特定する
  • 分析結果はデータアナリストとビジネス担当者が協力して仮説検証する:相関関係から因果関係を結論づけることはできないため分析で発見した組み合わせが「なぜ起きるのか」という仮説をビジネス文脈で立ててABテストで検証するプロセスが重要だ

よくある質問

Q
マーケットバスケット分析はどんなデータが必要ですか?
A

「誰が・どの商品を・同じ取引で購入したか」という購買履歴データが必要です。ECの注文履歴・POSシステムの取引データなどが使われます。

Q
Aprioriアルゴリズムをどこで実装できますか?
A

Pythonのmlxtendライブラリで比較的簡単に実装できます。また BigQueryMLにもアソシエーションルール機能があります。

Q
リフト値の目安はどのくらいですか?
A

リフト値が1.0より大きいほど正の相関があります。目安として1.5以上で「有意な関連性がある」と判断することが多いですが業種・データ量によって変わります。

Q
マーケットバスケット分析とコラボレーティブフィルタリングはどう違いますか?
A

マーケットバスケット分析は「一緒に購入された商品の組み合わせ」から関連性を発見します。コラボレーティブフィルタリングは「似た購買パターンを持つ顧客」から推薦します。

【出典】参考URL

https://mlxtend.readthedocs.io/en/latest/user_guide/frequent_patterns/apriori.html :mlxtendのAprioriアルゴリズムドキュメント
https://cloud.google.com/bigquery-ml/docs/ :BigQueryMLのドキュメント
https://e-words.jp/w/%E3%83%9E%E3%83%BC%E3%82%B1%E3%83%83%E3%83%88%E3%83%90%E3%82%B9%E3%82%B1%E3%83%83%E3%83%88%E5%88%86%E6%9E%90.html :IT用語辞典「マーケットバスケット分析」

コメント

「IT用語、難しすぎて心が折れそう……」という方のための、ハードル低めな用語辞典です。

情報レベルは「基礎中の基礎」。会話を止めないためのエッセンスだけを抽出しています。分かりやすさを追求するあまり、時々例え話が暴走しているかもしれませんが、そこは「ほどよく」聞き流していただけると幸いです。
ほどよくIT用語辞典企画・プロジェクト管理
デプロイ太郎のSNSを見てみる!!
タイトルとURLをコピーしました