- 顧客の購買データから「この商品を買った人は同時にこの商品も買う傾向がある」という関連ルールを発見するデータマイニング手法のこと。「バスケット(買い物かご)」の中身を分析することに由来する
- 「おむつを買う人はビールも買う傾向がある」というウォルマートの有名な発見が代表例で商品の陳列・バンドル販売・ECのレコメンデーション・クロスセルの設計に活用される
- 3つの指標(支持度・確信度・リフト値)でアソシエーションルールの強さを評価して、ビジネスに有用な商品の組み合わせパターンを抽出する
【深掘り】これだけ知ってればOK!
マーケットバスケット分析の代表的なアルゴリズムとしてAprioriアルゴリズムがある。支持度の閾値(最低何%の取引に現れるか)を設定して、頻繁に一緒に購入される商品セットを探索する。Python(mlxtend・apyori)・R・BigQueryMLなどで実装できる。ただし商品数が多い場合は計算量が爆発するため、FP-growthアルゴリズムなどより効率的な手法も使われる。
マーケットバスケット分析の活用事例を整理しよう。スーパーマーケットの陳列最適化:一緒に買われやすい商品を近くに陳列して購買を促進する。ECのレコメンデーション:「よく一緒に購入されている商品」「この商品を買った人はこちらも購入しています」という表示。バンドル販売・セット商品:一緒に買われやすい商品をセット価格で提供。クロスセル戦略:購入後のサンキューメールで関連商品を提案する。
マーケットバスケット分析の限界を理解しておこう。「一緒に買われている」という相関関係から「因果関係」を結論づけることはできない。また商品数が多い場合や取引データが少ない場合は有意なルールが見つかりにくい。分析結果を実際のビジネス施策に活かすには、データ分析者とビジネス担当者が協力して「なぜその組み合わせが起きるのか」という仮説を立てて検証するアプローチが重要だ。
よくある誤解
マーケットバスケット分析は大規模ECでないと使えないと思っている
中小規模の小売店・飲食店・ECサイトでも、十分な取引データ(数千〜数万件以上)があれば有用な洞察を得られる。Pythonのmlxtendライブラリを使えば比較的簡単に実装できる。
リフト値が高い組み合わせは必ず陳列を変えるべきだと思っている
リフト値が高くても商品の利益率・在庫状況・売り場面積の制約などビジネス上の要因を考慮する必要がある。データ分析の結果はあくまで意思決定の参考情報であり、最終的な判断はビジネス文脈を理解した上で行うことが重要だ。
会話での使われ方

ECサイトのマーケットバスケット分析をやってみたら、コーヒーと砂糖のリフト値が3.2でした。「よく一緒に購入されている商品」として表示したらクロスセルが10%向上しました。
ECデータアナリストがマーケットバスケット分析の結果をレコメンデーション施策に活用した場面。




この商品と一緒に購入されることが多い商品セットを特定しました。バンドル販売のセット商品として打ち出すと客単価が上がりそうです。
マーチャンダイザーがマーケットバスケット分析の結果をバンドル販売の企画に活用している場面。




Aprioriアルゴリズムで支持度1%・確信度50%以上のルールを抽出しました。150件のルールが見つかったので、ビジネスに有意なものを絞り込みましょう。
データサイエンティストがマーケットバスケット分析の結果をビジネス担当者と精査している場面。
【まとめ】3つのポイント
- 購買データから「一緒に買われやすい商品の組み合わせ」を発見するデータマイニング:直感では気づかない商品の関連性を大量の取引データから発見することで陳列最適化・レコメンデーション・バンドル販売・クロスセルという具体的な売上向上施策につなげられる
- 支持度・確信度・リフト値の3指標でアソシエーションルールの強さを評価:支持度(頻度)・確信度(A→Bの確率)・リフト値(偶然より何倍多くAとBが一緒に買われるか)を組み合わせてビジネスに有用な商品の組み合わせルールを特定する
- 分析結果はデータアナリストとビジネス担当者が協力して仮説検証する:相関関係から因果関係を結論づけることはできないため分析で発見した組み合わせが「なぜ起きるのか」という仮説をビジネス文脈で立ててABテストで検証するプロセスが重要だ
よくある質問
-
Qマーケットバスケット分析はどんなデータが必要ですか?
-
A
「誰が・どの商品を・同じ取引で購入したか」という購買履歴データが必要です。ECの注文履歴・POSシステムの取引データなどが使われます。
-
QAprioriアルゴリズムをどこで実装できますか?
-
A
Pythonのmlxtendライブラリで比較的簡単に実装できます。また BigQueryMLにもアソシエーションルール機能があります。
-
Qリフト値の目安はどのくらいですか?
-
A
リフト値が1.0より大きいほど正の相関があります。目安として1.5以上で「有意な関連性がある」と判断することが多いですが業種・データ量によって変わります。
-
Qマーケットバスケット分析とコラボレーティブフィルタリングはどう違いますか?
-
A
マーケットバスケット分析は「一緒に購入された商品の組み合わせ」から関連性を発見します。コラボレーティブフィルタリングは「似た購買パターンを持つ顧客」から推薦します。
【出典】参考URL
https://mlxtend.readthedocs.io/en/latest/user_guide/frequent_patterns/apriori.html :mlxtendのAprioriアルゴリズムドキュメント
https://cloud.google.com/bigquery-ml/docs/ :BigQueryMLのドキュメント
https://e-words.jp/w/%E3%83%9E%E3%83%BC%E3%82%B1%E3%83%83%E3%83%88%E3%83%90%E3%82%B9%E3%82%B1%E3%83%83%E3%83%88%E5%88%86%E6%9E%90.html :IT用語辞典「マーケットバスケット分析」


コメント