【実践データ分析】<スポーツジムの顧客分析(ノック31-40)>まとめ

Dataikuを活用したスポーツジムの顧客データ分析 【含まれる要素】 ・複数CSVファイルの取り込み(顧客マスタ/利用ログ) ・機械学習(分類) - 分類(K-means)/特徴量選択 続きを読む
1
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <スポーツジムの顧客分析(new)> 第4章からは顧客のクラスタリングや将来予測を機械学習を用いて実施します。 新しい事も多いので是非短編動画確認して下さい! ノック31:データ読込 ・use_log ・customer_join →取込自体は既出なので扱うデータだけ確認 #dataiku #機械学習 #AI pic.twitter.com/KeMnM5T3om

2023-07-04 07:45:00
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <スポーツジムの顧客分析> ノック32:顧客のクラスタリング ・K-means法を利用した4グループへのクラスタリング ・利用履歴集計データと、顧客期間を変数とする (顧客期間の値が大きいので標準化) →実はノックの中で機械学習を実施したのは本投稿が初 #dataiku #機械学習 #AI pic.twitter.com/6ClpulFoeV

2023-07-05 07:45:00
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <スポーツジムの顧客分析> ノック33:クラスタリング結果の分析 ・グループ毎の件数の確認 ・グループの傾向確認 -cluster_1は利用頻度が高いグループ -cluster_3は利用頻度が低いetc... →分析結果が説明性高く可視化できるのがDataikuの最大の特徴です #dataiku #機械学習 #AI pic.twitter.com/WAtqBf6ik0

2023-07-06 07:45:00
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <スポーツジムの顧客分析> ノック34:クラスタリング結果の可視化 ・次元削除(PCA:主成分分析) ・クラスタリング結果の散布図での可視化 →二次元の中で各グループの散布が色分けされて確認できました →次元削除も散布図描写もデフォルトで用意されてます #dataiku #機械学習 #AI pic.twitter.com/wJuc7q5jTR

2023-07-07 07:45:00
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <スポーツジムの顧客分析> ノック35:クラスタリング結果を元にした顧客傾向分析 ・クラスタリングモデルのデプロイと結果反映 ・結果チャート化 →cluster1,2の継続顧客群は、ルーティンでジムに通っている →簡易ですが、分析結果をすぐに可視化できました #dataiku #機械学習 #AI pic.twitter.com/7gmuvDoO2W

2023-07-08 07:45:00
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <スポーツジムの顧客分析> ノック36:翌月の利用回数予測準備 ・教師有り学習の回帰に向けた準備 ・過去6ヶ月(4-9月)の利用回数から10月の利用回数を学習 ・年月/顧客毎の利用回数データ(3列)から過去6ヶ月の利用値(lag)を生成 →windowレシピのみで完了! #dataiku #機械学習 #AI pic.twitter.com/qXlXyxFzUg

2023-07-09 07:45:00
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <スポーツジムの顧客分析> ノック37:特徴量の追加 ・直近利用回数(lag)に加え顧客の会員期間を追加 ・別データセット(customer)のstart_dateを結合 ・年月列(基準日付)とstart_dateの差を計算 →何度も登場しているjoinとprepareでdoneです #dataiku #機械学習 #AI pic.twitter.com/RZfWY7t974

2023-07-10 07:45:00
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <スポーツジムの顧客分析> ノック38:利用回数予測モデル作成 ・回帰モデル分析 ・目的変数を利用回数(count)、説明変数を過去利用回数(lag_x)と会員期間に設定 ・学習用/評価用データを75%/25%に設定 →内容を確認しながら動画の流れで簡易に作成できます! #dataiku #機械学習 #AI pic.twitter.com/mOvphL6Es3

2023-07-11 07:45:00
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <スポーツジムの顧客分析> ノック39:モデル結果の確認 ・寄与している変数の確認 →直近の利用回数(lag値が小さいもの)の方が寄与率が高そう →その他学習結果の情報はビジュアル化された状態で幅広く確認可能です。まさにdataikuの素晴らしいところです! #dataiku #機械学習 #AI pic.twitter.com/Aa0LgDPqzc

2023-07-12 07:45:00
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <スポーツジムの顧客分析> ノック40:翌月の利用回数の予測 ・モデルのフローへのデプロイ ・来店予測をする2顧客のデータ取り込み ・スコアリング(予測)と結果確認 →一人目は4.5回、二人目は3.2回程度の来店予測となりました 4章完ですがノーコード継続中 #dataiku #機械学習 #AI pic.twitter.com/fjco4QYHjM

2023-07-13 07:45:00
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <スポーツジムの顧客分析(完)> おさらい:第4章(ノック31-40)では、分類と回帰双方を実施しました ・クラスタリングと結果の可視化 ・次元削除と散布図作成 ・回帰モデルの作成(特徴量生成) ・来店回数予測・モデル可視化 第5章では決定木を利用して分析予定 #dataiku #機械学習 #AI

2023-07-14 07:54:41