【実践データ分析】<スポーツジムの退会予測(ノック41-50)>まとめ

Dataikuを活用したスポーツジムの顧客データ分析 【含まれる要素】 ・複数CSVファイルの取り込み(顧客マスタ/利用ログ) ・前処理 -欠損値処理 続きを読む
1
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <スポーツジムの退会予測🆕> ノック41:データ読込と整形 ・顧客と利用履歴データ2種類の取込み ・利用履歴(log_month)から、当月と過去1ヶ月の利用回数データを作成 →以前も出てきたwindowレシピでlag1(前月)の値を生成します。本章は決定木使います! #dataiku #機械学習 #AI pic.twitter.com/ZkwNZomRBb

2023-07-15 07:45:00
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <スポーツジムの退会予測> ノック42:退会顧客データ作成(1/2) ・退会防止に向けて退会日付の前月の情報を準備 ・欠損値(end_dateが空の継続顧客)削除 ・退会前月の日付生成(Prepareレシピのformula) →formulaを活用すると関数でのデータ加工も可能です🙌 #dataiku #機械学習 #AI pic.twitter.com/D06pS6AzVm

2023-07-16 07:50:00
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <スポーツジムの退会予測> ノック42:退会顧客データ作成(2/2) ・use_logをベースとした退会顧客情報の結合 ・欠損値処理も同時に実施 →joinレシピでは結合だけでなく、結合後の処理も一緒に記載できます #dataiku #機械学習 #AI pic.twitter.com/7TWDfXsZse

2023-07-17 07:45:00
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <スポーツジムの退会予測> ノック43:継続顧客データ作成 ・継続顧客(end_dateが空)と利用履歴の結合 ・継続顧客をアンダーサンプリング(顧客毎にランダムに利用月を絞り込み) →ランダム数を持つ列を作成し、TopNレシピで1件を抽出(超シンプルにできました) #dataiku #機械学習 #AI pic.twitter.com/1d9QZ0hRnt

2023-07-18 07:45:00
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <スポーツジムの退会予測> ノック44:顧客データへ在籍期間の追加 ・継続顧客と退会顧客データを縦結合 ・年月とstart_dateの差から在籍期間を特長量として作成 →機械学習の準備はdoneです →文字数制限で説明し切れない部分も有りますが、超簡単です🙌 #dataiku #機械学習 #AI pic.twitter.com/Z5eczsbCku

2023-07-19 07:45:00
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <スポーツジムの退会予測> ノック45:欠損値の削除 ・元々作成していたPrepareレシピを更新 ・各列の欠損値を持つrowを削除 ・ついでに不要列も削除しておきます →新規に処理を追加しなくても、前処理を行っていたPrepareレシピの更新でdoneです👌 #dataiku #機械学習 #AI pic.twitter.com/RPI5U2OyMN

2023-07-20 07:45:00
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <スポーツジムの退会予測> ノック46:文字列型の変数の成形 ※Dataikuではカテゴリカル変数もそのまま扱えるので本ノックは不要です☝️ ・カテゴリー変数(文字列型)のデータは0,1で扱えるようにフラグ化 ・上記ダミー変数化もできるので手順は載せておきます #dataiku #機械学習 #AI pic.twitter.com/7rCdEgEFUR

2023-07-21 07:45:00
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <スポーツジムの退会予測> ノック47:決定木を用いたモデル作成 ・教師有り学習の分類 ・目的変数は退会フラグであるis_deleted ・説明変数は今回テキストに合わせて絞り込み →学習前の設定も結果確認も全て責任性・説明性を担保しながら進められます🙌 #dataiku #機械学習 #AI pic.twitter.com/UV7beaBs3E

2023-07-22 07:45:00
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <スポーツジムの退会予測> ノック48:モデルのチューニング ・決定木の深さ(Max_depth)の変更 ※今回は特に変更の必要がないので据え置き →各種ハイパーパラメータの設定が可能なので画面だけ紹介しておきます! #dataiku #機械学習 #AI pic.twitter.com/XyORGZvoqN

2023-07-23 07:45:00
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <スポーツジムの退会予測> ノック49:モデルに寄与している変数確認 ・重要変数の値の取得 ・ツリー構造での可視化 →今回は会員期間と利用回数は重要 →ビジネスユーザーも含めて重要変数があらゆる角度で簡単に可視化・確認できるのはDataikuの強みです👏 #dataiku #機械学習 #AI pic.twitter.com/0roR7nATTF

2023-07-24 07:45:00
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <スポーツジムの退会予測🔚> ノック50:顧客の退会予測 ・データを利用した予測も可能だがWhat-ifを活用 ・パラメータを調整しながら結果をすぐに確認 ・今回は予測確率(約92%)とともに退会(flag1)が予測されています →テキストの半分をノーコードで完了☝️ #dataiku #機械学習 #AI pic.twitter.com/5zDmQSftjV

2023-07-25 07:45:00
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <実践編①機械学習🔚> 定量的な実績サマリ ・機械学習が主テーマの前半ノック50本をdone ・20行コード/ノック1本×50ノック=1,000行程度必要なところ、完全ノーコード👏 ・作業時間は、動画内作業が大体平均70sec/1ノック×50ノック=1時間少々でdone👌 #dataiku #機械学習 #AI

2023-07-26 07:45:00