【実践データ分析】<小売店のデータ分析(ノック11-20)>まとめ

Dataikuを活用した小売店のデータの分析 【含まれる要素】 ・CSVファイルの取り込み(顧客台帳と売上履歴) ・Prepare/Pivot/joinレシピ - 日付から年月カラムの作成 続きを読む
4
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <小売店のデータ分析> ・売上履歴と顧客台帳データを利用した分析 ・小売データとして人の手を介すため、ミスやミスや抜け漏れなどの対応が必要 ・ 引き続き以下の文献を参考にノック11-20を確認 ・今の所ノーコードで完了中 shuwasystem.co.jp/book/978479805… #dataiku #機械学習 #AI

2023-06-13 07:45:00
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <小売店のデータ分析> ノック11:データ読み込み ・uriage.csvとkokyaku_daicyo.xlsxの読み込み →繰り返しですがファイルのドラッグ&ドロップで完です #dataiku #機械学習 pic.twitter.com/iO3M9D5LeJ

2023-06-13 07:46:00
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <小売店のデータ分析> ノック12:データの揺れの確認 ・売上履歴には商品名の揺れを確認(商品A,商品a,商品 aなど) ・商品金額には欠損値(NaN)を確認 →探索的データ分析(EDA)としてクイックにカラムの中身を視覚的に把握できます #dataiku #機械学習 pic.twitter.com/cR17Bbax8q

2023-06-14 07:45:00
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <小売店のデータ分析> ノック13:データに揺れがあるまま集計 ・商品名に表記揺れがあるまま集計(本来26商品が92商品に増えてしまう) ・商品毎の売り上げ合計も誤った値になる →データ加工しないと誤った集計結果を得てしまいます(集計自体はノーコードで完了) #dataiku #機械学習 pic.twitter.com/dbHT5JvIIq

2023-06-15 09:05:12
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <小売店のデータ分析> ノック14:商品名の揺れの補正 ・商品名に大文字/小文字が混在 ・商品名の中にスペースが混在 →動画の通り設定ベースで一瞬でデータ補正が完了します!(92カテゴリが正確に26カテゴリに修正done) #dataiku #機械学習 pic.twitter.com/hF7YjcMdgx

2023-06-16 07:45:00
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <小売店のデータ分析> ノック15:金額欠損値の補完 ・商品名毎に決まった金額で欠損値を補完したい ・商品名/金額マスタを作成 ・売上テーブルに作成したマスタを結合(価格更新) →ちょっと悩みましたが、少々高度な補完も継続してノーコードで完了しました! #dataiku #機械学習 pic.twitter.com/IVdtY8ni0v

2023-06-17 07:45:00
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <小売店のデータ分析> ノック16:顧客名の揺れの補正 ・姓名の間に全角/半角スペース有り ・集計時のカニバリを防ぐためにスペースを削除 →前々回と同様にPrepareレシピを用いて空白をreplaceすればdoneです #dataiku #機械学習 pic.twitter.com/6sfan6nI3O

2023-06-18 07:45:00
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <小売店のデータ分析> ノック17:日付の揺れの補正 ・Excelデータでの"47872"等のシリアル値の変換 ・以下Pythonとの差異 ①最小日付1900/01/01はシリアル値1(Pythonは0) ②うるう年でない1900/02/29を日付加算 →2日ズレるのでPythonへの日付換算後-2する必要有 #dataiku #機械学習 pic.twitter.com/4nttovET5D

2023-06-19 09:04:18
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <小売店のデータ分析> ノック18:顧客名をキーに2つのデータを結合 ・売上履歴と顧客台帳の結合 ・以降(ノック19,20)は本結合データで分析 →何度か出てきているJoinレシピでdoneです #dataiku #機械学習 pic.twitter.com/B60Vi2q1jF

2023-06-21 09:05:29
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <小売店のデータ分析> ノック19:クレンジングデータのダンプ ・分析用のデータのダンプ(出力) ・今回はcsvでしたが、ExcelやPowerBI、Tableauなど様々な出力形式が選択可能 →Export機能で選択して出力doneです #dataiku #機械学習 pic.twitter.com/wa8NtMJ5E4

2023-06-22 07:45:00
Fumihiko Kimura @Fumihiko__K

【実践データ分析】 <小売店のデータ分析(fin)> ノック20:データ集計 ・年月毎に各種データを集計 ・年月毎の商品の売り上げ個数を集計 ・簡易的にチャートで時系列の推移を表現 →Pivotレシピで各種集計の取りまとめが可能 →簡易チャートもそのまま作成可能 #dataiku #機械学習 pic.twitter.com/LUiyjkJnSz

2023-06-23 07:45:00