0
baihebu @baihebu
sansanのセッション聞くよ。 #devsumi #devsumiC さっきのAのセッションから出たら珈琲があってカフェイン摂取中。☕️
ライナス @Linus_MK
#devsumiC 技術の詳細からは離れて データの考え方・捉え方の話をします
ぼた餅 @bota_mochi
#devsumiC sansanさんの事業説明の話。 内勤でSEやってる身としては理解はできるけどなかなか発想に至らない内容で興味深い🤔
ライナス @Linus_MK
#devsumiC sansan 法人向け名刺管理サービス 社員の人脈を、会社の収益を生む資産にする 自分に加えて、他の社員の持っている名刺が見られる eight 個人向けビジネス用SNS
tdual🔰MatrixFlow @tdualdir
OCRってそんなに精度悪いんか‥ #devsumiC
ぼた餅 @bota_mochi
#devsumiC OCRの精度は90%では使い物にならない。 なぜ?って思ったけど、例えばメールアドレスは10文字以上あるから。 確かにそりゃそうだ……
ライナス @Linus_MK
#devsumiC 前半:データ化のプロセス 名刺がデータになるまでに何が起きているか? 名刺専用のOCRはあるが……正解率90%程度 スマホアプリで一度に4〜5枚まで取り込める 画像ではなくて動画ストリームを入力として処理している
ライナス @Linus_MK
#devsumiC 名刺は個人情報なので、クラウドソーシングに丸ごと渡せない パーツ名でまず分割して、個人を一意特定するもの(メアド名前など)はさらに細分化して、クラウドソーシングに渡す 戻ってきたら元通りに繋ぎ合わせる(マージ) 名刺取り込みからデータができるまで、数分程度
ぼた餅 @bota_mochi
#devsumiC 名刺のデータ化、人力での入力間に挟んでも1分とかで終わるらしい。すごい。 それを実現する体制作りとかも気になる……
ライナス @Linus_MK
#devsumiC 後半:データの理解、向き合い方 1取り扱いは慎重に  個人情報、機微な情報か機微でない情報か  公知の情報から価値を生み出すのは難しい  機微な情報は高い価値を持つかもしれないが、収集が難しい  取り扱うデータのによって、どこに力点を入れるか使い分けを意識する
ライナス @Linus_MK
#devsumiC 後半ー2 構造の複雑さ 単純なイベントログは時系列で構造が簡単 一方で基幹系などの構造化されたデータは取り回し困難 データ構造が違うと適用できる手法も違ってくる 構造の複雑さはその後の処理に影響している
ぼた餅 @bota_mochi
#devsumiC データ構造の複雑さと使いたいデータドメインのミスマッチ……ほんっっっとそれな。今まさに現場で直面してる問題だよ_:(´ཀ`」 ∠):
ライナス @Linus_MK
#devsumiC 後半ー3 フェーズにおけるユーザ価値 データを集めるとこ  無料で手に入る公開データ  有料で手に入れる  金を払ってみんなにアンケートを取って  ゲームのログはみんなの行動 など… 出口(価値提供の相手)をどっちにするかが大事
ぼた餅 @bota_mochi
#devsumiC グラフDBの流行りが来てるらしい。 恥ずかしながらグラフDB初耳なのだけど、話の内容的にグラフ理論的な話なのかな……あとでググろう🤔
ライナス @Linus_MK
#devsumiC 「名寄せって、僕ら10年位やってきましてノウハウがありますが、死ぬほど大変なんですよ」 以前のクックパッドの資料でも出てきたな(レシピの材料名とか)……きれいに整形されていないデータだと常に悩みの種なんかね
tdual🔰MatrixFlow @tdualdir
人脈を使った法人向け企業のブランド調査面白いやんけ #devsumiC
ぼた餅 @bota_mochi
#devsumiC チンタラ書いてたら取り残されて、アンケートを出し損ねるというクソムーブかましました

コメント

コメントがまだありません。感想を最初に伝えてみませんか?

ログインして広告を非表示にする
ログインして広告を非表示にする