OCHaCafe2 #6 『Cloud Native × Streaming はじめの一歩』

5月13日19時より開催された 🍔OCHaCafe2 #6 🍔 ~Cloud Native × Streaming はじめの一歩 ~にて投稿いただいたTweetをまとめました! OCHaCafeとは? Oracle Cloud Hangout Cafe、略してOCHa Cafe(おちゃかふぇ)🍔 続きを読む
0
前へ 1 2 ・・ 6 次へ
gonsuke777 @ora_gonsuke777

DataFrame で構造化されたデータを SQL で扱えるようになった。ただし型安全ではない。 彡(゚)(゚) #ochacafe

2020-05-13 19:22:15
gonsuke777 @ora_gonsuke777

Dataset は RDD と DataFrame の良いとこどり。 彡(゚)(゚) #ochacafe

2020-05-13 19:23:19
gonsuke777 @ora_gonsuke777

Driver Program, Executer, Cluster Manager の役割分担 彡(゚)(゚) #ochacafe

2020-05-13 19:24:35
gonsuke777 @ora_gonsuke777

YARN, k8s などが Cluster Manager として利用可能 彡(゚)(゚) #ochacafe

2020-05-13 19:25:20
Takuya Niita @takuya_0301

クラスタマネージャのYARNとNode.jsのパッケージマネージャyarnはいつもややこしい。 #ochacafe

2020-05-13 19:25:26
gonsuke777 @ora_gonsuke777

どうでもエエけど k8s をそらで書けるきがしねぇ…… 彡(-)(-) #ochacafe

2020-05-13 19:26:06
gonsuke777 @ora_gonsuke777

Spark Streaming は ストリーミングデータ に対するリアルタイム処理 彡(゚)(゚) #ochacafe

2020-05-13 19:26:52
gonsuke777 @ora_gonsuke777

前回にも似たようなぼやきをしたけど、ストリーミングデータに対する処理と言えば Oracle製品だと CEP(OEP) なんやけど、これも何処行ったんやろ…… 彡(-)(-) #ochacafe

2020-05-13 19:27:51
Siena. @n_siena

SparkのRDD/DF/DSのデータコレクショングラフは、(関係代数のそれに似た) 演算子グラフにパーティショニングされたデータを割り当ててインスタンス化したようなもの。というふうに考えると、プログラミングしていると問合せ最適化器の気持ちになれて楽しい(苦しい)。 #ochacafe

2020-05-13 19:28:51
ぬっきーさん@ゆるふわハイカー @poponuki

ECサイトのレコメンドで、Apache Sparkを使った例がある(?) #ochacafe

2020-05-13 19:29:22
gonsuke777 @ora_gonsuke777

ストリーミングデータを RDD に変換して、ニア・リアルタイム で処理していく。マイクロバッチ 彡(゚)(゚) #ochacafe

2020-05-13 19:31:59
not rogue @not_rogue

Spark StreamingはMicro batchのニアリアルタイム #ochacafe

2020-05-13 19:32:00
gonsuke777 @ora_gonsuke777

Structured Streaming → DataFrame, Dataset を Spark SQL で処理する仕組み 彡(゚)(゚) #ochacafe

2020-05-13 19:33:19
gonsuke777 @ora_gonsuke777

Data Source → Input → Result → Output というシーケンスで処理する。Input が時系列で積み上がっていく。 彡(゚)(゚) #ochacafe

2020-05-13 19:35:24
gonsuke777 @ora_gonsuke777

Structured Streaming のサンプルコード 彡(゚)(゚) #ochacafe

2020-05-13 19:37:21
gonsuke777 @ora_gonsuke777

@nari_trials 製品名が変わっただけなのか、Sparkベースでまるっと作り替えてるのか。 彡(゚)(゚) #ochacafe

2020-05-13 19:38:54
gonsuke777 @ora_gonsuke777

@Nobu_Tanigawa せやったんですか……。 彡(゚)(゚) #ochacafe

2020-05-13 19:39:21
gonsuke777 @ora_gonsuke777

まだ生きてるのか名前を変えたのか、CEP(OEP) よ。 彡(゚)(゚) #ochacafe

2020-05-13 19:40:08
gonsuke777 @ora_gonsuke777

ターミナル画面によるデモ、左側が netcat(Input), 右側が Spark Streaming(Output) 彡(゚)(゚) #ochacafe

2020-05-13 19:41:46
Takuya Niita @takuya_0301

Sparkというコンソールシンボル久々に見たなぁ... #ochacafe

2020-05-13 19:42:06
gonsuke777 @ora_gonsuke777

右側の Output は 現時点では 0件 彡(゚)(゚) #ochacafe

2020-05-13 19:43:13
gonsuke777 @ora_gonsuke777

左側の netcat で Input すると 右側の Spark でカウントされる。 彡(゚)(゚) #ochacafe

2020-05-13 19:43:59
gonsuke777 @ora_gonsuke777

Spark側 を Complete から Update に変更して実行、更新部分だけが出力される。 彡(゚)(゚) #ochacafe

2020-05-13 19:46:22
gonsuke777 @ora_gonsuke777

コンソールベースのデモが地味になっちゃうのはしゃーない。 彡(゚)(゚) #ochacafe

2020-05-13 19:47:08
前へ 1 2 ・・ 6 次へ