Apache Spark Streaming
in Data on Engineering
Apache Spark Streaming에 대한 글입니다
in Data on Engineering
Apache Spark Streaming에 대한 글입니다
Stanfoard CS231n 2017 13강을 요약한 글입니다. 정리 목적이라 자세하게 작성하지 않은 부분도 있습니다. CS231n의 나머지 14강~16강은 작성하지 않을 예정입니다!
in Data on Engineering
구글 클라우드 플랫폼(Google Cloud Platform, GCP)을 사용해 Apache Spark Cluster를 띄우는 방법을 작성한 글입니다.
1) Compute Engine에서 클러스터를 띄우는 방법과 2) Dataproc을 사용하는 방법 2가지를 설명합니다.
Spark 공식 문서 참고
in Data on Engineering
Apache Spark RDD NotSerializableException 오류에 대한 포스팅입니다!
in Data on Engineering
SparkSQL과 Dataframe에 대한 포스팅입니다!