Data
Data와 관련된 글을 작성하는 공간
2023
2021
- 데이터 로그 설계, 데이터 로깅, 이벤트 로그 설계, 데이터 QA의 모든 것
- Uber’s Real-time Data Intelligence Platform At Scale: Improving Gairos Scalability/Reliability 번역
2019
- Rules of Machine Learning: Best Practices for ML Engineering 정리
- CS224W - Machine Learning with Graphs 1강 정리
- 지도 데이터 시각화 : Uber의 pydeck 사용하기
- Gaining Insights in a Simulated Marketplace with Machine Learning at Uber 번역
- Python SimPy 사용법 - 파이썬으로 시뮬레이션 만들기
- 최적화로 바라본 Knapsack Problem
- Discrete Optimization 입문
- Interpretable Machine Learning
- Uber Kepler.gl : 지리 데이터 시각화 도구
- Uber H3 : 육각형 계층의 인덱스
- 메타휴리스틱 기법과 탐색 방법, Metaheuristics and Search Technique
- Hash 함수를 사용한 AB Test Sampling
- 시계열 예측을 위한 Facebook Prophet 사용하기
- Reinforcement Learning 3강. Planning by Dynamic Programming
2018
- Reinforcement Learning 2강. MDP
- Uber Experimentation Platform(XP) 이해
- 딥모닝 5주차. PR12-022~025
- 딥모닝 4주차. PR12-017~021
- 딥모닝 3주차. PR12-012~016
- 딥모닝 2주차. PR12-007~011
- 딥모닝 1주차. PR12-001~006
- David Silver-Reinforcement Learning 1강
- Advanced Feature Engineering with Kaggle
- Kaggle Tip 및 대회 후기
- Kaggle 동영상 강의 Week4 - Hyperparameter Optimization
- Google Colab 사용하기
- Kaggle 강의 Week3 - Metrics optimization
- How to win a data science competition Week2 - EDA
- Coursera Kaggle 강의(How to win a data science competition) 1주차
- CS224n 1강. Natural Language Processing with Deep Learning
- 데이터 엔지니어 관련 영상 메모
- Apache Kafka Install on Linux
- Tensorflow Serving Tutorial
- Apache Spark RDD, Dataframe을 DB(MySQL, PostgreSQL)에 저장하기
- Xgboost 논문 리뷰 및 코드
- Up-sampling with Transposed Convolution 번역
- Apache Kafka(아파치 카프카) Intro
- Apache Spark Streaming
- CS231n 13강. Generative Models
- Apache Spark Cluster on Google Cloud Platform
- Apache Spark RDD NotSerializableException
- Apache SparkSQL과 Dataframe
- CS231n 12강. Visualizing and Understanding
- Apache Zeppelin(아파치 제플린)
- Apache Spark(아파치 스파크) RDD API
- CS231n 11강. Detection and Segmentation
- Apache Spark(아파치 스파크) Intro
- CS231n 10강. Recurrent Neural Networks
- 대용량 데이터 처리 기술(GFS, HDFS, MapReduce, Spark)
- CS231n 9강. CNN Architectures
- Stanford CS231n 7강. Training Neural Networks 2
- Stanford CS231n 6강. Training Neural Networks-1
- Tiny SSD 논문 리뷰
- CS231n 5강. Convolutional Neural Networks
- Stanford CS231n 4강. Backpropagation and Neural Networks
- Faster R-CNN 논문 리뷰
- Stanford CS231n Lecture 2. Image Classification
- 서포트 벡터 머신(Support Vector Machine, SVM)
- 로지스틱 회귀(Logistic Regression)
- YOLO(You only look once): Unified, real-time object detection 논문 리뷰
- 머신러닝 알고리즘 Cheat Sheet
- 나이브 베이즈 분류기(Naive Bayes Classifier)
- 규칙 기반(Rule-Based) Machine Learning 기초
- 머신러닝(Machine Learning)의 수학적 기초
- Learning Natural Language Inference using Bidirectional LSTM model and Inner Attention 리뷰
- Semantic Textual Similarity Multilingual and Cross-lingual Focused Evaluation 리뷰
- Pytorch를 활용한 Advanced Sequence models
- Pytorch를 활용한 RNN
- Pytorch를 활용한 자연어 처리(NLP)
- 딥러닝에서 사용되는 여러 유형의 Convolution 소개
- 데이터 사이언스 인터뷰 질문 모음집
- Pytorch Basic(1)
- Hidden Technical Debt in Machine Learning Systems 리뷰
- OpenCV - 이미지/비디오 읽기
- Apache Airflow - Workflow 관리 도구(1)
- 빅데이터 생태계(Bigdata Ecosystem) - 벤더 및 아파치 재단