데이터 사이언티스트가 되기 위해 진행한 다양한 노력들


  • 데이터 공부를 시작하고 현재까지, 제 일대기에 대해 작성한 글입니다

Intro

  • 다양한 경로로 진로 관련 질문을 많이 받고 있습니다
    • 특히 제가 자주 받는 질문은 “문과생”이고 대학원도 진학하지 않았는데 어떻게 공부했는지?입니다
    • 이런 질문을 많이 받다보니 글로 남기면 좋지 않을까! 생각해서 글을 작성합니다
  • 약 4년간 과거를 회고하려고 합니다
  • 제가 진행한 내용이 답은 아니고 누군가는 저렇게 했구나 정도로 이해하면 좋을 것 같습니다
  • 데이터 사이언스 관련 내용이 궁금하시면 제가 작성한 아래 자료들을 참고해주세요 :)

첫 시작

간단한 자기소개

  • 저에 대해 간략히 설명하면 경영학을 전공했고(부전공, 복수전공 없습니다) 대학 입학하고 2년간 놀다가 군대에 갔습니다

2013년

  • 전역 후엔 대학생 연합 광고동아리인 애드파워에서 “광고”, “디자인”을 공부했습니다
    • 경쟁 PT나 광고 공부를 통해 자신의 생각을 어떻게 효율적으로 전달할지, 기획이란 무엇인지 등을 조금이나마 배웠습니다
    • 광고 전반, 디자인/영상에 대해 알 수 있었고 좋은 사람들을 많이 만나서 후회하지 않는 생활이었지만, 광고를 업으로 삼을 수 없을 것 같다는 생각이 들었습니다
    • 그나마 관심있던 직군은 미디어 플래너였습니다. 수학이나 통계학을 좋아했던 성향이 있어서 매체별 데이터를 다루는 미디어 플래너에 대해 관심이 있었습니다
    • 실제 데이터를 보니 너무 가공된 데이터란 생각을 했고, 한단계 깊은 데이터를 보고 싶었습니다
  • R을 활용한 데이터 분석이 궁금해 한국 RFID/USN 융합협회에서 진행한 “R 기반 빅데이터 분석 입문 과정”을 2013년 9월에 들었습니다
    • 하지만 이 시기에 들은 내용 중 지금 기억나는건 전혀 없네요

2014년

  • 2013년~2014년엔 공기업에서 계약직으로 근무했습니다
    • 3학년으로 복학했지만 학교 공부에 흥미가 없고 학점도 낮아서 그냥 회사에선 어떤 일을 하는지 알고싶어 인천도시공사에 지원했는데, 합격했습니다
    • 간단한 사무보조부터 각종 행정처리, 건축 토목 현장 관리 등을 진행했습니다
    • 돌이켜보니 그냥 이 시기는 멍 때리던 시기입니다
  • 공기업에 취업할 생각도 있어서 시작했지만, 결론적으로 전 조금 더 액티브한 삶을 지향한다는 것을 알게 되었습니다

2015년

  • 2014년 말부터 지인들과 창업했습니다
  • 와디즈에서 500만원 펀딩을 받으며 시작했습니다
    • 달다쓰다 - 또 하나의 작은 게양
    • 진행했던 업무는 운영, 회계, 배송, 온라인 마케팅 등 다양한 일을 했습니다. 일하던 도중 “내가 진짜 하고 싶은 일이 지금 하는 일들일까?”라는 생각에 창업팀에서 빠지고 데이터 공부를 본격적으로 시작했습니다
  • 2015년은 요즘처럼 인터넷에 데이터 관련 다양한 정보가 넘치진 않던 시절입니다(참고로 우리가 많이 알고있는 알파고는 2016년에 나왔습니다)
  • 그 당시 진행했던 것은 크게 2가지입니다
    • 1) 빅데이터 동아리 BOAZ 활동
    • 2) 오늘 밤부터 쓰는 GA 수강
  • 빅데이터 동아리 보아즈 활동
    • 공모전도 활성화되지 않았고, 책도 많이 없기 때문에 비슷한 지향점을 가지는 사람들을 알고 싶어 빅데이터 동아리에 지원했습니다
    • 기반 능력이 거의 없음에도 불구하고 다행히 합격했습니다
    • 하지만 저는 공부보단, 그냥 동아리에 출석하고 가끔 뒷풀이 가는 삶을 살았던 기억이 나네요
    • 요새 동아리 후배분들을 보니 정말 많은 고민을 하고, 빡세게 공부를 잘 하고 있는 것 같습니다
    • 프로젝트 진행할 때도 R과 파이썬을 거의 못했던 기억이 납니다
    • 단, “빅데이터”란 공통된 흥미를 가진 사람들을 만났던 것이 정말 좋았습니다
  • 오늘 밤부터 쓰는 GA 수강
    • 이 강의는 알렉스앤컴퍼니에서 진행한 강의입니다
    • Google Analytics를 통해 데이터 분석할 수 있단 소식을 듣고 수강했습니다
    • 돌이켜 보면 이 강의를 통해 하용호님을 만날 수 있었고, 계속 데이터 공부를 할 자극을 얻었습니다
    • 하용호님은 어려운 내용을 정말 쉽게 설명해주시는 것으로 유명합니다! 슬라이드쉐어에 가면 자료를 볼 수 있습니다

2016년

  • 빅데이터 동아리 활동이 끝난 후, 4학년 2학기인 저는 깊은 고민에 빠졌습니다
    • “진짜 데이터를 더 공부하고 싶은가? 아니면 그냥 취업할까?”
    • “대학원에 갈까?”
    • 아마 이런 고민들은 지금도 많은 분들이 고민할 내용이라 생각합니다
  • 깊은 고민 끝에 내린 결론은 “연구”보단 실제로 제 능력을 갖고 싶었습니다
  • 대학원이 아닌 다른 방법을 찾아보던 도중, 패스트캠퍼스 데이터사이언스 스쿨을 찾았고 많은 고민을 한 결과, 수강을 결정했습니다
    • 360만원의 학원비와 신사 고시텔 생활비 180만원, 금전적으론 약 500만원, 시간은 3개월 정도 할애해야 하는 과정이었습니다
    • 하지만 투자할 가치를 느꼈고, 잘한 선택이라고 생각합니다
    • 이 기간에 어떻게 코딩해야 하는지, 데이터 사이언스에 대한 전반적 지식을 얻을 수 있었습니다
  • 공부한 내용을 조금씩 기록하잔 의미로 인스타그램에 공부 계정 : data.scientist을 만들고 글을 꾸준히 올렸습니다. 요새도 올리고 있습니다
  • 패스트캠퍼스
    • 개발을 전혀 모르던 제게 많은 지식을 얻게 해준 과정입니다
    • 요샌 광고가 많아서 대부분 패스트캠퍼스를 알고, 고민할 것 같습니다
    • 요샌 인터넷에 많은 자료가 공개되었기 때문에 학원을 안 다녀도 된다는 분들이 많습니다. 맞습니다. 제가 공부하던 시기보단 자료가 많아졌습니다. 따라서 굳이 학원으로 시작을 하지 않아도 되긴 합니다
    • 아예 초심자고, 의지를 컨트롤하기 힘들 것 같은 경우엔 학원도 나쁘진 않단 생각을 합니다
  • 많은 지식을 쌓았고, 여러 회사에 면접을 봤습니다
    • 아직도 기억에 나는 면접은 “아프리카TV”의 데이터 분석가 면접입니다
    • 데이터 분석가로 진행하는 거의 첫 면접인 동시에 사전 과제를 처음 겪은 면접입니다
      • 아프리카TV의 데이터 일부분을 주고, 분석하는 문제였습니다
      • 데이터를 보고 “왜 이런 사람이 있지? 이 데이터는 뭘까? 왜 이런 결과가 나오지?” 등을 고민하며 즐거웠습니다
    • 사실 면접 다음 달에 1달간 어머니와 유럽 여행이 계획되어 있다고 말했고, 제 자신도 부족했기 때문에 불합격했습니다
  • 유럽에 다녀오고, 천천히 지식을 재점검하며 2016년이 지나갔습니다

2017년

  • 파이썬, 개발, 머신러닝에 대해 얼추 이해한 상태에서 다시 고민에 빠졌습니다
    • 공부하면 할수록, 대학원에 가야할 것 같은데..? 공부할 것이 너무 많다
    • 고민 후 결론은 우선 취업해서 현실의 업무를 하나씩 진행해본 후, 다시 결정하자였습니다
  • 카메라에 관심이 많았는데, 카메라 어플을 만드는 “레트리카”에서 데이터 분석가를 채용하는 공고를 봤습니다
    • 무언가의 끌림에 바로 지원했고, 면접을 봤습니다
    • 면접을 보며 면접관 분이 매우 똑똑하고, 말을 잘하는 것이 인상깊었습니다
    • 논리적인 대화로 제가 KO 완패를 받아, 오기가 생겼습니다
    • 운이 좋게도 합격했습니다. 나중에 왜 저를 합격했는지 물어보니 다양한 지원자 중 데이터에 대해 이야기할 때 눈이 반짝거렸다고 들었습니다
  • 레트리카
    • 레트리카는 카메라 어플로 입사 당시 DAU(Daily Active User)가 약 1,000만명이었습니다
    • 터키, 인도, 브라질 등 다양한 국가에서 사용하는 어플!
    • 입사하니 데이터팀은 면접관이셨던 COO님, 그리고 저보다 2달 먼저 입사한 신입분, 저 이렇게 3명이었습니다
    • 입사하고 데이터 분석이란 어떤 일인지 몸소 체험하며 다양한 시행착오를 겪었습니다
    • 특히 기억나는 4가지를 말씀드리면,
  • 1) 시니어의 부재
    • COO분은 매우 논리적이고 날카로운 분이셨지만, 데이터 분석에 풍부한 경험이 있는 분은 아니었습니다
    • (여전히 매우 좋아하는 분입니다)
    • 입사 3달까진 시니어를 뽑아주길 바랬고, 시니어 면접에 참여했습니다
    • 어느 순간 시니어를 바라지 않고, 제가 업무를 찾아보며 시작했습니다. 책이나 인터넷 강의를 많이 들었고, 인터넷에서 경험이 많은 분들에게 페북 메세지를 보내며 궁금한 내용들을 채웠습니다
    • 아마 시니어가 없던 이 상황에 제가 살아남기 위해 고민을 했던 점들이 지금 제게 큰 자양분이 된 것 같습니다
    • 1년간 거의 12시~새벽 1시에 집에 갔습니다
      • 제가 부족하다 생각했기 때문에 남아서 더 자료를 찾아보고 공부하고 일을 했습니다
  • 2) 데이터 엔지니어링 경험
    • 팀 내에서 유일한 파이썬 경험자였는데(솔직히 이 당시에 잘하진 못했음) 서버 개발자분이 저를 보시더니 데이터 ETL 과정을 인수인계해주셨습니다 ^_^
    • 완전 급하게 배워서 체하는 느낌도 살짝 있었지만, 새로운 내용을 하는 것이 너무 재밌어서 이것도 퇴근 하고 계속 공부했습니다
    • 덕분에 Google Cloud BigQuery에 대해선 정말 많이 이해했고, ETL이 꼭 하둡/스파크를 사용하지 않아도 되는 점 등을 알게 되었습니다
    • 서버 개발자분도 사내에 혼자셔서 바쁘셨기 때문에 제게 이런 내용을 다 넘겨주신건데, 정말 감사하게 생각하고 있습니다
    • 2017년 말엔 아예 서버 개발자로 직군을 바꿔, 유일하게 계신 서버 개발자분에게 아주 약간의 지도를 받았습니다
    • 지도라고 해봤자 Error 디버깅하는 것을 바라본 정도인데, 그 과정을 보고 어떻게 트러블 슈팅할지 감을 익혔습니다
    • 그리고 쉘스크립트, 파이썬으로 맵리듀스 짜는 것도 해보고, 다양한 경험을 했습니다
    • 사내 대시보드, 다양한 데이터를 볼 수 있는 대시보드, Airflow 등을 찾아보고 사내에 도입했습니다
  • 3) 오퍼레이션 업무 지원
    • 사실 데이터 분석, 머신러닝/딥러닝을 공부하다보면 무언가 별도의 조직처럼 움직일 것 같지만, 회사에서 필요로 하는 것들 중 전혀 몰랐던 것도 있습니다
    • 기술을 통해 오퍼레이션에서 진행하는 다양한 노동 활동을 자동화하는 것도 회사에 큰 도움이 되는 것을 깨달았습니다
    • 야한 사진을 Block하는 것들을 만들며 새로운 지식을 또 습득했습니다
      • 컴퓨터 비전 지식, Docker 지식
  • 2)와 3)에 대한 내용이 더 궁금하시면 제 발표자료 : 바닥부터 시작하는 데이터 인프라를 참고하면 좋을 것 같습니다
  • 4) 개인 업무 성향 파악
    • 입사 후, 30일/60일/90일 피드백을 통해 제가 어떤 스타일로 업무를 하는지 알 수 있었습니다
    • 어떤 일을 하기 전에, 다양한 고민이 많았고 뜬구름도 많이 잡았습니다. 이런 피드백을 핵직구로 받은 후 계속 개선하다보니 이젠 린한 사고 과정이 체득되었습니다
    • 꾸준히 메모하던 습관에서, 일정 관리도 더 자세히 하게 되었습니다
      • 캘린더에 시간 단위로 일정을 등록하고 있습니다
      • 파란색은 회사 일정, 연보라색은 개인 일정입니다
  • 2017년 회고, 2018년 계획 블로그 글에 자세히 작성했습니다

2018년

  • 4월까지 회사를 다니다 퇴사했습니다
  • 퇴사한 이유는 아래와 같습니다
    • 1) 자신에 대해 생각할 시간이 필요해서
    • 2) 개인 공부할 시간을 확보하기 위해서
    • 3) 취업은 언젠가 다시 할 수 있단 긍정적 마인드
  • 자신이 나아갈 방향을 설정하는 시간인 Gap Year를 계획적으로 보내기로 다짐했습니다
  • 특히 앞으로 어떻게 커리어를 쌓을 것인가?에 대해 계속 고민했습니다
  • 이 시기에 제 진로를 다시 고민한 결과, 저는 “연구”보단 현실의 문제를 푸는 “Solver”가 되고 싶어하는 성향을 발견했습니다
    • 문제를 해결하는 동시에 엔지니어이고 싶었기 때문에, 문제 해결에 대한 공부와 엔지니어 성향 모두를 계속 공부하고 있습니다
  • 대학생 분들에게 고민을 나누기 위해 취업 특강을 많이 했습니다
  • TMI) 글쓰는 개발자 모임, 글또를 시작해서 다른 분들이 글쓰는 것을 돕고 있습니다
  • 2018년 회고, 2019년 다짐 블로그 글에 자세히 나와있어요!

쏘카


  • 쏘카 입사한지 6개월이 지났습니다(글 쓰는 시간 기준)
    • 2018년 9월 ~ 현재
  • 많은 일이 있었는데, 느낀 점 몇개 말씀드리면
  • 1) 큰 규모의 데이터팀
    • 저희 쏘카 데이터 그룹은 현재 약 20명입니다
    • 리서치 회사를 제외한 데이터 관련 팀 중 제일 큰 규모라고 생각합니다
    • 각자 도메인이 다르고, 다양한 경험이 있어 대화하는 것만으로도 충분히 성장하게 됩니다
    • 문무를 겸비한 것처럼 데이터 분석/머신러닝/딥러닝/데이터엔지니어링 모두 경험있는 분들도 꽤 있습니다
  • 2) 재미있는 데이터와 문제
    • 모빌리티 데이터는 정말 재미있습니다
    • 차량에서 나올 수 있는 데이터가 무엇인지? 생각해보면 좋을 것 같습니다
    • 그리고 최근 나온 타다도 급성장하며 생기는 데이터와 문제들! 블로그에 말씀 드리긴 어렵지만, 현실의 문제를 빠르게 해결하고 있습니다
  • 저는 어떻게 지낼까요?
    • 요샌 “최적화”에 대해 관심이 많습니다. Operation Research부터 시작해 휴리스틱, 메타휴리스틱, 유전 알고리즘 등 기존에 전혀 알지 못했던 내용들을 공부하고 익히고 있습니다
    • 지리 데이터, 좌표 데이터를 많이 가공하며 새로운 도메인에 대해 적응하고 있습니다
    • 여전히 공부 많이하고, 책도 보고 강의도 보고 그러고 있습니다
    • 머신러닝 부분은 “시계열 예측”과 “MLOps”에 대해 계속 공부하고 있습니다
  • 좋은 문화, 좋은 팀을 만들기 위해
    • 저는 제가 속한 회사가 제일 좋은 회사가 되길 원하고 있습니다. 오지랖 부리며 이것저것 하고 있는데 몇개 말씀드리면
    • 1) 스터디 진행
      • 최근에 나온 “파이선 머신러닝 완벽 가이드”를 스터디하고 있습니다
      • 책이 너무 좋고, 팀 동료분들이 알면 좋을 내용이 많다 판단해서 제가 스터디 매니저를 자처해 스터디를 진행하고 있습니다
      • 누가 발표하는 것이 아닌, 정해진 시간에 책을 같이 읽고 토론하고 있습니다
      • 스터디 내용은 Github에 올리고 있습니다
      • 이 스터디 말고도, 스터디잼 중급반도 시작했습니다
    • 2) 스터디 지원
      • 쏘카에서 SQL을 사용하는 분들이 질문하시면 정성껏 답변 하고 있습니다(스터디의 QnA 봇 같은 존재..?)
      • 기획자분들이 직접 SQL을 하는 것을 정말! 감동적인 일이라 생각해서 열심히 답변드리고 있습니다
      • 저 말고도 다른 데이터그룹 분들도 함께 답변을 하고 있습니다
    • 3) Kaggle에서 홍보
      • 좋은 분들을 모시기 위해 다양한 곳에서 회사 홍보를 해야한다고 생각합니다
      • 저는 데이터에 관심있는 분들은 캐글을 많이 할 것이란 가정하에 캐글에서 [SOCAR]라는 타이틀을 달고 대회에 참가하고 있습니다
  • 앞으로도 좋은 팀, 좋은 문화를 가질 수 있도록 계속 노력할 예정입니다

미래

  • 요새 관심사인 Operation Research, 시계열 예측, MLOps 등 다양한 내용들을 공부, 정리, 현업에서 바로 활용을 하려고 합니다
  • 친한 분들과 유튜브 채널을 만들었습니다 : DeepNOL! 데이터와 관련된 다양한 이야기를 전해드리려고 합니다
    • 이와 별개로 제 개인 유튜브에 책 리뷰를 남기려고 합니다
  • 구성원들과 함께 자라기를 실천하기 위해 어떤 행동을 할까 고민하고 있습니다

정리

  • 정리하면 저는 2013년부터 데이터 분석에 관심을 가지다 방황하고, 2015년부터 다시 공부하고, 2016년부턴 아예 데이터 분야에 몰입했습니다. 2018년엔 퇴사 후 제 부족한 부분을 채웠고, 현재 쏘카에서 근무하고 있습니다
  • 이 글을 보시는 분들도 포기하지 않고, 목표를 가진 상태로 꾸준히 공부하면 좋은 결과가 있을거라 믿습니다

FAQ

  • 제 일대기를 작성했지만, 명쾌하게 답변하지 않은 부분을 정리하려 합니다
  • 1) 대학원에 꼭 가야할까요?
    • 이 고민을 하기 전에, 본인이 연구를 하고 싶어하는지, 현실의 문제를 풀고싶은지 등을 고민하면 좋을 것 같습니다
    • 연구를 하고 싶다면 대학원에 가는 것도 좋은 선택일 수 있고, 반면 현실의 문제를 풀고 싶다면 회사에 가는 것도 좋은 선택일 수 있습니다
    • 본인의 목적과 미래를 생각해보면 조금 더 확실한 결정을 내릴 수 있을 것 같습니다
  • 2) 비전공자인 제가 할 수 있을까요?
    • 각자의 전공은 충분히 의의가 있다고 생각합니다. 저는 경영학에서 배운 커뮤니케이션 능력이 업무에 큰 도움이 되고 있습니다
    • 비전공자일 경우 코딩이나 수학에서 어려움이 있을 수는 있지만, 꾸준히 공부하다보면 어느정도 해결될 것이라 생각합니다
    • 전공이냐 비전공이냐기 보다 “나는 할 수 있고, 나의 페이스대로 잘 가고 있다”라는 생각을 하시며 꾸준히 하시면 좋을 것 같습니다
    • 단, 정말 많은 노력이 수반되니 꾸준히 공부해주세요
  • 3) 공부하시며 어려운 점이 있었나요?
    • 공부할 내용이 너무 많아 어렵지만, 이런 생각을 반대로 새로운 내용을 배우는 것은 너무 재미있고, 하나씩 정복하는 재미가 있다고 생각했습니다
    • 어렵다고 말하면 안할 생각인지 여쭤보고 싶습니다. 정말 하고 싶다면, 어려운 점도 극복할만하다 생각합니다
  • 4) 무엇을 공부해야 할까요?
    • 답이 없는 질문인 것 같습니다. 사람마다 배경이 다르기 때문에 어떤 것을 공부해야 한다!고 말하긴 어려울 것 같습니다
    • 단, 채용공고를 정리한 내용을 토대로 어떤 능력이 필요한지는 파악할 수 있을 것 같습니다.
    • 그 전에 어떤 직군을 하고 싶은지 고민해보시는 것을 추천합니다.제가 작성한 I-want-to-study-Data-Science를 참고하면 좋을 것 같습니다
  • 5) 학원을 다녀야 할까요? 국비지원을 가야할까요?
    • 요샌 의지만 있다면 인터넷에 다양한 자료가 있기 때문에, 학원을 굳이 안가도 됩니다. 스터디를 꾸려도 되고, 모두의 연구소 같은 곳에서 공부해도 되고 다양한 방법이 있습니다. 어떤 곳이 있는지 찾아보시고 결정하시면 좋을 것 같습니다
    • 단, 국비지원 중 너무 많은 범위를 다루는 수업(예를 들어 자바, 하둡, 스파크, 텐서플로, 딥러닝 등을 3~6개월에 다루는 수업)이 얼마나 좋을지는 모르겠습니다(제가 경험을 안했기 때문에 판단하기 어렵지만, 과한 느낌이 있습니다)
  • 6) 자격증을 따려고 하는데 도움이 될까요?
    • 보통 자격증하면 ADP, ADsP, SQLD, SQLP, 사회조사 분석사, 정보처리기사 등이 있습니다. 공부의 목적으론 괜찮을 수 있지만 취업 목적으론 효용이 있는지 모르겠습닌다
      • 저는 사회조사 분석사 2급, 정보처리기사가 있지만 취업할 때 도움을 받은 기억은 없습니다
    • 이 업계는 실력이 중요하기 때문에 실제 데이터 분석을 하거나, 프로젝트 진행, 캐글 등을 참여해보는 것이 좋을 것 같습니다
  • 위 질문에 대해 답변을 남긴 FAQ를 참고하셔도 좋을 것 같습니다

  • 이력서 작성이 어려운 분들을 위해 제 이력서를 보여드립니다. 참고만 하시면 좋을 것 같습니다

카일스쿨 유튜브 채널을 만들었습니다. 데이터 사이언스, 성장, 리더십, BigQuery 등을 이야기할 예정이니, 관심 있으시면 구독 부탁드립니다 :)

PM을 위한 데이터 리터러시 강의를 만들었습니다. 문제 정의, 지표, 실험 설계, 문화 만들기, 로그 설계, 회고 등을 담은 강의입니다

이 글이 도움이 되셨거나 다양한 의견이 있다면 댓글 부탁드립니다 :)

Buy me a coffeeBuy me a coffee





© 2017. by Seongyun Byeon

Powered by zzsza