데이터 분석가 로드맵(프로덕트 분석가)을 만들며 했던 생각들
- 와 올해 블로그에 쓴 글이 0개였다니.. 충격적이네요. 의식하면서 글을 써보도록 할게요
- 이번 글은 인프런에 프로덕트 분석가 로드맵을 작성한 내용에 대해 공유해볼게요
- 강의 만드는 과정의 노하우 공유는 예전에 작성한 인프런에서 강의 만들기 글에 있어요
프로덕트 분석가 로드맵 제작
- 인프런 로드맵을 만들었어요. 제가 퇴사하고 만든 강의들을 모아둔 내용입니다
왜 프로덕트 분석가인가?
- 데이터 직무로 처음 일했던 회사에서 했던 일을 돌이켜보면 앱 로그 데이터 분석을 많이 진행했어요. Firebase의 데이터를 다루면서 앱 데이터가 어떻게 생겼는지, 로그 설계는 어떻게 해야하는지 등을 경험했어요
- 그 당시엔 프로덕트 분석가라는 이름이 따로 있진 않았지만, 시간이 지나고 보니 이런 이름으로 불리게 되더라구요
- 이직한 후에도 GA, Firebase 데이터를 어떻게 다룰지에 대해 생각해보고, 앱 로그 데이터에 대한 마트를 제작하기도 했어요. 그래서 이 부분에 대해서는 많은 시행착오를 겪었어요
- Amplitude, Mixpanel에 대한 것도 개인적으로 경험해보면서, 로그 데이터가 어떻게 구성되고 어떤 관점으로 바라볼지에 대해 알게 되었어요
- 그리고 비즈니스나 머신러닝 알고리즘 관점에서 AB Test를 해보고, 해석의 모호함이 생길 땐 어떻게 해결해야 할지, 통계적 유의성이 이슈가 있으면 어떻게 해야할지 등에 대해 경험했어요
- 돌이켜보면, 저는 여러 직무를 경험했지만 B2C 앱 데이터를 많이 다루곤 했어요. 그래서 프로덕트 데이터 분석가 로드맵을 만들기로 했어요(제일 많이 경험하고 시행 착오가 존재하는)
나는 왜 교육을 하는가?
- 프로덕트 분석가라는 이름이 있지 않던 시절 이 분야를 공부할 때 참 어려웠어요. 회사 개발자분께서 DB를 배우는 것이 필요하다고 해서 새로쓴 대용량 데이터베이스 솔루션을 공부하기도 했어요. DB를 이해하는데 도움이 되긴 했지만, 내용이 너무 어려웠던 기억이 나네요(요즘 학습하면 LLM의 도움을 받아 더 쉽게 가능하겠지만)
- 교육을 해야겠다고 다짐할 때, 과거의 저처럼 회사에서 업무를 진행하다가 어려움을 겪는 분들이 조금이나마 더 나은 길을 가길 바랬어요
- 어떻게 보면 과거의 저에게 보내는 강의라고 볼 수 있어요
- 이 내용을 미리 알았다면 참 좋았을텐데, 실제로 해보면 이런 부분을 깊게 생각하면 좋은 것 등
- 그래서 PM을 위한 데이터 리터러시 강의에는 “카일 스토리”라는 것이 나옵니다. 원래 강의 인트로에 연기하려고 했다가, 어설프게 하려니 이상해서 그냥 덤덤한 방식으로 전개했어요
- 저를 경험한 분들이 더 좋은 삶을 살길 바라고 있어요. 그냥 각자가 더 좋은 삶(사람마다 정의하기 나름이지만)을 살길 바라고 있어요
- 여러 관점이 있지만, 인프런에 올리는 내용은 대부분 업무를 하다가 겪는 내용들을 다루곤 해요. 어떻게 해야 일을 더 잘할 수 있고, 회사에서 인정 받을 수 있을까?를 주로 다룹니다
- 유튜브에는 커리어에서 생각할 수 있는 고민들을 주로 다루고, 로드맵이나 제 생각을 공유하곤 해요. 이런 내용을 통해 영감을 받길 바라고 있어요(꼭 그대로 하는 것이 아닌 자신만의 방법을 찾는 것)
- 어떤 형태의 강의를 하고 싶었는지 생각해보면, 고등학생 때 들었던 신승범 선생님처럼 수업하고 싶었던 것 같네요. 강의 자체도 하지만, 인생에 대한 내용이나 어떻게 삶을 살아갈지, 동기부여 등도 같이 진행하고 싶었어요
- 요즘 수학은 정승제 선생님 강의를 듣던데, 이 맥락과 비슷한 것 같네요
- 강의에 저도 이런 동기 부여에 대한 내용도 추가하려고 생각하고 있어요
어떤 것이 중요하다고 생각했는가?
- 강의는 총 3개로 구성되어 있고, 나머지는 유튜브 영상이에요.
- PM을 위한 데이터 리터러시
- 문제 정의, 구조적인 사고, 로그 설계, 실험 설계, 의사 결정, 데이터 문화 등 데이터를 다루다가 생기는 다양한 일을 모두 담았어요
- 제 강의 중에 처음 어떤 강의를 들을까? 생각하면 이 강의가 제일 좋다고 생각합니다. 회사에서 어떤 방식으로 일을 하는지 알아보면서 데이터 분석을 어떻게 해야할지에 대해 알 수 있어요
- 제가 익힌 여러 암묵지를 모두 담은 강의라, 다시 이런 종류의 강의를 만들라고 하면 어떤 내용을 더 넣어야 할지 고민될 것 같네요. 물론 더 추가할 부분이 있긴 합니다
- PM 직무에 계신 분들도 보기 좋고, 디자이너, 데이터 분석가 모두 보면 좋을 내용으로 구성되어 있어요
- 초보자를 위한 BigQuery(SQL)
- 데이터를 다루기 위해 SQL을 알아야 합니다.
- 회사에서 SQL을 처음 배우는 분들이 어디서 어려움을 겪는지, 어떤 것을 알면 좋을지 고민하며 만들었어요
- 강의에서 특히 힘을 준 부분은 “데이터 검증”, “쿼리를 작성하는 흐름”. 이 부분은 암묵지에 해당될 수 있는 내용인데, 회사에서 참 중요하다 생각했어요
- 지표를 잘못 뽑고, 지표를 보는 분에게 잘못 뽑았다고 말하는 경우 종종 있을 수 있는데, 데이터 검증을 어떻게 해야할지에 대해 모르거나 쿼리의 실수로 발생하곤 합니다. 간단하게 특정 user_id를 선정해서 미리 확인해보는 과정으로 해결할 수 있는데, 이런 내용에 대해 알지 못하는 경우가 있었어요
- 쿼리를 작성하는 흐름은 처음에 이런 큰 그림을 이해하면 더 잘 작성할 수 있다고 판단했어요
- 쿼리를 작성할 때 참고할 수 있는 데이터 템플릿도 공유드리고, 이걸 자동화할 수 있는 도구도 알려드렸어요. Espanso라는 도구인데, 무료고 오픈소스라 많은 분들이 아시면 좋을거에요
- 시간 데이터를 다룰 일이 많은데, 서버의 데이터는 UTC로 저장되어 있는 경우가 많아요. 이 때 타임존에 대한 내용을 모를 수 있는데, SQL에서 이 부분을 학습하면 좋겠다고 생각했어요
- BigQuery 활용편
- 이 강의는 입문편에서 다루진 않은 부분 중 유용한 함수인 윈도우 함수를 주로 다룹니다
- Firebase 데이터의 특징으로 배열 데이터를 다뤄야 하는데, 배열 데이터를 다루는 방법에 대해서도 학습합니다
- 단순히 문법만 배우는 것이 아니라 퍼널 분석, 리텐션 분석을 어떻게 접근하면 좋은지 공유합니다
- PM을 위한 데이터 리터러시 강의랑 연결되는 부분인데, 제품에 대해 생각하고, 그 부분에서 리텐션 개선 아이디어를 생각하도록 강의를 구성했어요. 이렇게 말을 해도 실제로 데이터를 보면 데이터만 보게 되는 경우가 종종 있어서, 강의에서 계속 제품에 대해 고민할 수 있도록 생각을 공유했어요
- Google Sheets로 자동화를 할 수 있는 부분이 꽤 있는데, 이 부분도 알아가시면 좋을 것 같다 싶어 이 부분도 추가했어요
데이터를 활용하고 싶은 분들이 어떻게 학습하면 좋을까
- 이 부분은 최근에 쓰레드에 길게 남겼는데, 블로그에도 공유해보아요. 존댓말을 쓰지 않고 자유롭게 남긴 내용입니다
- 하드 스킬에 대한 내용은 줄인 버전이고, 머신러닝이나 데이터 시각화 등에 대한 지식은 언제든 해도 괜찮다고 생각
- 보통 데이터를 활용한다라고 하면 파이썬, SQL, 통계 같은 기술적인 것부터 생각한다. 그렇기 때문에 이걸 해야 데이터를 활용할 수 있다고 생각
- 데이터를 활용한다는 것은 데이터 기반 의사결정을 한다는 것이고, 이것은 문제를 해결하는 과정에서 지표를 정의해서 지표에 따른 의사 결정을 하는 것
- 제일 중요한 것은 문제를 정의하고, 문제를 인식하는 것. 대부분 이 부분을 그냥 넘어가지만, 문제 정의를 잘 진행하는 것이 제일 중요하다. 정의가 잘 된다면 지표는 자연스럽게 나오고, 지표는 사용할 수 있는 도구(엑셀, 파이썬, SQL 등 사용 가능한 것)로 추출하면 된다
- 논리적 사고는 “로지컬 씽킹” 책을 추천. 맥킨지식 논리적 사고로 유명하고, MECE / So What? Why So를 매번 생각한다
- 사실 이 역량은 모든 직무에게 필요하다
- 논리적 사고에 대해 어느정도 파악을 했다면, 그 후엔 무엇을 해야할까?
- 그 후엔 데이터를 어떤 관점으로 바라볼지에 대해 감을 잡으면 좋다. 신입 시절에 데이터를 어떻게 바라볼지에 대한 관점이 없이 일단 데이터를 뽑고 해석을 하려고 했는데, 데이터를 바라보는 관점이 없어서 어려웠다.
- 데이터를 바라보는 과정에선 1) 그래프 기반, 2) 호기심 기반, 3) 상급자 기반 등이 있는데 3가지 방법보단 “목적 기반”으로 보는 것이 핵심. 어떤 목적을 가지고 어떤 지표를 볼지, 그리고 어떤 것을 해야할까?에 대해 생각해보는 것이 필요하다. 목적이 없으면 기준이나 판단이 어렵다.
- 이런 관점에 대해 잘 나온 책은 “빅데이터 시대, 성과를 이끌어 내는 데이터 문해력” 이 책이 나왔을 때 처음 읽고 완전 감동받은 책. 논리적 사고랑 연결되는 부분이 있다
- (3) 논리적 사고, 데이터 목적에 대한 학습. 그 후엔?
- 앞선 것들을 잘 진행하기 위해, 회사의 비즈니스 모델을 잘 이해하면 좋다. 비즈니스 모델이란 것은 회사에서 매출이 언제 발생하고, 어떤 흐름으로 돈이 돌아다니는지를 의미한다. 데이터 분석을 한다는 것은 목적이 있을텐데, 회사의 서비스를 성장하기 위해 무엇을 해야할까?, 매출을 증가시키기 위해 무엇을 해야할까?, 비용을 줄이기 위해 무엇을 해야할까? 등을 생각한다. 이 때 비즈니스 모델을 이해하면 더 수월하게 생각할 수 있었다.
- 관련해서는 “한 장으로 끝내는 비즈니스 모델 100” 책을 추천. 도식화로 정리가 되어있어서 도움이 된다. 그러면서 사용하고 있는 앱이나 서비스의 비즈니스 모델을 분석해보는 것도 추천
- 강의를 들은 분들 중 면접을 잘 보고 싶다고 하는 분들에겐 “지원하는 회사의 비즈니스 모델”을 스스로 분석해보고, 도식화해서 그 내용 기반으로 무엇을 할지 생각해보라고 권한다. 이런 것을 하는 사람이 적다.
- (4) 논리적 사고, 데이터 목적, 비즈니스 모델. 그 후엔?
- 그 후에 간단한 통계학 공부를 하면 좋은데, 통계학을 어려워하는 사람이 있기에 처음엔 쉽게 접근하는 것을 추천한다. “데이터 분석가의 숫자유감”이란 책이 있는데, 만화로 구성되어 있다. 통계를 활용하는 핵심적인 부분이 나와있어서 이 책을 보면 대략적으로 어떻게 활용해야 할지에 대해 감이 온다.
- 그 후에 추천하는 책은 “숫자에 약한 사람들을 위한 통계학 수업”. 이 책도 핵심적인 통계학 개념을 쭉 훑고, 실용적인 관점에서 사례가 많이 나온다. 수학을 극도로 배제해서 눈높이를 낮추어서 많은 분들이 읽을 수 있다.
- 그 후에 본격적인 통계를 공부하고 싶다면 “An Introduction to Statistical Learning”를 추천. 줄여서 ISLR라고도 하는데, 많은 분들이 이 책을 기본서 같이 생각한다. 한국어 번역이 있다고 들었지만, 원서를 추천. 구글에 책 제목을 검색하면 원서가 나온다(파이썬 버전도 있음)
- (5) 통계학 그 후엔 무엇을 해야할까, 이 시기엔 상황에 따라 다를듯. 우선 회사에 다니고 계신 분들 대상으로 먼저 이야기 회사에 다니고 있다면, 어떤 문제를 해결해야 할 것. 진행하고 있는 업무가 문제와 관련되어 있을 것이다. 이 문제를 해결하기 위해 어떤 것을 해야할까? 어떤 지표를 봐야할까? 생각하기
- 이 과정에서 지표 정의에 대해서 알면 좋은데, 지표가 어렵다면 “문제가 해결되면 어떤 모습이 되는가? 그 모습을 숫자로 표시한다면?” 질문을 통해 정의. 요즘은 LLM이 잘 발전되어 있어서 어떤 문제를 해결하고 싶은지를 클로드 등에 물어보면 잘 추천해준다. 그러면 그 지표들을 모두 모아서 어떤 것을 사용할지 결정한다.
- 그리고 해당 지표를 개발자나 데이터 분석가분들에게 부탁해서 받아보고, 그것 기반으로 “Action Item”을 생각해본다. 뭘 해야 그 지표를 올릴 수 있을까? 그리고 그것을 실행하고 기능 개발 -> 의사 결정. 바로 문제를 푸는 방법
- (6) 회사에 다니지 않는 취준생이라면
- 이런 경우 참 어렵다. 취준생 입장에서 데이터를 어떻게 구할까?라는 고민에 빠진다. 이를 해결하기 위해 캐글이란 플랫폼이 나왔지만, 캐글은 문제 정의가 된 후에 데이터를 제공한 후 모델링에 집중한다.
- 데이터를 활용한다는 것은 문제에서 데이터를 해석하고, 의사결정하는 것이라고 볼 수 있다. 그리고 데이터가 쌓인 후 목적에 맞으면 예측 모델링을 진행한다. 취준생이라면 내가 데이터 분석을 집중하고 싶은지, 모델링을 하고 싶은지 고민해야 한다. 많은 교육 과정에서 모델링 위주로 교육해서 혼란스러운 경우가 있는데, 나눠서 생각해보는 것을 추천.
- 어떤 직무를 하던, 이 쯔음에 SQL/파이썬 등을 학습한다. 요즘은 대부분의 책이 잘 나와서 서점에서 고르는 것도 추천
데이터 분석가 로드맵에 더 추가되면 좋은 것은?
- 어떤 내용이 더 필요할까 생각해봤는데, 다음 내용을 추가하면 좋을 것 같다
- 데이터 전처리에 대한 학습 : 데이터를 어떻게 처리할지에 대해 방법론이 다양한데 각 방법론의 장단점과 어떻게 활용하면 좋을지에 대해 학습
- 설득하기, 협상하기 : 대화를 할 일이 참 많은 직무다. 설득하기, 협상하기는 어떤 직무여도 있으면 좋겠지만 데이터 분석가분들이 더 들어보면 좋겠다. 사내 컨설턴트가 된다는 생각도 같이 하면서
- 그 후엔 자신이 자신 있는 도메인 영역을 정해보면 좋겠다. 산업이여도 괜찮고, 비즈니스나 프러덕트 등으로 생각해도 좋다. 하나의 도메인에서 해결할 수 있는 문제를 거시적으로도 파악하고, 미시적으로도 파악해보면 좋겠다
- 경영진의 사고 과정 : 경영진에 계신 분들이 어떤 생각을 주로 하고, 어떻게 생각하는지 알아두면 좋다. 이런 생각을 할 수 있게 된다면, 내가 지금 어떤 일을 해야할지를 더 잘 생각할 수 있다. 상황에 따라 유연한 접근이 필요한데, 대표님이 지금 무슨 생각을 할까?라는 생각을 하면서 업무를 하곤 했다
- 물론 위에 말한 내용은 일반적인 데이터 분석가 로드맵에서 나오는 내용도 있지만, 아닌 내용도 있다. 회사에서 일을 잘 진행하기 위해 필요했던 내용인데 나만의 경험일 수도 있을 것 같고, 아닐수도 있다
- 데이터 사이언티스트가 되고 싶다면, 데이터 분석도 해보고 전략, 데이터 엔지니어링 등을 모두 경험해보는 것을 추천한다. 다만 요즘 데이터 사이언티스트도 회사마다 다르다. 주로 추천 알고리즘을 만들고 데이터 분석을 할 때 데이터 사이언티스트라고 불리는 것 같다
앞으로 할 것들
- 데이터 분석 관련 강의는 잠시 쉬고, 원래 만들고 싶었던 내용을 만들려고 합니다
- 어떻게 해야 데이터 엔지니어링을 쉽게 할 수 있을지에 대한 내용. 그리고 데이터 분석가가 이정도는 알면 좋은 개발 지식. 이렇게 선언해두면, 언젠가 하려고 시도할거라 생각해서 선언해두어요
- 일단 개발자 블로그 글쓰기 강의는 빠르게 만들 수 있어서, 이것부터 하고 전체적인 강의에 대해 설계할 예정
- 강의 만드는 것도 시행착오가 있어서, 여러 방법으로 시도하고 있어요. 이제는 어떻게 해야 속도를 낼 수 있을지 감을 잡아서 계속 시도해볼 예정이에요.
- 그 후엔 다시 회사로 돌아가지 않을까 싶어요. 다만 그 사이에 최선을 다해 강의를 만들려고 해요. 회사에 들어가서 온보딩 자료로 활용할 수 있는 수준으로 강의를 만들려고 합니다. 정해진 것은 아무것도 없지만, 일단 이정도로 생각하고 있어요
- 최근 데이터 리터러시에 대한 니즈를 많이 느끼고 있어요. 강의 판매도 늘어나고 있고, 기업 강의도 요청받고 있어요. 많은 분들이 데이터를 더 잘 활용하고, 쉽게 접근할 수 있도록 계속 하나씩 만들어 볼게요
- 회사에서 데이터를 어떻게 활용해야 하는지 가이드를 주고, 더 잘 진행할 수 있도록 돕는 직무도 점점 필요해지는 것 같아요. 단순히 데이터 프러덕트를 만들고 끝이 아니고 여러 조직에 있는 사람들의 상황을 파악하고 해결할 수 있는 방법 도출
- 저는 데이터 분석가분들이 점점 데이터 엔지니어링을 할 수 있어야 하고, 데이터 엔지니어도 데이터나 비즈니스에 대한 큰 그림을 이해하면 좋다고 생각해요. 회사 상황에 따라 다를 수도 있지만, 데이터 관련 큰 그림을 잘 이해할 수 있는 사람들이 더 필요한 시기라고 생각해요
- 대학생분들을 어떻게 도울 수 있을까 고민하고 있어요. 대학원을 가지 않은 제가 교수를 하긴 어려워서, 지금 진행하고 있는 일들을 집중하려고 해요. 부스트캠프 AI Tech와 유튜브 등. 학생분들이 도움을 구하면 가능하면 최대한 시도해보려고 하고 있어요
- 데이터 직무가 아닌 분들이 어떻게 데이터를 잘 활용할 수 있을까? 이 부분에 대해 활용 지침 위주로 내용을 정리해볼까 생각하고 있어요
마무리
- 인프런에 올린 로드맵에 관심이 있다면 한번 봐주셔요. 유튜브 영상도 추가해두었어요
- 2주 동안 로드맵 화면에서 쿠폰을 발급 받을 수 있어요. 필요하시다면 활용하셔도 좋을 것 같아요.
- 앞으로 제가 어떤 일을 할지, 어떤 커리어를 밟을지 잘 모르지만 지금 상황에 진심을 다해 하나씩 해볼 예정이에요. 지금의 시간이 참 소중하기에.
- 제게 궁금한 내용이 있다면 무엇이든 말씀해주셔요. 이 글에 대한 피드백도 좋아요. 제가 답이라는 것은 아니고, 제 생각을 공유했으니 여러 이야기를 나누며 합쳐보고 싶네요.
- 글 작성하는데 걸린 시간 : 약 40분
카일스쿨 유튜브 채널을 만들었습니다. 데이터 사이언스, 성장, 리더십, BigQuery 등을 이야기할 예정이니, 관심 있으시면 구독 부탁드립니다 :)
PM을 위한 데이터 리터러시 강의를 만들었습니다. 문제 정의, 지표, 실험 설계, 문화 만들기, 로그 설계, 회고 등을 담은 강의입니다
이 글이 도움이 되셨거나 다양한 의견이 있다면 댓글 부탁드립니다 :)