린분석 데이터 분석 책 추천 및 리뷰 ch1~ch2

deviz 2024. 11. 8. 21:37
반응형

 

 

 

린 분석 도서


<데이터 도서 선정기준> 

린분석 

 

1. 누구에게 필요한가? :
혁신적인 것을 개발하고 싶어하는 창업가, 데이터 과학자들, 웹 분석가, 디지털 마케터, 퍼포먼스 마케터 등등 


2. 얻을 수 있는 인사이트는 무엇인가? :
린 스타트업과 기본적 분석 개념 및 적용방법을 알 수 있고, 가장 중요한 지표를 찾는 방법을 알게됩니다. 이 책은 창업을 원하는 자들이 자신의 아이디어가 사업모델로 적합한지, 어떤 단계에 있는지 알 수 있습니다.  

 

 

<나에게 적합한 도서인지 판단하기(읽는 목적 설정) >

 

저는 데이터 분석가에 관심이 있으며, 프로젝트 진행하면서 지표들을 설정해 왔는데 실무에서 정말 좋은 지표인지 알 수 없었습니다. 
이 책을 통해서 어떤 지표와 분석이 의미있을지 알 수 있을 것 같습니다.

특히 product analysis와 관련된 개념들 (A/B test,코호트 분석, 지표종류 등등)에 대해 알아보고자 합니다. 

 


Ch1 우리는 모두 거짓말쟁이 

 

첫 챕터에서, 독자의 관심을 이끄는 소제목으로 

 

린 스타트업, 분석의  필요성에 대해 챕터를 시작합니다.  

 

데이터 분석가의 직무로 실무에 계시는 선배님께서 말씀해주셨습니다.

기획팀과 커뮤니케이션에서 가장 많이 하시는 말씀은 다음과 같다고..




"' 이게 왜 그렇게 되나요? 그렇다는 증거를 설명해주실수 있나요? " 


 

여기서도 바로 이런 이유로 데이터가 왜 필요한지, 스타트업이 궤도에서 탈선하는 순간 실패하게 되는데

그렇게 현실왜곡장에 갇히지 않도록 린 분석의 필요성을 말하고 있습니다. 

 

 



사레연구 : 에어비앤비 사진 서비스 

 

컨시어지 MVP :  

MVP란?  최소 존속 제품으로 시장에 약속한 가치를 제공하는 최소한의 제품 

그렇다면 컨시어지 MVP란? 제품이 실제로 존재하지 않은 MVP 

예시 ) 출퇴근용 카풀 서비스 구축할 때, 소프트웨어로 개발할 것이 아니라 운전자와 승객을 사람이 수동으로 연결시킬 수 있습니다. 

이것이 바로 컨시어지 접근법. 소프트웨어를 개발하지 않아도 단순히 '운전자와 승객을 연결해주는 소프트웨어를 개발할 수 있는지?'에 대한 질문으로 접근하는 것입니다.

 

에어비앤비는 MVP에 대한 첫테스트에서 전문적으로 촬영한 사진을 제공하는 숙소를 평균보다 두세배나 많이 여행자들이 에약하다는 결과가 나왔습니다. 




Ch2 다양한 지표 

제가 데이터 분석 프로젝트를 진행하면서 가장 많이 생각했던 질문입니다.


 


좋은 지표란 어떤 것인가?



 

<좋은 지표의 기준> 

 

1. 좋은 지표는 상대적이다. 

2. 좋은 지표는 이해하기 쉽다. 

3. 좋은 지표는 비율로 표현된다.
(비율은 행동에 반영하기 쉽다, 비율은 비교의 속성이 있다,
비율은 다소 대조적인 요소들이나 내재된 갈등이 잇는 요소들을 비교하기 좋다.) 

4. 좋은 지표는 행동방식을 바꾼다. 





<지표 종류> 


정성적 지표 vs 정량적 지표 

정성적 관찰이나 경험에 바탕을 두는 것 vs 통계 및 숫자로 구체적인 수치 제공 

허상 지표 vs 실질 지표 
행동을 바꿀 수 없음 vs 행동 방침을 선택할 때 도움을 줌으로써 행동을 바꾸게 함. 


탐색 지표 vs 보고 지표 
추론에 기반을 두고 아직 알려지지 않은 내용 vs 정상적이고 일상적인 경영상황을 빠짐없이 알 수 있게 함.

 

선행 지표 vs 후행 지표 

미래를 예측할 수 있게 도와주고 vs  후행은 과거를 설명해줌.

 

상관 지표 vs 인과 지표 

두 지표가 함께 움직임 vs 원인과 결과로 한 지표가 변하면 다른 지표도 변함. 

 

 

 

 

이 책은 chapter 마지막에 과제와 같은 질문을 스스로에게 던질 수 있도록 구성되어 있습니다. 



 

[과제] - 자신이 추적하는 지표 평가하기 

프로젝트 1 - 수원시 평생학습관 협약하여 학습자들 중 이탈할 확률을 예측함 
프로젝트 2 - 금융 고객 중 이탈할 확률을 예측하여 XAI로 주요 원인 파악 후 LTV 지표를 설정함 

프로젝트 1의 지표 - 이탈률 
프로젝트 2의 지표 - 이탈률, LTV 

 



Q1. 프로젝트에서 설정한 지표가 좋은 지표인가? 

좋은 지표 기준

1. 상대적인가? 
이탈률은 지난주 대비, 전년월 대비와 같이 상대적인 척도로 비교가 가능합니다. 
LTV(life time values)같은 경우 사용자 그룹별로 비교 가능합니다.  

2. 이해하기 쉬운가? 
이탈률과 LTV 모두 이해하기 쉬운 직관적 지표입니다. 

3. 비율로 표현되는가? 
이탈률은 비율로 표현되어 이탈 행동을 에측하고, 비교가능합니다.
LTV는 상대적인 값으로 예측되며 LTV의 계산법은 모두 상이하기 때문에 다른 요소들과 비교하기는 어려울 수 있습니다. 

4. 행동 방식을 바꾸는가? 
이탈률은 사실 앞서 언급한 지표 종류 중에서 후행지표로, 이 지표를 개선해도 이미 떠나간 유저들은 어떻게 핸들링 할 수 없습니다. 
LTV같은 경우 LTV가 높은 유저는 장기고객으로 분류되고, LTV가 낮은 유저는 LTV를 높이기 위한 행동을 취해야 합니다. 



Q2. 이 중 몇 개가 허상 지표인가? 

이탈률과 LTV 지표 모두 허상 지표는 아닙니다. 
그러나 앞에 어떤 수식어와 붙는지에 따라 허상지표가 될수도, 안될 수 도 있다고 생각합니다. 

특정 기간 내 이탈할 확률이 80%이상인 유저수 
90일 이내 예측한 LTV

라고 한다면 허상지표가 아니라고 생각합니다. 





Q3. 가치를 제공하지 않는 지표를 없앨 수 있겠는가? 어떻게 보완할 것인가? 

*책의 3번째 질문을 제가 수치화했던 지표에 적용해 질문을 던져보았습니다. 

Q3. 이탈률과 실제 이탈률의 오차범위를 줄이기 위한 노력으로는 실무에서 어떻게 이뤄지고 있을까? 
Q3. 다양한 이유로 이탈을 행할텐데, 이탈률이 낮은 사람임에도 불구하고 이탈하는 사람들을 예측하기 위한 설명변수를 어떻게 선택할 수 있을까? 


Q4. 더 의미있다고 생각되는 지표가 있는가? 

Q4. 실무에서 이탈률, LTV 지표 이외 가장 중요하고 많이 쓰이는 지표는 무엇이 또 있을까? 

 

 



질문 3번과 4번에 대한 고견이 있으시다면 자유로운 답변 부탁드립니다 ㅎㅎ 

 

 



 

반응형

'' 카테고리의 다른 글

린분석 데이터 분석 책추천 ch3~6  (2) 2024.11.09