본문 바로가기

전체 글

3부_온라인 종합 대조 실험 보완 및 대체 기법들 Intro. 모든건 '모집단'추정이다!표본 수··· 무작위 실험 ··· 교란 요인 통제 ··· 대표성 ··· 결과 일반화 ··· ----------------------------------------------------------------------------CH10. 온라인 종합 대조 실험 보완 기법들 - AB 테스트 결과를 바탕으로 의사결정을 하기 위해서는 실험 결과의 일반화가 매우 중요하다. - AB 테스트를 위한 여러 보완 기법들이 존재. 보완 기법은 AB 테스트 아이디어, 지표 설정 등에 활용된다. 그래서 이번 장은, 다음과 같은 보완 기법들을 살펴볼 것이다. 1) 로그 기반 분석 로그 기반 분석으로 할 수 있는 것 - 직관 확립 ex) 세션당 사용자 또는 클릭률 분포는 어떻게 되는가? e.. 더보기
240329 아무생각 archive 반려견, 반려묘도 좋지만 반려오… 집오리 너무 귀엽다 애기때도 무척 귀엽다 오리를 보면 시공간이 멈추는 느낌이다 그렇다 오리고기는 역시나 앞으로도 먹지 않는다 내겐 애완오다!!!!! 더보기
240328 아무 생각 archive 폐쇄성, 망설임, 지나친 완벽주의는 수동적인 태도에서 기인한다. Can’t manage it / What if.. 개방성, 도전, 실행은 능동적인 태도에서 기인한다. Can manage it / If not, never mind Cooooool. 아님말고 마인드! 더보기
[행동 데이터 분석] AB TEST project_1 안녕하세요, 오늘은 이전에 배운 AB TEST 를 바탕으로 프로젝트를 진행해보겠습니다. 쿠키 캣은 Tactile Entertainment에서 개발한모바일 퍼즐 게임입니다. 플레이어가 게임의 레벨을 진행하면서, 일정 시간을 기다리거나 인앱 구매를 해야만 진행할 수 있는 게이트(구매 지점) 를 만나게 됩니다. 이러한 게이트는 인앱 구매를 유도할 뿐만 아니라, 플레이어에게 게임으로부터 강제적인 휴식을 제공하여 게임의 즐거움이 증가하고 지속되기를 바라는 중요한 목적을 가지고 있습니다. 그러나 게이트는 어디에 배치해야 할까요? 처음에는 첫 번째 게이트가 레벨 30에 배치되었습니다. 이 프로젝트에서는 첫 번째 게이트를 쿠키 캣 게임의 레벨 30에서 -> 레벨 40으로 옮긴 AB-테스트를 분석할 것입니다. 특히, 플.. 더보기
[실험 용어 정리] 실험설계(Experimental Design) 정의 : 과학적 실험 계획과 실행을 통해 독립변수와 종속변수 간 인과관계를 명확히 규명하는 방법. 특히 실험 전 명확한 목표 설정과, 목표 달성 및 통계적 유의성 확보를 위한 실험 구조와 조건 설정을 설계해야 한다. 변화 이론 (ToC : theory of change)을 바탕으로 계획하며, 다음과 같은 순서로 정의한다. 1) 비즈니스 목표, 2) 목표지표, 3)개입, 4) 행동 논리 비즈니스 목표, 목표지표, 개입, 행동논리 정의 -가설 수립 - 실험군과 대조군 설정- 실험전 검정력 분석 - 데이터수집 방법 결정 및 수집- 실험 실행 - 데이터 분석 및 해석 - 결과 보고 통계적 유의성 (Satistical significance) 정의 : 모집단 추정을 .. 더보기
[행동 데이터 분석] PART 04 _ 실험 설계와 분석 python code (ch 8. 통계 방식의 검정력 분석 후 실험(A/B test)) 안녕하세요:) 오늘은 저번에 정리한 내용을 바탕으로 검정력 분석을 바탕으로 실험(ab test)을 하고, 그 결과를 해석해보도록 하겠습니다. 실험 계획의 경우, 변화 이론 (ToC : theory of change)을 바탕으로 만들었죠, 즉, 실험의 [개입] - [행동 논리] - [목표 지표] - [비즈니스 목표] 를 먼저 설정한 후, 실험을 진행합니다. 실험의 경우, [실험 전] 검정력 분석 및 의사결정 규칙 만들기 - [실제 실험] (a/b test 등) - [그 결과 해석] 순서로 이뤄지는데요, - 실험 전에 검정력 분석을 하는 이유는 무엇일까요? : '해당 실험이 얼마나 신뢰성 있게 효과를 검출하는지 평가'하기 위함입니다. 실제 실험 전에 검정력, 유의수준, 효과 크기 등의 값을 바탕으로 최적의 .. 더보기
1. 시계열 데이터 이해 안녕하세요, 이번 장부턴 본격적으로 시계열 데이터에 대해 알아보도록 하겠습니다. 시계열 분석 방법론 이전에 시계열 데이터가 어떤 구성요소를 지니는지 그 기본부터 하나씩 알아보고자 합니다:) 1) 시계열 데이터 개념시간의 흐름에 따라 순서대로 관측되어 시간의 영향을 받는 데이터를 의미합니다. - Daily(일), Monthly(달), Quarterly(분기), Yearly(년) 일별로, 달별로, 분기별로 등 다양한 관점에서 시계열 데이터를 바라볼 수 있겠습니다. - 시계열 데이터 예시 : 시간에 따른 제품 판매량, 재고량, 실업자 수, 항공 승객 수 이처럼 시간에 따라 살펴볼 수 있는 데이터는 다양합니다 위 그림처럼 시간에 따른 항공 승객 수를 보았을 때, 전체적으로 우상향하는 추세 뿐만 아니라 주기적으로.. 더보기
0. 시계열 데이터 분석 방법론 트렌드 안녕하세요, 시계열 분석에 앞서 시계열 분석 방법론 트렌드에 대해 알아 보도록 하겠습니다:) 다음과 같이 크게 세가지로 분류해볼 수 있습니다. 1) 전통 통계 기반 - 이동평균법(moving average) - 지수 평활법 (exponential smoothing) - ARIMA 모델 (autoregressive integrated moving average model) - SARIMA 모델 (seasonal arima model) - binary variable model (해당 시점만 1, 나머진 0으로 변환) - trigonometric model (sine 과 cosine 함수의 조합으로 표현) - ARIMAX 모델 (autoregressive integrated moving average exo.. 더보기