분류 전체보기72 빅데이터 분석기사 필기 CBT (1) 3과목 군집추출에 대한 설명 - 추출 모집단에 대해 사전지식이 많지 않은 경우 시행하는 것은 단순 무작위 추출방법의 특징 - 모집단을 차이가 없는 여러 개 군집으로 나누어 군집 단위의 일부 또는 전체에 대한 분석을 시행 - 모집단에 대한 추출기반을 마련하기가 어려운 경우 사용하면 편리 - 표본크기가 같은 경우 단순 임의 추출에 비해 표본오차가 증대할 가능성이 있다. 분석모형 설계에서 특정 영역을 지정, 의사결정 지점으로 진행하는 과정에서 분석기회를 발굴하는 방식을 의미하는 용어 = 상향식(Bottom-up) 접근 시계열 자료에 대한 정상성에 대한 설명 - 정상성을 가진다는 의미는 시계열 데이터가 평균과 분산이 일정한 경우 - 시계열 데이터가 정상성을 가지면 분석이 용이한 형태로 볼 수 있음 - 평균이 일정하지 .. 2023. 9. 4. 빅데이터 분석기사 필기 CBT (1) 4과목 관측값들이 어떤 이론적 분포를 따르고 있는지를 검정하는 방법으로 한 개의 요인을 대상으로 하는 것 = 적합도 검정 분석모형 전개 단계에서 이루어지는 활동 - 완성된 모델을 실제 업무 현장에 적용 - 개발된 분석 모델을 실제 운영데이터에서 동작시키고 성능을 평가 - 업무 적용 결과에 따라 분석 모델을 수정 데이터 시각화 방법에 대한 설명 - 단계 구분도는 면적이 넓은 지역의 값이 전체를 지배하는 것처럼 보이는 시간적 왜곡이 발생 - 공간시각화는 실제 지도나 지도 모양의 다이어그램을 배경으로 데이터의 위치를 시각화 - 스타차트도 여러 개의 대상을 하나의 차트에 동시에 표현할 수 있다. - 히트맵은 여러 변수와 다수의 대상에 대해 하나의 표 형태로 표현할 수 있다. 교차검증의 설명 - 테스트 검증데이터가 하나.. 2023. 9. 4. 빅데이터 분석기사 필기 3과목 요약 (3) 범주형 자료 분석 독립변수 | 종속변수 | 분석방법 범주 연속 t-검정, 분산분석 범주 범주 분할표 분석, 카이제곱 검정, 피셔의 정확도 검정 연속 범주 로지스틱 회귀분석 1) t- 검정 : 두 집단 간의 평균을 비교하는 모수적 통계방법 - 가설검정, 정규성, 등분산성, 독립성 가정 단일표본 - H0:모집단 평균 = μ 독립표본 - H0:두 집단의 평균이 같다 대응표본 - H0:사전평균 = 사후평균 2) 분산분석 : 둘 이상 집단의 평균을 비교하는 모수적 통계 방법 / F분포로 가설 검정 - 정규성, 등분산성, 독립성 가정 일원분산분석 : 범주형 변수가 한 개인 경우 -> H0:모든 집단의 평균은 같다 이원분산분석 : 범주형 변수가 두 개 이상인 경우 -> H0:두 변수는 상호작용효과가 없다 3) 카이제.. 2023. 9. 4. 빅데이터 분석기사 필기 3과목(2) 요약 분석기법 회귀분석 - 독립변수들이 종속변수에 미치는 영향을 추정 1) 회귀분석의 가정 선형성 : 독립변수, 종속변수는 선형적 독립성 : 단순회귀(잔차, 독립변수가 독립) , 다중회귀(독립변수 간 독립) 등분산성 : 잔차 고르게 분포 정규성 : 잔차항이 정규분포, 잔차항의 평균 0, 분산일정, Q-Q plot에서 잔차 우상향 2) 회귀분석 종류 (1) 단순선형 회귀분석 - 독립변수와 종속변수가 한 개씩 있고, 오차항이 있는 선형관계 (직선) 회귀계수 추정 : 최소제곱법 사용 단순선형 회귀분석 검정 : 회귀계수(β) = 0 → 인과관계 없음 결정계수(R²)는 회귀모형의 설명력 지표 → 회귀선의 정확도 평가 (2) 다중선형 회귀분석 - 독립변수 K인 경우, 최소 제곱법 사용 - 독립변수의 가중치 역할하는 회귀.. 2023. 9. 4. 이전 1 ··· 11 12 13 14 15 16 17 18 다음