전체 글72 빅분기 4과목 *****분석모델평가 회귀성능 : 실제값과 예측값의 차이를 계산하여 성능을 측정 1) MSE (Mean Squared Error) : 평균제곱오차 제곱-Squered 2) RMSE (Root MSE) : 평균제곱근오차 루트-Root 3) MAE (Mean Absolute Error) : 평균절대오차 절대값-Absolute 4) MAPE(Mean Absolute Percentage Error) : 평균절대백분율오차 100*-Percentage 5) R2 (결정계수) - 식: SSR/SST - 식 : 1- (SSE/SST) - 회귀모형의 설명력 - 0 ~ 1 사이의 값을 가지며 값이 클수록 성능이 좋음 *****분류성능 혼동행렬(Confusion matrix) = 이진분류( 0 or 1)에서 나올 수 있는 .. 2023. 9. 14. 네이버 부스트 캠프 7강-numpy 복습 numpy - Numerical Python - 파이썬의 고성능 과학 계산용 패키지 - Matrix와 Vector와 같은 Array 연산의 사실상의 표준 - 한글로 넘파이로 주로 통칭 - 일반 List에 비해 빠르고, 메모리 효율적 - 반복문 없이 데이터 배열에 대한 처리를 지원함 - 선형대수와 관련된 다양한 기능을 제공함 - C, C++ 포트란 등의 언어와 통합 가능 array creation ex) test_array = np.array( [ 1,4,5,8], float) print(test_array) type(test_array[3] 2023. 9. 14. 빅분기 2,3,4 과목 CBT 복습 표본추출오차에 관한 설명 - 표본추출 시 표본의 크기보다는 대표성을 가지는 표본을 추출하는 것이 중요 1) 과잉대표 = 반복,중복된 데이터만으로 규정되는 현상 2) 최소대표 = 대표성 표본이 아닌 다른 데이터가 표본이 되는 것 구간추정과 점추정 = 아무리 좋은 추정방법을 사용하나 추정값이 목표값을 정확하게 추정할수는 없음 구간주정 = 모수가 포함되는 확률변수구간을 어떤 신뢰성 아래 추정 점추정 = 모집단의 모수를 하나의 값으로 추정 변수변환의 로그변환에 대한 설명 = 로그변환은 수치값에 로그를 취한 값을 사용하는 것 - 데이터분포 형태가 우측으로 치우친경우 로그변환 사용 - 대표적 데이터는 주식가격 변동성 분석 - 로그를 취하면 정규분포에 가깝게 분포(로그정규분포) 표본추출 방법 계통추출 = 일정한 간격.. 2023. 9. 14. 빅데이터 분석기사 필기 3과목 풀이 데이터 분석의 분할 부문에서 일반화된 분석모형을 검증하기 위해 분할되는 데이터 명칭 = 테스트 데이터 순환신경망(Recurrent Neural Network) RNN - 유닛 사이의 연결이 Directed Cycle을 구성하는 신경망을 말함 - 임의의 입력을 처리하기 위해 신경망 내부의 메모리 활용 가능 - 필기체 인식과 같은 분야에 활용 및 높은 인식률 - '기억'을 갖고 있음 분석과정에 필요한 데이터, 절차, 분석기법 등의 세부사항들을 정의, 분석과정과 결과가 어떻게 활용되는지 명확히 알 수 있다, = 시나리오 작성을 통해 오차 역전파 - 실제 출력과 목표 출력값과의 오차 산출, 비례한 가중치를 출력층에서 은닉층으로 갱신 - 전달,연쉐법칙을 활용하여 가중치와 편향을 계산, 업데이트하는 기법 텍스트 마.. 2023. 9. 13. 이전 1 ··· 7 8 9 10 11 12 13 ··· 18 다음