본문 바로가기

전체 글72

빡공단 38기 [코딩 입문] 최종 학습후기 작성 안녕하세요, 38기 빡공단 자기 계발 챌린지를 수강한 후기를 공유하려고 합니다. 코딩 입문 클래스 과정을 듣고 이 과정에서 어떤 부분이 좋았고, 어떤 성장을 이루었으며, 왜 다른 사람들에게 이 클래스를 추천하고 싶은지에 대해 이야기하겠습니다. Q1. 베어유 클래스 수강의 어떤 부분이 좋았는지? 베어유 클래스는 컴퓨터 프로그래밍의 기초부터 실무까지 체계적인 커리큘럼을 제공합니다. 이로 인해 입문자도 쉽게 따라갈 수 있고, 탄탄한 기초를 다질 수 있습니다. 또한 이론과 실습을 병행하여 진행합니다. 이를 통해 학습한 내용을 바로 적용해 볼 수 있고, 실무 능력을 향상할 수 있습니다.베어유 클래스의 교수님과 튜터는 학생들의 질문에 친절하게 답변해 줍니다. 이를 통해 학생들이 학습에 어려움을 겪지 않고, 자신감을.. 2023. 9. 24.
빅분기 CBT 9/20 빅데이터 저장시스템 선정을 위한 기능성 비교분석 요소 - 트랜잭션 일관성 - 확장성 - 데이터 모델 - 질의지원 - 접근성 반정형 데이터 - XML file - JSON file - HTML file 데이터 저장 방식 - 파일 시스템 - 분산 처리 데이터베이스 - 관계형 데이터베이스 정형 데이터 품질 진단 기법 - 메타 데이터 수집 및 분석 - 컬럼 - 누락값 - 값의 허용 범위 - 문자열 패턴 - 날짜 - 유일값 - 구조 분석 - 도메인 분석 방법론 구성요건 - 상세한 절차 - 도구와 기법 - 템플릿과 산출물 NoSQL 데이터베이스 저장방식 - Key-value 데이터베이스 - column-oriented - document ROI를 고려한 평가기준으로 난이도의 평가요소 - 데이터 획득 비용 - 데이터.. 2023. 9. 20.
빅분기 2과목 ***데이터 정제 데이터 전처리 주요작업** 1) 데이터 정제 : 결측치/이상치 파악 후 제거or대체 2) 데이터 통합 : 데이터 병합하여 데이터 셋 생성(중복 데이터 해결) 3) 데이터 축소 : 변수선택, 요약변수 생성하여 데이터 차원 줄임 4) 데이터 변환 : 변수값에 대한 표준화 정규화 및 알고리즘에 입력할 수 있는 형태로 변환 결측값 처리 완전 무작위 결측(MCAR) - 모두(M) 니까 MCAR 무작위 결측(MAR) 비무작위 결측(NMAR) - 비(No) 니까 NMAR *****분석 변수 처리 *****데이터 탐색 기초 두 변수 A, B의 공분산인 Cov(A,B)에 대한 설명 Cov(A,B) != 이면, 두 변수 A,B간에는 상관성이 존재한다. 두 변수 A,B가 독립이면 항상 Cov(A,B) = .. 2023. 9. 15.
빅분기 CBT 복습 1) 지식의 피라미드 순서 데정지지 데이터 - 정보 - 지식 - 지혜 2) 정형 데이터 품질 진단 기법 -메타데이터 수집 및 분석 -컬럼 속성 분석 -누락값 -값허용범위 -문자열패턴 -날짜 유형 -기타 특수 도메인 -유일값 -구조분석 빅데이터가 만들어낸 변화 - 사전 -> 사후 - 인과 -> 상관 - 표본 -> 전수 - 질 -> 양 원천 데이터에 대한 정보습득을 위한 필요정보 - 수집가능성 -보안 -정확성 -난이도 -비용항목 분석 ROI를 고려한 평가기준의 난이도 평가요소 - 획득비용 - 가공비용 - 분석수준 데이터에 포함된 개인정보를 삭제하거나 알아볼수없는형태로 변환하는 방법 = 익명화 데이터 수집을 위한 시스템 구축 절차 1) 수집데이터 유형파악 2) 수집기술 결정 3) 아키텍처 수립 4) 하드웨어 .. 2023. 9. 15.