과목 5와 6은 데이터아키텍처 전문가 (DAP)에만 해당하는 파트입니다. 과목 Ⅴ. 데이터베이스 설계와 이용 저장공간 설계 ★ 힙테이블 행의 저장 위치는 행이 입력될 때 결정 (입력 순서와 다름) 입력 시 정렬을 수행하지 않으므로 입력에 대한 부하가 적다 인덱스와 데이터 저장 공간이 분리 대량의 트랜잭션이 발생하는 로그성 테이블에 적합 Oracle, PostgreSQL ★ 클러스터형 인덱스 테이블 주 키 값이나 인덱스 키 값의 순서로 정렬 되어 저장 입력 시 정렬에 대한 부하 발생 인덱스 저장 공간에 데이터 함께 저장 prefetch가 가능하며, PK를 조건으로 사용되는 경우 더 빠르게 데이터에 접근 가능하다 크기가 작고 자주 엑세스되는 코드성 테이블, 칼럼 수가 작고 행의 수가 많은 테이블 (주로 통계..
4과목은 DAP 40문항 / DAsP 20문항 으로 가장 많이 출제되는 영역으로 가장 중요한 파트입니다. 과목 Ⅳ. 데이터 모델링 추상화 유형화 (Classification) 집단화 (Aggregation) 일반화 (Generalization) 논리 데이터 모델링 주제영역 도출 상향식 vs 하향식 ★ ERD 표기법 ER-Win의 IDEF1X 또는 정보공학 표기법 (IE 표기법) 독립 엔터티 : 각진 사각형 종속 엔터티 : 모서리가 둥근 사각형 식별관계 : 실선 선택관계 : 동그라미 / 필수관계 : 동그라미 없이 동그라미의 반대쪽 엔터티가 선택 / 동그라미가 없으면 그 반대쪽 엔터티가 필수 엔터티 CASE*Method 표기법 엔터티 : 모서리가 둥근 사각형 # 주 키 속성 * 필수 속성 º 일반(선택) 속..
이 문서에서는 데이터 아키텍처 전문가(DAP), 데이터 아키텍처 준전문가(DAsP)에서 공통으로 10문제 씩 출제되는 1~3 과목에 해당하는 내용을 다루고 있습니다. 과목 Ⅰ. 전사아키텍처 이해 과목 Ⅱ. 데이터 요건 분석 과목 Ⅲ. 데이터 표준화 과목 Ⅰ. 전사아키텍처 이해 아키텍처 구축하고자 하는 목적에 따라 복잡한 대상을 단순하게 표현하고, 구성요소의 변화에 대한 요구를 수용할 수 있게 한 청사진(Blueprint) 아키텍처 구성요소 규칙 : 전략, 원칙·지침, 표준 모델 : 참조모델, 비즈니스 아키텍처, 데이터 아키텍처, 애플리케이션 아키텍처, 기술 아키텍처 계획 : 이행계획, 구축 계획 전사(Enterprise) 공동의 목표를 추구하기 위해 고객과 상품 또는 서비스가 존재하고, 이를 지원하기 위..
ADP (데이터분석 전문가) 필기 ADP 필기 5과목에 해당하는 영역입니다. ADsP(데이터분석 준전문가)에서는 출제영역에 해당하지 않는 부분입니다. 과목 Ⅴ. 데이터 시각화 시각화 인사이트 탐색 -> 패턴분석 등 분석 -> 그래프분석 등 활용 -> 인포그래픽 (스토리텔링 특화) D(data) -> 시각화 I(Information) -> 디자인 K(Knowledge) -> 매핑 W(Wisdome) -> 정의되지 않은 것 탐색 데이터 명세화 측정값, 차원 (값이 측정된 기준 수) 데이터의 성격이 아닌 분석형태에 따라 정해짐 동일한 항목도 차원이 되기도, 측정값이 되기도함 빅데이터 시각화의 목적 : 데이터 분석, 의사소통 1. 데이터 시각화 정보형 메세지 통계적 그래픽, 주제 지도학 마인드맵, 뉴스표현, 데..
ADP (데이터분석 전문가) 필기 ADP 2과목에 해당하는 영역입니다. ADsP(데이터분석 준전문가)에서는 출제영역에 해당하지 않는 부분입니다. 과목 Ⅱ. 데이터 처리기술 이해 ★ ETL 추출(Extract), 변환(Transform), 적재(Load) DW, ODS, DM 등의 적재 작업의 핵심구성요소 통합, 이동, MDM(마스터 데이터 관리)에 활용 0) Interface : 인터페이스 메커니즘 구현 1) Staging ETL : 데이터 획득, 스테이징 테이블에 저장 2) Profiling ETL : (스테이징 테이블에서) 특성 식별, 품질 측정 3) Cleansing ETL : 프로파일링된 데이터 보정 4) Integration ETL : 충돌해소, 클렌징된 데이터 통합 5) Denormalizat..
ADP & ADsP (데이터분석 전문가&준전문가) 필기 데이터 분석 파트는 ADP의 4과목 , ADsP의 3과목에 해당되는 내용입니다. 다른 파트에 비해 범위도 넓고, 난이도도 높은 편이라 당락을 결정하는 가장 핵심 파트입니다. ADsP 과목 Ⅲ. 데이터 분석 ADP 과목 Ⅳ. 데이터 분석 R 기초 데이터 분석을 위한 R 기초 정리 표본 추출 방법 확률적 추출 1) 단순 무작위추출 (simple random sampling) 2) 계통추출(systematic sampling) 3) 층화추출(stratified sampling) 4) 군집추출(cluster sampling) 자료의 종류 명목척도 ex) 성별 서열척도 ex) 평점 등간척도 ex) 물가지수 -> 절대0점이 존재하지 않음 비율척도 ex) 몸무게..
ADP & ADsP (데이터분석 전문가&준전문가) 필기 데이터 분석기획 파트는 ADP의 3과목 , ADsP의 2과목에 해당되는 내용입니다. 크게 어렵지 않은 영역이기에, 핵심적인 내용을 잘 숙지하는 것이 중요하다고 생각합니다. ADsP 과목 Ⅱ. 데이터 분석기획 ADP 과목 Ⅲ. 데이터 분석기획 ★ 분석 주제 유형 ( O/X는 알고 있음/없음 을 의미 ) 최적화(Optimiztion) : 분석대상O, 분석방법O 통찰(Insight) : 분석대상X, 분석방법O 솔루션(Solution) : 분석대상O, 분석방법X 발견(Discovery) : 분석대상X, 분석방법X 의사결정 방해요소 고정관념, 편향된 생각, 프레이밍 효과 ★ 분석방법론 KDD CRISP-DM 분석 대상이 되는 비즈니스 이해 업무 이해 데이터셋..
ADP & ADsP (데이터분석 전문가&준전문가) 필기 1과목은 ADP와 ADsP의 공통 출제 영역입니다. 핵심 내용만 잘 숙지하고 있다면 점수를 얻기 좋은 파트입니다. 과목 Ⅰ. 데이터의 이해 데이터의 정의 데이터는 ‘객관적 사실’ 개별 데이터 자체로는 의미 X, 상호 관계 속에서 가치를 가짐 추론·전망 등의 근거로 기능 (당위적 특성) 정성적 데이터 vs 정량적 데이터 정성적 데이터 : 언어, 문자 등 ex) 특성에 대한 설명 정량적 데이터 : 수치, 도형, 기호 ex) 몸무게, 주가 지식경영 : 지식을 창출, 저장, 전이, 적용하기 위해 조직에서 개발한 일련의 비즈니스 프로세스 암묵지 : 학습과 체험을 통해 습득 형식지 : 책, 메뉴얼 등 SECI 모델 공통화 -> 표출화 -> 연결화 -> 내면화 ..