데이터 이해 (Data Understanding) - ADsP 시험 대비 정리
데이터 분석 준전문가(ADsP) 시험의 첫 번째 과목인 "데이터 이해"는 데이터의 본질과 가치, 그리고 데이터베이스 활용과 관련된 핵심 지식을 다루고 있다. 이번 글에서는 이 과목의 주요 내용을 정리하고 기출 문제 풀이를 통해 학습에 도움을 주고자 한다.
1. 데이터와 정보
1. 데이터의 유형
데이터는 형태에 따라 크게 두 가지로 나뉜다:
1) 정성적 데이터:
- 언어, 문자 형태로 표현되며 저장, 검색, 분석에 높은 비용이 든다.
- 예: 설문 응답, 블로그 글 등.
2) 정량적 데이터:
- 숫자, 도형, 기호 등 정형화된 데이터.
- 예: 나이, 몸무게, 주가 등.
3) 공공 데이터의 특성
- 공공성: 공익을 위해 누구나 접근 가능.
- 활용성: 다양한 분야에서 재가공 가능.
- 신뢰성: 정부 기관 등 신뢰할 수 있는 출처에서 제공.
문제 1: 다음 중 정성 데이터에 속하는 것은?
① 풍향 ② 습도 ③ 기상특보 ④ 1시간 강수량
풀이 보기
정성 데이터는 언어, 문자 형태로 표현되는 데이터이다. 기상특보는 문자로 제공되므로 정답은 ③ 기상특보이다.
2. 데이터의 역할
데이터는 암묵지와 형식지의 상호작용에서 중요한 역할을 한다. 이는 SECI 모델로 설명할 수 있다:
1) 공통화(Socialization): 암묵지 노하우를 공유.
2) 표출화(Externalization): 암묵지를 문서화하여 형식지로 변환.
3) 연결화(Combination): 형식지를 결합하여 새로운 지식 창출.
4) 내면화(Internalization): 형식지를 학습하여 암묵지로 체화.
문제 2: 개인에게 내재된 경험을 객관적인 데이터로 문서나 매체에 저장, 가공, 분석하는 과정은?
① 연결화 ② 내면화 ③ 표출화 ④ 공통화
풀이 보기
경험을 문서화하고 분석하는 과정은 표출화 단계이다. 정답은 ③ 표출화이다.2. 데이터베이스의 정의와 특징
1. 데이터베이스 기본 개념
1) 데이터베이스(DB): 데이터를 효율적으로 저장, 관리하기 위한 구조화된 데이터 집합.
2) DBMS(Database Management System): 데이터베이스를 관리하는 소프트웨어.
3) SQL(Structured Query Language): 관계형 데이터베이스를 조작하는 언어.
2. 데이터베이스 특징
- 통합성: 동일한 내용이 중복되지 않음.
- 저장성: 컴퓨터가 접근할 수 있는 매체에 저장됨.
- 공용성: 여러 사용자가 다양한 목적으로 데이터를 공유 가능.
- 변화성: 데이터 추가, 삭제, 갱신으로 항상 최신 상태 유지.
3. 데이터베이스 유형
- 관계형 데이터베이스(Relational DB): SQL 기반, 구조화된 데이터 저장.
- 객체지향 데이터베이스(Object-Oriented DB): 멀티미디어 데이터 및 복잡한 구조 표현 가능.
- NoSQL 데이터베이스: 비정형 데이터 처리에 강점.
4. 데이터베이스 활용 사례
1) 기업 내부 관리
- ERP(전사적 자원 관리): 인사, 재무, 생산 관리 시스템 통합.
- CRM(고객 관계 관리): 고객 데이터를 분석하여 맞춤형 마케팅 전략 수립.
2) 공공기관
- 교통 데이터베이스: 실시간 교통 흐름 분석 및 효율적 신호 체계 구현.
- 의료 데이터베이스: 환자 기록 관리 및 공중 보건 정책 수립에 활용.
3) 소셜 미디어
- 사용자 행동 데이터 분석: 맞춤형 광고 제공 및 사용자 경험 개선.
문제 3: 다음 중 데이터베이스의 특징에 해당하지 않는 것은?
① 통합성 ② 저장성 ③ 정적성 ④ 공용성
풀이 보기
데이터베이스는 변화성을 가지며 정적성이란 개념은 존재하지 않는다. 정답은 ③ 정적성이다.3. 빅데이터의 이해와 가치
1. 빅데이터의 정의
- 맥킨지 정의: 빅데이터는 기존 데이터 관리 도구로 처리할 수 없을 정도로 거대한 규모의 데이터를 의미한다.
- 3V 특성:
- Volume(규모): 대규모 데이터.
- Variety(다양성): 정형, 반정형, 비정형 데이터의 복합.
- Velocity(속도): 데이터 생성 및 처리 속도.
2. 빅데이터의 가치
- 새로운 가치 창출: 기존 데이터에서 얻지 못한 통찰 제공.
- 산업 혁신 기여: 예측 분석, 맞춤형 서비스 등으로 경쟁력 강화.
- 플랫폼 역할: 데이터 공유와 협업의 중심.
3. 빅데이터 활용 사례
- 기업: 월마트는 구매 패턴 분석으로 상품 배치를 최적화.
- 정부: 교통량 예측 및 효율적인 도로 관리.
- 개인: 맞춤형 광고 추천 시스템.
문제 4: 빅데이터의 3V에 해당하지 않는 것은?
① Volume ② Variety ③ Velocity ④ Validation
풀이 보기
Validation은 빅데이터의 3V 특성에 해당하지 않는다. 정답은 ④ Validation이다.4. 데이터 기반 의사결정의 필요성
1. 데이터 기반 의사결정이 중요한 이유
- 경험과 직관에 의존했던 기존 방식에서 데이터 분석에 근거한 합리적인 의사결정으로 전환.
- 데이터 기반 의사결정은 조직의 경쟁력을 강화.
2. 데이터 활용의 장애 요인
- 고정관념(Stereotype): 새로운 정보를 받아들이지 않는 경향.
- 편향(Bias): 개인적 편견으로 인한 잘못된 판단.
- 프레이밍 효과(Framing Effect): 문제 표현 방식에 따른 판단 왜곡.
문제 5: 다음 중 데이터 기반 의사결정을 방해하는 요소로 가장 적절한 것은?
① 통계 분석 ② 고정관념 ③ 데이터 시각화 ④ 모델링
풀이 보기
데이터 기반 의사결정을 방해하는 주요 요소는 고정관념이다. 정답은 ② 고정관념이다.5. DIKW 피라미드와 데이터 유형
1. DIKW 피라미드
- 데이터(Data): 가공되지 않은 사실이나 값.
- 정보(Information): 데이터를 가공하여 의미를 부여한 것.
- 지식(Knowledge): 정보를 분석해 의사결정에 활용 가능한 형태.
- 지혜(Wisdom): 축적된 지식으로 미래를 예측하고 통찰력을 제공.
2. 데이터 유형
- 정형 데이터: RDBMS에 저장 가능한 형태, 연산 가능 (예: CSV 파일).
- 반정형 데이터: 구조가 있지만 완전히 정형화되지 않은 데이터 (예: JSON, XML).
- 비정형 데이터: 구조가 없고 분석이 어려운 데이터 (예: 영상, 이미지).
문제 6: 다음 중 지식에 대한 예로 가장 적절한 것은?
① A사이트보다 B사이트가 비싸다.
② B사이트보다 저렴한 A사이트에서 구매한다.
③ A사이트는 10,000원, B사이트는 15,000원이다.
④ B사이트의 가격이 A사이트보다 높다.
풀이 보기
정보에서 도출된 의사결정 단계는 지식에 해당한다. 정답은 ② B사이트보다 저렴한 A사이트에서 구매한다.위 내용은 ADsP 시험의 "데이터 이해" 과목 전반을 체계적으로 정리한 것이다. 기출 문제를 함께 풀이하며 중요한 개념을 익혀 시험 대비에 활용하길 바란다. 다음 편에서는 "데이터 분석 기획" 과목을 다룰 예정이다.
'Data Analysis' 카테고리의 다른 글
[머신러닝] 데이터 분석 함수 및 내용 정리 (Kaggle 준비하기) (0) | 2025.04.19 |
---|---|
[ADsP] 전체 내용 요점 및 핵심 요약 (0) | 2025.01.29 |
[ADsP] 4. 데이터 활용 (Data Utilization) 내용 요약 및 정리 (0) | 2025.01.27 |
[ADsP] 3. 데이터 분석 수행 (Data Analysis Execution) 개념 정리 및 요약 (0) | 2025.01.26 |
[ADsP] 2. 데이터 분석 기획 개념 정리 및 요약 (0) | 2025.01.25 |