[ADsP] 1. 데이터 이해(Data Understanding) 개념 정리 및 요약

728x90

데이터 이해 (Data Understanding) - ADsP 시험 대비 정리

데이터 분석 준전문가(ADsP) 시험의 첫 번째 과목인 "데이터 이해"는 데이터의 본질과 가치, 그리고 데이터베이스 활용과 관련된 핵심 지식을 다루고 있다. 이번 글에서는 이 과목의 주요 내용을 정리하고 기출 문제 풀이를 통해 학습에 도움을 주고자 한다.


1. 데이터와 정보

1. 데이터의 유형
데이터는 형태에 따라 크게 두 가지로 나뉜다:

 

1) 정성적 데이터:

  • 언어, 문자 형태로 표현되며 저장, 검색, 분석에 높은 비용이 든다.
  • 예: 설문 응답, 블로그 글 등.

2) 정량적 데이터:

  • 숫자, 도형, 기호 등 정형화된 데이터.
  • 예: 나이, 몸무게, 주가 등.

3) 공공 데이터의 특성

  • 공공성: 공익을 위해 누구나 접근 가능.
  • 활용성: 다양한 분야에서 재가공 가능.
  • 신뢰성: 정부 기관 등 신뢰할 수 있는 출처에서 제공.

 

문제 1: 다음 중 정성 데이터에 속하는 것은?
① 풍향 ② 습도 ③ 기상특보 ④ 1시간 강수량


풀이 보기 정성 데이터는 언어, 문자 형태로 표현되는 데이터이다. 기상특보는 문자로 제공되므로 정답은 ③ 기상특보이다.

 

 

2. 데이터의 역할
데이터는 암묵지와 형식지의 상호작용에서 중요한 역할을 한다. 이는 SECI 모델로 설명할 수 있다:

1) 공통화(Socialization): 암묵지 노하우를 공유.
2) 표출화(Externalization): 암묵지를 문서화하여 형식지로 변환.
3) 연결화(Combination): 형식지를 결합하여 새로운 지식 창출.
4) 내면화(Internalization): 형식지를 학습하여 암묵지로 체화.

 


 

문제 2: 개인에게 내재된 경험을 객관적인 데이터로 문서나 매체에 저장, 가공, 분석하는 과정은?
① 연결화 ② 내면화 ③ 표출화 ④ 공통화


풀이 보기 경험을 문서화하고 분석하는 과정은 표출화 단계이다. 정답은 ③ 표출화이다.

2. 데이터베이스의 정의와 특징

1. 데이터베이스 기본 개념

1) 데이터베이스(DB): 데이터를 효율적으로 저장, 관리하기 위한 구조화된 데이터 집합.
2) DBMS(Database Management System): 데이터베이스를 관리하는 소프트웨어.
3) SQL(Structured Query Language): 관계형 데이터베이스를 조작하는 언어.

2. 데이터베이스 특징

  • 통합성: 동일한 내용이 중복되지 않음.
  • 저장성: 컴퓨터가 접근할 수 있는 매체에 저장됨.
  • 공용성: 여러 사용자가 다양한 목적으로 데이터를 공유 가능.
  • 변화성: 데이터 추가, 삭제, 갱신으로 항상 최신 상태 유지.

3. 데이터베이스 유형

  • 관계형 데이터베이스(Relational DB): SQL 기반, 구조화된 데이터 저장.
  • 객체지향 데이터베이스(Object-Oriented DB): 멀티미디어 데이터 및 복잡한 구조 표현 가능.
  • NoSQL 데이터베이스: 비정형 데이터 처리에 강점.

4. 데이터베이스 활용 사례

1) 기업 내부 관리

  • ERP(전사적 자원 관리): 인사, 재무, 생산 관리 시스템 통합.
  • CRM(고객 관계 관리): 고객 데이터를 분석하여 맞춤형 마케팅 전략 수립.

2) 공공기관

  • 교통 데이터베이스: 실시간 교통 흐름 분석 및 효율적 신호 체계 구현.
  • 의료 데이터베이스: 환자 기록 관리 및 공중 보건 정책 수립에 활용.

3) 소셜 미디어

  • 사용자 행동 데이터 분석: 맞춤형 광고 제공 및 사용자 경험 개선.

 

문제 3: 다음 중 데이터베이스의 특징에 해당하지 않는 것은?
① 통합성 ② 저장성 ③ 정적성 ④ 공용성


 

풀이 보기 데이터베이스는 변화성을 가지며 정적성이란 개념은 존재하지 않는다. 정답은 ③ 정적성이다.

3. 빅데이터의 이해와 가치

1. 빅데이터의 정의

  • 맥킨지 정의: 빅데이터는 기존 데이터 관리 도구로 처리할 수 없을 정도로 거대한 규모의 데이터를 의미한다.
  • 3V 특성:
    • Volume(규모): 대규모 데이터.
    • Variety(다양성): 정형, 반정형, 비정형 데이터의 복합.
    • Velocity(속도): 데이터 생성 및 처리 속도.

2. 빅데이터의 가치

  • 새로운 가치 창출: 기존 데이터에서 얻지 못한 통찰 제공.
  • 산업 혁신 기여: 예측 분석, 맞춤형 서비스 등으로 경쟁력 강화.
  • 플랫폼 역할: 데이터 공유와 협업의 중심.

3. 빅데이터 활용 사례

  • 기업: 월마트는 구매 패턴 분석으로 상품 배치를 최적화.
  • 정부: 교통량 예측 및 효율적인 도로 관리.
  • 개인: 맞춤형 광고 추천 시스템.

 

문제 4: 빅데이터의 3V에 해당하지 않는 것은?
① Volume ② Variety ③ Velocity ④ Validation

 


풀이 보기 Validation은 빅데이터의 3V 특성에 해당하지 않는다. 정답은 ④ Validation이다.

4. 데이터 기반 의사결정의 필요성

1. 데이터 기반 의사결정이 중요한 이유

  • 경험과 직관에 의존했던 기존 방식에서 데이터 분석에 근거한 합리적인 의사결정으로 전환.
  • 데이터 기반 의사결정은 조직의 경쟁력을 강화.

2. 데이터 활용의 장애 요인

  • 고정관념(Stereotype): 새로운 정보를 받아들이지 않는 경향.
  • 편향(Bias): 개인적 편견으로 인한 잘못된 판단.
  • 프레이밍 효과(Framing Effect): 문제 표현 방식에 따른 판단 왜곡.

 


 

문제 5: 다음 중 데이터 기반 의사결정을 방해하는 요소로 가장 적절한 것은?
① 통계 분석 ② 고정관념 ③ 데이터 시각화 ④ 모델링


풀이 보기 데이터 기반 의사결정을 방해하는 주요 요소는 고정관념이다. 정답은 ② 고정관념이다.

5. DIKW 피라미드와 데이터 유형

1. DIKW 피라미드

  • 데이터(Data): 가공되지 않은 사실이나 값.
  • 정보(Information): 데이터를 가공하여 의미를 부여한 것.
  • 지식(Knowledge): 정보를 분석해 의사결정에 활용 가능한 형태.
  • 지혜(Wisdom): 축적된 지식으로 미래를 예측하고 통찰력을 제공.

2. 데이터 유형

  • 정형 데이터: RDBMS에 저장 가능한 형태, 연산 가능 (예: CSV 파일).
  • 반정형 데이터: 구조가 있지만 완전히 정형화되지 않은 데이터 (예: JSON, XML).
  • 비정형 데이터: 구조가 없고 분석이 어려운 데이터 (예: 영상, 이미지).

 

문제 6: 다음 중 지식에 대한 예로 가장 적절한 것은?
① A사이트보다 B사이트가 비싸다.
② B사이트보다 저렴한 A사이트에서 구매한다.
③ A사이트는 10,000원, B사이트는 15,000원이다.
④ B사이트의 가격이 A사이트보다 높다.

 


풀이 보기 정보에서 도출된 의사결정 단계는 지식에 해당한다. 정답은 ② B사이트보다 저렴한 A사이트에서 구매한다.

위 내용은 ADsP 시험의 "데이터 이해" 과목 전반을 체계적으로 정리한 것이다. 기출 문제를 함께 풀이하며 중요한 개념을 익혀 시험 대비에 활용하길 바란다. 다음 편에서는 "데이터 분석 기획" 과목을 다룰 예정이다.

728x90