📘 데이터 분석 내용 정리1. 데이터 불러오기① 데이터 로딩import pandas as pd# CSV 파일 불러오기df = pd.read_csv('file.csv')# Excel 파일 불러오기df = pd.read_excel('file.xlsx', sheet_name='Sheet1')# JSON 파일 불러오기df = pd.read_json('file.json')# 구분자 지정 CSV (탭, 세미콜론 등)df = pd.read_csv('file.csv', sep='\t') # 탭으로 구분된 경우② 데이터 기본 정보 확인df.head() # 처음 5개 데이터df.tail() # 마지막 5개 데이터df.sample(10) # 랜덤 10개 데이터 확인df.shape # 데이터..
Python에서 K-means 군집화 수행 방법K-means 군집화는 데이터 마이닝과 머신러닝에서 널리 사용되는 알고리즘이다. Python에서는 scikit-learn 라이브러리를 사용하여 간단하게 K-means를 구현할 수 있다. 본 글에서는 K-means 알고리즘을 Python에서 적용하는 방법을 설명한다.1. 필요한 라이브러리 설치 및 불러오기import numpy as npimport matplotlib.pyplot as pltfrom sklearn.cluster import KMeansfrom sklearn.datasets import make_blobs2. 예제 데이터 생성K-means 알고리즘을 적용할 샘플 데이터를 생성한다. 이를 위해 make_blobs 함수를 사용한다.# 랜덤 데이터 생..
ADsP 주요 과목 요약 - 데이터 분석 준전문가 대비 완벽 정리데이터 분석 준전문가(ADsP) 시험은 데이터 분석의 기본 개념부터 실질적인 활용까지 다루는 4개의 주요 과목으로 구성된다. 본 글에서는 각 과목의 핵심 내용을 요약하고, 시험 대비를 위한 필수 포인트를 정리하였다.1. 데이터 이해 (Data Understanding)1. 데이터의 정의 및 유형데이터: 현실 세계의 사실이나 사건을 나타내는 기호, 문자, 숫자의 조합.정량적 데이터: 숫자로 표현되는 데이터 (예: 키, 나이, 매출).정성적 데이터: 언어나 문자로 표현되는 데이터 (예: 설문 응답, 리뷰).2. 데이터베이스의 개념데이터베이스는 데이터를 체계적으로 저장하고 관리하는 시스템이다.DBMS(Database Management Syste..
데이터 활용 (Data Utilization) - ADsP 시험 대비 정리데이터 분석 준전문가(ADsP) 시험의 네 번째 과목인 "데이터 활용"은 데이터를 실질적으로 활용하여 비즈니스 의사결정 및 가치를 창출하는 데 중점을 둔다. 본 글에서는 이 과목의 주요 내용을 정리하고, 중요 개념과 기출 문제를 함께 다루어 학습을 돕고자 한다.1. 데이터 기반 의사결정1. 데이터 기반 의사결정의 정의데이터를 분석하여 의사결정에 필요한 정보를 도출하고, 조직의 목표를 효과적으로 달성하는 방법.경험적 의사결정과 대비되는 과학적 접근법.2. 데이터 기반 의사결정의 과정1) 문제 정의: 해결해야 할 문제를 명확히 규정.2) 데이터 수집: 문제 해결에 필요한 데이터를 확보.3) 데이터 분석: 통계, 머신러닝 등을 활용하여 ..
데이터 분석 수행 (Data Analysis Execution) - ADsP 시험 대비 정리데이터 분석 준전문가(ADsP) 시험의 세 번째 과목인 "데이터 분석 수행"은 실제 데이터 분석 과정에서 요구되는 기술과 방법론을 다룬다. 이번 글에서는 PDF 자료를 참고하여 과목의 주요 내용을 요약하고, 중요한 부분을 강조하며 기출 문제를 포함해 학습을 돕고자 한다.1. 데이터 전처리 (Data Preprocessing)1. 데이터 전처리의 중요성원시 데이터는 결측치, 이상치, 불균형 등의 문제가 있으므로 분석에 적합한 형태로 가공해야 한다.데이터 품질을 향상시켜 분석 결과의 신뢰도를 높인다.2. 주요 전처리 과정1) 결측치 처리:삭제: 결측치가 적은 경우 해당 데이터를 제거.대체: 평균, 중앙값, 모드 또는 ..
데이터 분석 기획 (Data Analysis Planning) - ADsP 시험 대비 정리데이터 분석 준전문가(ADsP) 시험의 두 번째 과목인 "데이터 분석 기획"은 데이터 분석 프로젝트를 효과적으로 계획하고 실행하기 위한 이론과 실무적인 접근 방식을 다룬다. 본 글에서는 해당 과목의 주요 내용을 정리하고, 기출 문제를 풀이하며 학습에 도움을 주고자 한다.1. 데이터 분석 프로젝트의 정의와 기획1. 데이터 분석 프로젝트란?데이터 분석 프로젝트는 조직의 문제를 해결하거나 가치를 창출하기 위해 데이터를 수집, 처리, 분석하는 일련의 과정이다.성공적인 프로젝트는 명확한 목표 설정과 체계적인 계획 수립이 필수적이다.2. 데이터 분석 기획의 필요성조직의 목표와 문제를 이해하고 이에 적합한 데이터 분석 방법론을 ..