728x90
R 언어 기본 문법 소개
R은 데이터 분석과 통계 작업에 특화된 프로그래밍 언어다. 이 글에서는 R 언어의 기본 문법과 주요 기능에 대해 설명한다.
1. R 언어의 특징
- 오픈 소스: 누구나 무료로 사용할 수 있다.
- 통계 및 데이터 분석에 최적화: 다양한 통계 패키지와 시각화 도구를 제공한다.
- 광범위한 커뮤니티 지원: CRAN을 통해 다양한 패키지를 제공한다.
- 인터프리터 언어: 코드를 바로 실행하고 결과를 확인할 수 있다.
2. R 설치와 기본 사용법
- 설치: R을 설치하려면 CRAN에서 다운로드한다. RStudio와 같은 IDE를 함께 사용하면 더 편리하다.
- 콘솔 사용: R의 콘솔에서 명령어를 입력하고 결과를 즉시 확인할 수 있다.
- R 스크립트:
.R
파일 확장자로 코드를 작성하고 실행한다.
3. 기본 데이터 타입
R에서 자주 사용되는 데이터 타입은 다음과 같다.
- 숫자형(Numeric): 실수와 정수 (예:
3.14
,42
) - 문자형(Character): 문자열 데이터 (예:
'Hello'
,'R Programming'
) - 논리형(Logical): TRUE 또는 FALSE 값을 가진다.
- 팩터(Factor): 범주형 데이터를 표현한다.
예제
x <- 10 # 숫자형
y <- "Hello" # 문자형
z <- TRUE # 논리형
factor_var <- factor(c("low", "medium", "high"))
4. 연산자
산술 연산자
연산자 | 설명 | 예제 |
---|---|---|
+ | 덧셈 | 5 + 3 |
- | 뺄셈 | 5 - 3 |
* | 곱셈 | 5 * 3 |
/ | 나눗셈 | 5 / 3 |
^, ** | 제곱 | 5^2 , 5**2 |
%% | 나머지 | 5 %% 3 |
%/% | 몫 | 5 %/% 3 |
비교 연산자
연산자 | 설명 | 예제 |
---|---|---|
== | 같음 | 5 == 3 |
!= | 같지 않음 | 5 != 3 |
> | 큼 | 5 > 3 |
< | 작음 | 5 < 3 |
>= | 크거나 같음 | 5 >= 3 |
<= | 작거나 같음 | 5 <= 3 |
논리 연산자
연산자 | 설명 | 예제 |
---|---|---|
& | 논리 AND | TRUE & FALSE |
논리 OR | ||
! | 논리 NOT | !TRUE |
5. 데이터 구조
R에서 데이터를 저장하고 처리하기 위한 주요 데이터 구조는 다음과 같다.
벡터(Vector)
- 정의: 동일한 데이터 타입의 1차원 배열이다.
- 생성:
c()
함수를 사용한다.
vec <- c(1, 2, 3, 4, 5)
리스트(List)
- 정의: 서로 다른 데이터 타입을 포함할 수 있는 1차원 배열이다.
- 생성:
list()
함수를 사용한다.
list_var <- list(1, "a", TRUE, c(1, 2, 3))
행렬(Matrix)
- 정의: 동일한 데이터 타입의 2차원 배열이다.
- 생성:
matrix()
함수를 사용한다.
mat <- matrix(1:6, nrow=2, ncol=3)
데이터프레임(Data Frame)
- 정의: 서로 다른 데이터 타입의 열을 가질 수 있는 2차원 데이터 구조이다.
- 생성:
data.frame()
함수를 사용한다.
df <- data.frame(Name=c("Alice", "Bob"), Age=c(25, 30))
팩터(Factor)
- 정의: 범주형 데이터를 처리하기 위한 데이터 구조다.
- 생성:
factor()
함수를 사용한다.
factor_var <- factor(c("low", "medium", "high"))
6. 제어문
조건문
x <- 10
if (x > 5) {
print("x는 5보다 큽니다.")
} else {
print("x는 5 이하입니다.")
}
반복문
for (i in 1:5) {
print(i)
}
x <- 1
while (x <= 5) {
print(x)
x <- x + 1
}
7. 함수
함수 정의
my_function <- function(a, b) {
return(a + b)
}
result <- my_function(5, 3)
print(result)
8. 기본 내장 함수
R은 다양한 내장 함수를 제공한다. 자주 사용하는 함수는 다음과 같다.
mean()
: 평균 계산sum()
: 합계 계산length()
: 데이터의 길이 확인sort()
: 데이터 정렬table()
: 데이터 빈도 계산str()
: 데이터 구조 확인
예제
data <- c(1, 2, 3, 4, 5)
mean(data) # 평균: 3
sum(data) # 합계: 15
length(data) # 길이: 5
sort(data) # 정렬: 1, 2, 3, 4, 5
9. 데이터 시각화
R은 강력한 시각화 기능을 제공한다. 기본적으로 plot()
함수를 사용할 수 있다.
예제
x <- c(1, 2, 3, 4, 5)
y <- c(5, 4, 3, 2, 1)
plot(x, y, main="Example Plot", xlab="X-Axis", ylab="Y-Axis", col="blue", pch=19)
10. 결론
R은 데이터 분석도구이며, 다양한 데이터 구조와 함수를 제공한다.
이 글에서는 R 언어의 기본적인 문법을 다뤘다. 이를 기반으로 심화된 데이터 분석과 시각화를 진행할 수 있다.
728x90
'Programming > R' 카테고리의 다른 글
R에서 데이터 형태 변환하기 - melt()와 cast() 함수 사용법 정리 (0) | 2025.02.05 |
---|---|
R 언어로 머신러닝, 딥러닝 돌리기 - keras 모델링 (1) | 2024.12.21 |
R 언어로 통계 분석 해보기 - CSV 불러오기, 통계분석, 가설검정 (0) | 2024.12.20 |
ANOVA Test for Orange DataSet in RStudio (0) | 2022.05.10 |
Example DataSet in R (0) | 2022.05.09 |