R 언어 설치 및 기본 문법, 사용방법 정리

728x90

R 언어 기본 문법 소개

R은 데이터 분석과 통계 작업에 특화된 프로그래밍 언어다. 이 글에서는 R 언어의 기본 문법과 주요 기능에 대해 설명한다.


1. R 언어의 특징

  • 오픈 소스: 누구나 무료로 사용할 수 있다.
  • 통계 및 데이터 분석에 최적화: 다양한 통계 패키지와 시각화 도구를 제공한다.
  • 광범위한 커뮤니티 지원: CRAN을 통해 다양한 패키지를 제공한다.
  • 인터프리터 언어: 코드를 바로 실행하고 결과를 확인할 수 있다.

2. R 설치와 기본 사용법

  1. 설치: R을 설치하려면 CRAN에서 다운로드한다. RStudio와 같은 IDE를 함께 사용하면 더 편리하다.
  2. 콘솔 사용: R의 콘솔에서 명령어를 입력하고 결과를 즉시 확인할 수 있다.
  3. R 스크립트: .R 파일 확장자로 코드를 작성하고 실행한다.

3. 기본 데이터 타입

R에서 자주 사용되는 데이터 타입은 다음과 같다.

  • 숫자형(Numeric): 실수와 정수 (예: 3.14, 42)
  • 문자형(Character): 문자열 데이터 (예: 'Hello', 'R Programming')
  • 논리형(Logical): TRUE 또는 FALSE 값을 가진다.
  • 팩터(Factor): 범주형 데이터를 표현한다.

예제

x <- 10         # 숫자형
y <- "Hello"   # 문자형
z <- TRUE       # 논리형
factor_var <- factor(c("low", "medium", "high"))

4. 연산자

산술 연산자

연산자 설명 예제
+ 덧셈 5 + 3
- 뺄셈 5 - 3
* 곱셈 5 * 3
/ 나눗셈 5 / 3
^, ** 제곱 5^2, 5**2
%% 나머지 5 %% 3
%/% 5 %/% 3

비교 연산자

연산자 설명 예제
== 같음 5 == 3
!= 같지 않음 5 != 3
> 5 > 3
< 작음 5 < 3
>= 크거나 같음 5 >= 3
<= 작거나 같음 5 <= 3

논리 연산자

연산자 설명 예제
& 논리 AND TRUE & FALSE
    논리 OR
! 논리 NOT !TRUE

5. 데이터 구조

R에서 데이터를 저장하고 처리하기 위한 주요 데이터 구조는 다음과 같다.

벡터(Vector)

  • 정의: 동일한 데이터 타입의 1차원 배열이다.
  • 생성: c() 함수를 사용한다.
vec <- c(1, 2, 3, 4, 5)

리스트(List)

  • 정의: 서로 다른 데이터 타입을 포함할 수 있는 1차원 배열이다.
  • 생성: list() 함수를 사용한다.
list_var <- list(1, "a", TRUE, c(1, 2, 3))

행렬(Matrix)

  • 정의: 동일한 데이터 타입의 2차원 배열이다.
  • 생성: matrix() 함수를 사용한다.
mat <- matrix(1:6, nrow=2, ncol=3)

데이터프레임(Data Frame)

  • 정의: 서로 다른 데이터 타입의 열을 가질 수 있는 2차원 데이터 구조이다.
  • 생성: data.frame() 함수를 사용한다.
df <- data.frame(Name=c("Alice", "Bob"), Age=c(25, 30))

팩터(Factor)

  • 정의: 범주형 데이터를 처리하기 위한 데이터 구조다.
  • 생성: factor() 함수를 사용한다.
factor_var <- factor(c("low", "medium", "high"))

6. 제어문

조건문

x <- 10
if (x > 5) {
  print("x는 5보다 큽니다.")
} else {
  print("x는 5 이하입니다.")
}

반복문

for (i in 1:5) {
  print(i)
}

x <- 1
while (x <= 5) {
  print(x)
  x <- x + 1
}

7. 함수

함수 정의

my_function <- function(a, b) {
  return(a + b)
}
result <- my_function(5, 3)
print(result)

8. 기본 내장 함수

R은 다양한 내장 함수를 제공한다. 자주 사용하는 함수는 다음과 같다.

  • mean(): 평균 계산
  • sum(): 합계 계산
  • length(): 데이터의 길이 확인
  • sort(): 데이터 정렬
  • table(): 데이터 빈도 계산
  • str(): 데이터 구조 확인

예제

data <- c(1, 2, 3, 4, 5)
mean(data)       # 평균: 3
sum(data)        # 합계: 15
length(data)     # 길이: 5
sort(data)       # 정렬: 1, 2, 3, 4, 5

9. 데이터 시각화

R은 강력한 시각화 기능을 제공한다. 기본적으로 plot() 함수를 사용할 수 있다.

예제

x <- c(1, 2, 3, 4, 5)
y <- c(5, 4, 3, 2, 1)
plot(x, y, main="Example Plot", xlab="X-Axis", ylab="Y-Axis", col="blue", pch=19)

10. 결론

R은 데이터 분석도구이며, 다양한 데이터 구조와 함수를 제공한다.

이 글에서는 R 언어의 기본적인 문법을 다뤘다. 이를 기반으로 심화된 데이터 분석과 시각화를 진행할 수 있다.

728x90