본문 바로가기
데이터분석 찍어먹기/R

2일차 - R 데이터 다뤄보기 [기초_1장]

by dbdbdeeep 2024. 7. 10.

"Do it! 쉽게 배우는 R 데이터 분석" 

책을 참고하여 R을 공부했으며, 글을 작성했습니다.


 


☑️데이터 다루기

🔍 데이터 및 패키지 준비


# 데이터 불러오기
mpg <- as.data.frame(ggplot2::mpg) 

# dplyr 로드
library(dplyr)
# ggplot2 로드
library(ggplot2)                    

🔍 데이터 파악

함수명 특징
1. head() 데이터의 앞 부분(6개)
2. tail() 데이터의 뒷 부분(6개)
3. view() 데이터 뷰어 창 에서 확인
4. dim() 데이터의 차원
5. str() 데이터의 구조
6. summary() 데이터의 요약 통계량 

 

🔍 변수명 수정 

rename()

dplyr 패키지의 rename을 사용하여 변수명 수정

 

하기에 앞서, 항상 원본의 복사본을 생성하는 습관을 들이자 

# 복사본 만들기
df_new <- df_raw

실행화면

# 변수 이름 변경
df_new <- rename(df_new,
                 v2 = var2)

실행화면

🔍 파생변수 생성 

파생변수 만들기
# 새로운 변수 만들기
mpg <- as.data.frame(ggplot2::mpg)
head(mpg)

 

실행화면

# 통합연비 변수(total)
mpg$total <- (mpg$cty + mpg$hwy)/2 head(mpg)
head(mpg)

실행화면

 ifelse(조건,조건을 만족할 때 값, 조건을 만족하지 않을 때 값)

 

mpg$test <- ifelse(mpg$total >= 20, "pass", "fail") 
head(mpg)

실행화면

🔍 빈도 확인

table()

빈도표 출력 

table(mpg$test)

실행화면