"Do it! 쉽게 배우는 R 데이터 분석"
책을 참고하여 R을 공부했으며, 글을 작성했습니다.
☑️데이터 다루기
🔍 데이터 및 패키지 준비
# 데이터 불러오기
mpg <- as.data.frame(ggplot2::mpg)
# dplyr 로드
library(dplyr)
# ggplot2 로드
library(ggplot2)
🔍 데이터 파악
함수명 | 특징 |
1. head() | 데이터의 앞 부분(6개) |
2. tail() | 데이터의 뒷 부분(6개) |
3. view() | 데이터 뷰어 창 에서 확인 |
4. dim() | 데이터의 차원 |
5. str() | 데이터의 구조 |
6. summary() | 데이터의 요약 통계량 |
🔍 변수명 수정
rename()
dplyr 패키지의 rename을 사용하여 변수명 수정
하기에 앞서, 항상 원본의 복사본을 생성하는 습관을 들이자
# 복사본 만들기
df_new <- df_raw
# 변수 이름 변경
df_new <- rename(df_new,
v2 = var2)
🔍 파생변수 생성
파생변수 만들기
# 새로운 변수 만들기
mpg <- as.data.frame(ggplot2::mpg)
head(mpg)
# 통합연비 변수(total)
mpg$total <- (mpg$cty + mpg$hwy)/2 head(mpg)
head(mpg)
ifelse(조건,조건을 만족할 때 값, 조건을 만족하지 않을 때 값)
mpg$test <- ifelse(mpg$total >= 20, "pass", "fail")
head(mpg)
🔍 빈도 확인
table()
빈도표 출력
table(mpg$test)
'데이터분석 찍어먹기 > R' 카테고리의 다른 글
6일차 - 데이터 분석 [실습_9장] (0) | 2024.07.24 |
---|---|
5일차 - 데이터 다뤄보기[그래프_8장] (1) | 2024.07.19 |
4일차 - 데이터 다뤄보기 [정제-7장] (0) | 2024.07.18 |
3일차 - 데이터 다뤄보기 [가공_6장] (0) | 2024.07.12 |
1일차 - R 이랑 친해지기 [1-4장] (0) | 2024.07.05 |