반응형
안녕하세요, 꿈꾸는 약사입니다.
Single cell anaylsis 결과를 얻기 위해 R studio를 활용하기 위한 전반적인 지식에 대해 공부해보겠습니다.
데이터 준비 및 패키지 준비
# ggplot2 패키지에 속해있는 mpg data를 data.frame으로 불러옴
mpg <- as.data.fram(ggplot2::mpg)
library(dplyr)
library(ggplot2)
데이터 내용 확인
Raw data의 앞부분과 뒷부분
head(mpg)
tail(mpg)
데이터 뷰어
View(mpg)
차원, 속성, 요약 통계량
dim(mpg)
str(mpg)
summary(mpg)
변수명 수정
# rename() 이용하여 새롭게 명명되는 변수명 = 기존 변수명으로 설정
mpg <- rename(mpg, company = manufacturer)
파생변수 생성
# mpg의 cty 항과 hwy 항의 값들의 평균을 구하고, 20보다 크거나 같으면 pass 그 외 fail
mpg$mean <- (mpg$cty + mpg$hwy)/2
mpg$test <- ifelse(mpg$mean >= 20, "pass", "fail")
빈도 확인
# 빈도표 출력 및 막대그래프 생성
table(mpg$test)
qplot(mpg$test)
출처 : Do it! 쉽게 배우는 R 데이터 분석
'생물정보학 > R' 카테고리의 다른 글
[R stuido] 데이터 프레임 제작 및 외부 데이터 불러오기, R study 1편 (0) | 2022.08.19 |
---|