꿈꾸는 약사 이야기
article thumbnail
반응형

안녕하세요, 꿈꾸는 약사입니다.

Single cell anaylsis 결과를 얻기 위해 R studio를 활용하기 위한 전반적인 지식에 대해 공부해보겠습니다.

 

데이터 준비 및 패키지 준비

# ggplot2 패키지에 속해있는 mpg data를 data.frame으로 불러옴

mpg <- as.data.fram(ggplot2::mpg)
library(dplyr)
library(ggplot2)

 

데이터 내용 확인

Raw data의 앞부분과 뒷부분

head(mpg)
tail(mpg)

데이터 뷰어

View(mpg)

차원, 속성, 요약 통계량

dim(mpg)
str(mpg)
summary(mpg)

 

변수명 수정

# rename() 이용하여 새롭게 명명되는 변수명 = 기존 변수명으로 설정

mpg <- rename(mpg, company = manufacturer)

 

파생변수 생성

# mpg의 cty 항과 hwy 항의 값들의 평균을 구하고,  20보다 크거나 같으면 pass 그 외 fail

mpg$mean <- (mpg$cty +  mpg$hwy)/2
mpg$test <- ifelse(mpg$mean >= 20, "pass", "fail")

 

빈도 확인

# 빈도표 출력 및 막대그래프 생성

table(mpg$test)
qplot(mpg$test)

 

출처 : Do it! 쉽게 배우는 R 데이터 분석

profile

꿈꾸는 약사 이야기

@Ph. D

포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!

검색 태그