이번시간에는 데이터실습 및 핸들링작업에 대해 알아보겠습니다.
#데이터실습에 많이 사용하는 데이터인 mpg를 부르는 작업
실습에 사용될 "ggplot2" 라는 패키지를 설치 하고
> install.packages("ggplot2")
> libary(ggplot2)
> mpg<-as.data.frame(ggplot2::mpg)
다음과 같이 mpg 데이터를 가져옵니다.
> qplot(data=mpg,x=hwy)
> qplot(data=mpg,x=drv,y=hwy)
> qplot(data=mpg,x=drv,y=hwy,geom="line") 실선형태의 플룻.
> qplot(data=mpg,x=drv,y=hwy,geom="boxplot") 박스형태의 플룻
> qplot(data=mpg,x=drv,y=hwy,geom="boxplot",colour=drv) 색상추가
qplot [데이터를 시각화해서 표현해줍니다]
이런 형태로 plot을 확인 하실 수 있습니다.
head(mpg) |
[관측값 위에서 6개 가져옵니다] |
tail(mpg) |
[관측값 밑에서 6개 가져옵니다] |
dim(mpg) |
[테이블의 숫자를 표현합니다] |
str(mpg) |
[R 객체의 구조를 표현합니다] |
summary(mpg) |
[함수결과를 요약 합니다] |
함수에 관해 궁금한 것이 있을때
# ?함수() 를 쳐보시면 함수에 대한 설명이 있습니다.
ex) ?library()
변수명을 변경하시고 싶을 때는
#변수명변경
> df_raw<-data.frame(var1=c(1,2,1),var2=c(2,3,2))
#rename함수:대상변수에서 소속된 필드의 명칭변경.
> df_new<-df_raw
> df_new<-rename(df_new,v2=var2)
> df_new
(var2 필드명이 v2로 변경되어있다.)
#데이터프레임에 데이터필드를 추가하는 작업.
> df<-data.frame(var1=c(4,3,8),var2=c(2,6,1))
(df데이터프레임에 var1,var2 의 데이터필드 추가)
#df데이터프레임안에 df$var_sum변수를 추가시킴
var1과 var2를 합한 var_sum을 만들고, 추가시킴
> df$var_sum<-df$var1+df$var2
> df$var_mean<-(df$var1+df$var2)/2
(var_mean 평균값 변수를 추가시킴)
#mpg 연비데이터에서 도시연비와 고속도로평균을 total
파생변수에 저장하는 코드
> mpg$total<-(mpg$cty+mpg$hwy)/2
> mpg$total
> mean(mpg$total) [ mpg$total의 평균값 ]
> summary(mpg$total) [ mpg$total의 함수결과 요약 ]
'R' 카테고리의 다른 글
R 패키지를 통한 엑셀불러오기, csv, Rdata (1) | 2018.11.15 |
---|---|
R 기초문법(Scalar,Vector) 변수설정 (0) | 2018.11.15 |
R 기초 시작 R과 Rstudio (1) | 2018.11.14 |