R

R 데이터핸들링,ggplot2

최시엘 2018. 11. 16. 14:56

이번시간에는  데이터실습 및 핸들링작업에 대해 알아보겠습니다.



#데이터실습에 많이 사용하는 데이터인 mpg를 부르는 작업

  실습에 사용될 "ggplot2" 라는 패키지를 설치 하고


> install.packages("ggplot2")

> libary(ggplot2)


> mpg<-as.data.frame(ggplot2::mpg) 



다음과 같이 mpg 데이터를 가져옵니다.


> qplot(data=mpg,x=hwy)

> qplot(data=mpg,x=drv,y=hwy)

> qplot(data=mpg,x=drv,y=hwy,geom="line")    실선형태의 플룻.

> qplot(data=mpg,x=drv,y=hwy,geom="boxplot")    박스형태의 플룻

> qplot(data=mpg,x=drv,y=hwy,geom="boxplot",colour=drv)    색상추가


qplot [데이터를 시각화해서 표현해줍니다]



이런 형태로 plot을 확인 하실 수 있습니다.



head(mpg)

 [관측값 위에서 6개 가져옵니다]

tail(mpg) 

 [관측값 밑에서 6개 가져옵니다] 

dim(mpg)

 [테이블의 숫자를 표현합니다]

str(mpg)

 [R 객체의 구조를 표현합니다]

summary(mpg)

 [함수결과를 요약 합니다]


함수에 관해 궁금한 것이 있을때 

# ?함수() 를 쳐보시면 함수에 대한 설명이 있습니다.


ex) ?library()




변수명을 변경하시고 싶을 때는

#변수명변경


> df_raw<-data.frame(var1=c(1,2,1),var2=c(2,3,2))



#rename함수:대상변수에서 소속된 필드의 명칭변경.


> df_new<-df_raw

> df_new<-rename(df_new,v2=var2)

> df_new 

  (var2 필드명이 v2로 변경되어있다.)


#데이터프레임에 데이터필드를 추가하는 작업.


> df<-data.frame(var1=c(4,3,8),var2=c(2,6,1))

  (df데이터프레임에 var1,var2 의 데이터필드 추가)


#df데이터프레임안에 df$var_sum변수를 추가시킴


       var1과 var2를 합한 var_sum을 만들고, 추가시킴


> df$var_sum<-df$var1+df$var2


> df$var_mean<-(df$var1+df$var2)/2

(var_mean 평균값 변수를 추가시킴)




#mpg 연비데이터에서 도시연비와 고속도로평균을 total

  파생변수에 저장하는 코드


> mpg$total<-(mpg$cty+mpg$hwy)/2

> mpg$total



> mean(mpg$total)       [ mpg$total의 평균값 ]

> summary(mpg$total)  [ mpg$total의 함수결과 요약 ]





'R' 카테고리의 다른 글

R 패키지를 통한 엑셀불러오기, csv, Rdata  (1) 2018.11.15
R 기초문법(Scalar,Vector) 변수설정  (0) 2018.11.15
R 기초 시작 R과 Rstudio  (1) 2018.11.14