R  새로운 종류의 Plot 

  1. 상자그림(box plot)

    1. 사분위수: 데이터의 분포를 설명

      1. 1Q: 데이터 분포에서 25프로거나 이내의 데이터

      2. 2Q: 50프로

      3. 3Q: 75프로

    2. boxplot(데이터)

      1. boxplot을 객체로 주면 데이터 stats저장 가능

        1. ex) boxstat <- boxplot(iris$Sepal.Width, horizontal=T)

    3. outlier에 text입히기

      1. x값은 outlier값, y값은 1로 위치 설정

        1. ex) text(boxstat$out, rep(1,nrow(boxstat$out)), pos=1)

  2. 히스토그램(hist)

    1. hist(데이터)

      1. 구간: break라는 파라메터를 사용, 기본값 = ‘Sturges’, 이것은 막대의 너비를 [log_x(n)+1]로 지정 (세로값)

      2. 각 구간별 데이터 갯수: freq, 기본값= null. (가로값)

        1. freq=FALSE: 구간의 확률밀도가 그려짐, 확률밀도이므로 너비의 합이 1이 된다.

  3. 밀도 그림(density): 히스토그램의 분포를 살펴보기위해 가장 잘 알려진 함수

    1. density(데이터)

    2. rug() 함수: 실제데이터의 위치를 표시하는 함수

      1. rug(jitter(데이터)), 여기서 jitter는 데이터가 겹치지 않도록

  4. 막대 그림(barplot)

    1. barplot(값1,2,3,...)

  5. 파이 그래프 (pie)

    1. 패스~~ 다음에 하자

  6. 모자이크 플롯 (mosaicplot)

    1. 범주형 다변량 데이터를 표현

    2. mosaicplot(데이터, color = T)

      1. 만약 어떤 변수에 따른 모자이크  플롯만 그리고 싶다면 -> mosaicplot(~Class + Survived, data=Titanic, color = T)

  7. 산점도 행렬 (pairs)

    1. pairs(~ 산점도에 넣고싶은 column + column, …, col = c(‘색상1’,’색상2’,...)[범주형데이터명])

      1. ex) pairs(~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width, data = iris, col=c(‘red’,’green’,’blue’)[iris$Species])

  8. 투시도와 등고선

    1. 패스~~

 

'R > 기초' 카테고리의 다른 글

R 데이터 plot 함수  (0) 2019.08.13
R 데이터 조작 II  (0) 2019.08.13
R 데이터 조작 I  (0) 2019.08.12
R에서 사용하는 제어문, 함수, 그에따른 연산  (0) 2019.08.12
R에서 사용하는 변수  (0) 2019.08.12

R  데이터 Plot 

 

  1. 기본이 되는 시각화 툴, graphics

    1. 사용전에 데이터 셋 가져오기: data(dataset이름) -> global enviroment에 저장

      1. data(mlbench) 불러오자, mlbench -> 데이터 데모 목적

      2. ? 데이터셋: 데이터셋이 어떻게 구성되어있는지 설명

    2. 기본 사용법

      1. plot(데이터,데이터)

  2. 그래프 내부를 예쁘게 만들기

    1.  축 이름 설정하기

      1. xlab, ylab=’이름’

    2. 그래프 이름

      1. main=’Ozone’

    3. 점 모양

      1. pch는 plotting characters

      2. pch= 숫자, 혹은 원하는 심볼 ‘x’

    4. 점 크기

      1. cex = 1 ’default’

    5. 점 색상

      1. colors() 함수를 사용해 적용가능 색상을 검색 가능

      2. col=’red’

    6. 좌표축 값 설정

      1. xlim, ylim = c(최솟값, 최댓값)

    7. jitter: 데이터 겹치지 않게 하지

      1. 같은 값 위에 여러값이 존재하면 이를 겹치지 않게 보기위해 함수를 사용

    8. 범례, legend()

      1. legend(‘위치’, legend=c(‘이름’,’이름’),pch=c(‘’,’’), cex=0.8, col=c(‘black’,’red’),bg=’grey’)

  3. 데이터 위에 선,점 그리고 도형 그리기

    1. plot을 선으로 하고 싶을 때, 혹은 ‘o’로 하고 싶을 때

      1. plot(cars, type =’1’ or ‘o’, cex= 0.5)

      2. 한 축의 값이 여러개인게 거슬린다?

        1. tapply로 x축에대해 y축 값으 평균낸다

        2. ex) x<-tapply(x축, y축, mean)

        3. plot(x, type=’o’)

    2. points(): 데이터 점을 덧 그리기

      1. plot()시행하고 points를 하면 원래 창에 점을 덧 그릴 수 있음

      2. 없는 데이터 위에 points()함수를 사용하고 싶다면

        1. type=’n’으로 해서 plot()을 사용

    3. lines(): 데이터 선을 덧 그리기

      1. points()와 비슷한 함수

      2. 비모수적 회귀분석

        1. lowess(데이터): 회귀분석 시행

        2. 그 외의 함수: loess(), ksmooth(), smooth.spline(),earth() 등

    4. abline(): 직선그리기

      1. a= 기울기, b= x계수/ 혹은 y= h, x=v도 가능

    5. curve(함수, 함수식, 범위): lines와 다르게 함수식이 맨 앞에 나와서 바로 적용 가능

    6. polygon()

      1. x<-c(x데이터, x데이터의 끝 값, rev(x 데이터), x데이터의 첫값)

      2. y<-c(y데이터, y데이터의 끝 값, rev(y 데이터), y데이터의 첫값)

      3. polygon(x,y)

    7. text()

      1. 우선 데이터를 plot()

      2. 그 데이터의 값을 순서대로 text표시 가능: text(x좌표, y좌표, pos=데이터 주변에 어디에 표시할지, 예를들면 1= 밑, 2=왼쪽 등)

  4. 행렬 데이터 그리기: matplot()/ matlines()/ matpoints()

    1. matplot(x데이터, 행렬y (내부에는 컬럼이 여러개 있음))

  5. 그래프상에 그려진 데이터 식별

    1. 데이터를 우선 그리기

      1. plot(cars)

    2. identify(그래프의 x데이터, 그래프의 y데이터) 식별해주기

      1. identify(cars$speed, cars$dist)

    3. 그래프위에 점을 찍으면 주변 데이터를 표시해줌

  6. 여러 데이터 그리기

    1. par사용: 여러 그래프 함수를 사용할 수 있도록 그래픽 인수를 설정하고 조회하는 함수

      1. 객체 <-par(mfrow=c(1,2))

      2. plot(), plot(): 플랏을 각각 한번씩 별개로 시행하고, par(opar) 수행

 

'R > 기초' 카테고리의 다른 글

R 새로운 종류의 Plot  (0) 2019.08.13
R 데이터 조작 II  (0) 2019.08.13
R 데이터 조작 I  (0) 2019.08.12
R에서 사용하는 제어문, 함수, 그에따른 연산  (0) 2019.08.12
R에서 사용하는 변수  (0) 2019.08.12

+ Recent posts