📊 R 데이터 분석

데이터 분석을 위한 R수업 <3차시 ②: 데이터 다루기>

해랑(Sea-wave) 2024. 10. 5.
반응형

데이터가 주어졌을 때 가장먼저 해야할일은 데이터의 전반적인 구조를 파악하는 것입니다.

 

데이터를 파악할 때 사용하는 함수들로 주로 아래 여섯가지가 사용됩니다.

 

head() : 데이터 앞부분 출력

tail() : 데이터 뒷부분 출력

view() : 뷰어창에서 데이터 확인

dim() : 데이터 차원 출력

str() : 데이터 속성 출력

summary() : 요약 통계량 출력

 

exam <- read.csv("csv_exam.csv")
exam

 

앞서 csv_exam.csv파일을 read.csv로 읽어왔다.

 

head(exam)

head() 결과값

head()함수를 이용하면 데이터의 앞에서 여섯번째 행까지 출력해준다.

 

head(exam, 10)

 

이런식으로 변형을 줄 수 있다.

 

tail(exam, 10)

 

tail() 결과값

tail 함수역시 마찬가지이다.

 

dim() 함수를 이용하면 데이터 프레임의 행과 열 수를 알 수 있다.

dim(exam)

20행 5열

str() 함수를 이용하면 데이터에 들어있는 변수들의 속성을 보여준다.

모든 변수들의 속성을 한번에 파악할 때 사용한다.

str(exam)

20개의 관측치(obs), 5개의 변수(var)

$변수명과 그 변수에 들어가있는 값을 보여준다.

summary() 함수를 이용하면 데이터를 구성하는 변수들의 요약통계값을 알 수 있다.

summary(exam)

 

Min. 은 가장 작은 값

1st Qu. 는 1사분위수. 하위 25%에 해당하는 값

Median 은 중앙 값

Mean은 평균

3rd Qu.는 3사분위수. 하위 75%에 해당하는 값 (상위 25%)

Max는 최대값

 


예제) mpg데이터 파악하기

 

보기는 View() 함수

패키지에 들어있는 변수는 ?mpg와 같은 식으로 도움을 받을 수 있다.

 

summary(mpg)

 

반응형

댓글