데이터가 주어졌을 때 가장먼저 해야할일은 데이터의 전반적인 구조를 파악하는 것입니다.
데이터를 파악할 때 사용하는 함수들로 주로 아래 여섯가지가 사용됩니다.
head() : 데이터 앞부분 출력
tail() : 데이터 뒷부분 출력
view() : 뷰어창에서 데이터 확인
dim() : 데이터 차원 출력
str() : 데이터 속성 출력
summary() : 요약 통계량 출력
exam <- read.csv("csv_exam.csv")
exam
앞서 csv_exam.csv파일을 read.csv로 읽어왔다.
head(exam)
head()함수를 이용하면 데이터의 앞에서 여섯번째 행까지 출력해준다.
head(exam, 10)
이런식으로 변형을 줄 수 있다.
tail(exam, 10)
tail 함수역시 마찬가지이다.
dim() 함수를 이용하면 데이터 프레임의 행과 열 수를 알 수 있다.
dim(exam)
str() 함수를 이용하면 데이터에 들어있는 변수들의 속성을 보여준다.
모든 변수들의 속성을 한번에 파악할 때 사용한다.
str(exam)
20개의 관측치(obs), 5개의 변수(var)
$변수명과 그 변수에 들어가있는 값을 보여준다.
summary() 함수를 이용하면 데이터를 구성하는 변수들의 요약통계값을 알 수 있다.
summary(exam)
Min. 은 가장 작은 값
1st Qu. 는 1사분위수. 하위 25%에 해당하는 값
Median 은 중앙 값
Mean은 평균
3rd Qu.는 3사분위수. 하위 75%에 해당하는 값 (상위 25%)
Max는 최대값
예제) mpg데이터 파악하기
보기는 View() 함수
패키지에 들어있는 변수는 ?mpg와 같은 식으로 도움을 받을 수 있다.
'📊 R 데이터 분석' 카테고리의 다른 글
데이터 분석을 위한 R수업 <3차시 ④: 파생변수 만들기> (3) | 2024.10.05 |
---|---|
데이터 분석을 위한 R수업 <3차시 ③: 변수명 바꾸기> (0) | 2024.10.05 |
데이터 분석을 위한 R수업 <3차시 ①: 데이터 프레임> (12) | 2024.10.05 |
데이터 분석을 위한 R수업 <2차시 : 변수> (1) | 2024.10.03 |
데이터 분석을 위한 R수업 <1차시 : ggplot2> (7) | 2024.10.03 |
댓글