데이터 분석을 위한 R수업 <3차시 ②: 데이터 다루기>

2024. 10. 5. 19:19·📊 R & 데이터 분석
반응형

데이터가 주어졌을 때 가장먼저 해야할일은 데이터의 전반적인 구조를 파악하는 것입니다.

 

데이터를 파악할 때 사용하는 함수들로 주로 아래 여섯가지가 사용됩니다.

 

head() : 데이터 앞부분 출력

tail() : 데이터 뒷부분 출력

view() : 뷰어창에서 데이터 확인

dim() : 데이터 차원 출력

str() : 데이터 속성 출력

summary() : 요약 통계량 출력

 

exam <- read.csv("csv_exam.csv")
exam

 

앞서 csv_exam.csv파일을 read.csv로 읽어왔다.

 

head(exam)

head() 결과값

head()함수를 이용하면 데이터의 앞에서 여섯번째 행까지 출력해준다.

 

head(exam, 10)

 

이런식으로 변형을 줄 수 있다.

 

tail(exam, 10)

 

tail() 결과값

tail 함수역시 마찬가지이다.

 

dim() 함수를 이용하면 데이터 프레임의 행과 열 수를 알 수 있다.

dim(exam)

20행 5열

str() 함수를 이용하면 데이터에 들어있는 변수들의 속성을 보여준다.

모든 변수들의 속성을 한번에 파악할 때 사용한다.

str(exam)

20개의 관측치(obs), 5개의 변수(var)

$변수명과 그 변수에 들어가있는 값을 보여준다.

summary() 함수를 이용하면 데이터를 구성하는 변수들의 요약통계값을 알 수 있다.

summary(exam)

 

Min. 은 가장 작은 값

1st Qu. 는 1사분위수. 하위 25%에 해당하는 값

Median 은 중앙 값

Mean은 평균

3rd Qu.는 3사분위수. 하위 75%에 해당하는 값 (상위 25%)

Max는 최대값

 


예제) mpg데이터 파악하기

 

보기는 View() 함수

패키지에 들어있는 변수는 ?mpg와 같은 식으로 도움을 받을 수 있다.

 

summary(mpg)

 

반응형
저작자표시 비영리 변경금지 (새창열림)

'📊 R & 데이터 분석' 카테고리의 다른 글

데이터 분석을 위한 R수업 <3차시 ④: 파생변수 만들기>  (4) 2024.10.05
데이터 분석을 위한 R수업 <3차시 ③: 변수명 바꾸기>  (1) 2024.10.05
데이터 분석을 위한 R수업 <3차시 ①: 데이터 프레임>  (13) 2024.10.05
데이터 분석을 위한 R수업 <2차시 : 변수>  (1) 2024.10.03
데이터 분석을 위한 R수업 <1차시 : ggplot2>  (7) 2024.10.03
'📊 R & 데이터 분석' 카테고리의 다른 글
  • 데이터 분석을 위한 R수업 <3차시 ④: 파생변수 만들기>
  • 데이터 분석을 위한 R수업 <3차시 ③: 변수명 바꾸기>
  • 데이터 분석을 위한 R수업 <3차시 ①: 데이터 프레임>
  • 데이터 분석을 위한 R수업 <2차시 : 변수>
해랑(Sea-wave)
해랑(Sea-wave)
관심있는 주제를 작성합니다. 환경·경제·사회·기술 등
  • 해랑(Sea-wave)
    해랑의 디지털 저장소A
    해랑(Sea-wave)
  • 전체
    오늘
    어제
    • 분류 전체보기
      • 🍀 감정 & 자동적 사고
      • 🛒 생활정보
      • 🕵️‍♂️ 법학 및 변호사 준비
      • 📊 R & 데이터 분석
      • 📚 정보스크랩 (Copy & Paste)
      • 🗾 일본어 & 해외생활
      • 💎 경제 이야기
      • 🧑‍🏫 수업 노트
      • 💛 연애와 관계
      • 🧭 미래 설계
      • 📜 역사
      • 🚗 로블록스 & 게임
      • 🧪 자연과학
      • ✅완료한 도전
      • 기술고시
      • 캐드
      • GIS
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    R
    티스토리챌린지
    챗gpt
    후쿠시마
    JPOP
    일본
    성적
    학업
    후쿠시마현
    JENESYS2025
    로스쿨
    현대차 정몽구 스칼라십
    데이터분석
    삿포로
    ONSOWEEK 2023
    일한문화교류기금
    1학년 1학기
    한국청년방일단
    한국
    현대차 정몽구재단
    임팩트 컨퍼런스
    변호사시험
    온소위크 2023
    일본대사관
    온드림소사이어티
    ChatGPT
    현대차 정몽구 재단 임팩트 컨퍼런스
    오블완
    현대차정몽구재단 2023
    홋카이도
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.5
해랑(Sea-wave)
데이터 분석을 위한 R수업 <3차시 ②: 데이터 다루기>
상단으로

티스토리툴바