데이터 분석을 위한 R수업 <4차시 ②: 데이터 합치기>

2024. 10. 19. 20:54·📊 R & 데이터 분석
반응형

데이터 분석을 위한 R수업 <4차시 ②: dplyr 활용>

 

06-1 데이터 전처리 - 원하는 형태로 데이터 가공하기

06-2 조건에 맞는 데이터만 추출하기

06-3 필요한 변수만 추출하기

06-4 순서대로 정렬하기

06-5 파생변수 추가하기

06-6 집단별로 요약하기

06-7 데이터 합치기

 

06-1 데이터 전처리 - 원하는 형태로 데이터 가공하기

dplyr은 데이터 전처리에 가장 많이 사용되는 패키지 입니다.

 

dplyr 함수

filter() 행 추출

select() 열(변수) 추출

arrange() 정렬

mutate() 변수추가

summarise() 통계치 산출

group_by() 집단별로 나누기

left_join() 데이터 합치기(열)

bind_rows() 데이터 합치기(행)

 

06-7 데이터 합치기

 

가로로 합치기 left_join()

 

#중간고사 데이터 생성
test1 <- data.frame(id = c(1, 2, 3, 4, 5),
                   midterm = c(60, 80, 70, 90, 85))

#기말고사 데이터 생성
test2 <- data.frame(id = c(1, 2, 3, 4, 5),
                    final = c(70, 83, 65, 95, 80))

test1
test2

 

total <- left_join(test1, test2, by = "id") # id를 기준으로 합쳐 total에 할당
total

 

left_join(test1, test2, by = "id") # id를 기준으로 합쳐 total에 할당

left_join

left_join()을 이용하면 특정 변수의 값을 기준으로 다른 데이터의 값을 추가할 수 있다.

 

name <- data.frame(class = c(1, 2, 3, 4, 5),
                   teacher = c("kim", "lee", "park", "choi", "jung"))
name

 

앞에있던 exam 변수와 함께 class를 기준으로 합쳐보겠다.

exam_new <- left_join(exam, name, by = "class")
exam_new

 

left_join

 

세로로 합치기 bind_row()

 

# 학생 1-5번 시험 데이터 생성
group_a <- data.frame(id = c(1, 2, 3, 4, 5),
                      test = c(60, 80, 70, 90, 85))

# 학생 6-10번 시험 데이터 생성
group_b <- data.frame(id = c(6, 7, 8, 9, 10),
                      test = c(70, 83, 65, 95, 80))

group_a
group_b

 

group_a와 group_b

 

bind_row()을 이용하기

 

group_all <- bind_rows(group_a, group_b)
group_all

 

group_all

반응형
저작자표시 비영리 변경금지 (새창열림)

'📊 R & 데이터 분석' 카테고리의 다른 글

다른 나라보다 높은 한국의 자살률  (1) 2025.01.16
나스닥과 S&P 500 추종 ETF 비교 (QQQ VS SPLG)  (10) 2024.11.08
데이터 분석을 위한 R수업 <4차시 ①: dplyr 활용>  (4) 2024.10.19
2024 변호사 시험 기수별 응시자 · 합격자 정보  (4) 2024.10.10
데이터 분석을 위한 R수업 <3차시 ④: 파생변수 만들기>  (4) 2024.10.05
'📊 R & 데이터 분석' 카테고리의 다른 글
  • 다른 나라보다 높은 한국의 자살률
  • 나스닥과 S&P 500 추종 ETF 비교 (QQQ VS SPLG)
  • 데이터 분석을 위한 R수업 <4차시 ①: dplyr 활용>
  • 2024 변호사 시험 기수별 응시자 · 합격자 정보
해랑(Sea-wave)
해랑(Sea-wave)
관심있는 주제를 작성합니다. 환경·경제·사회·기술 등
  • 해랑(Sea-wave)
    해랑의 디지털 저장소A
    해랑(Sea-wave)
  • 전체
    오늘
    어제
    • 분류 전체보기
      • 🍀 감정 & 자동적 사고
      • 🛒 생활정보
      • 🕵️‍♂️ 법학 및 변호사 준비
      • 📊 R & 데이터 분석
      • 📚 정보스크랩 (Copy & Paste)
      • 🗾 일본어 & 해외생활
      • 💎 경제 이야기
      • 🧑‍🏫 수업 노트
      • 💛 연애와 관계
      • 🧭 미래 설계
      • 📜 역사
      • 🚗 로블록스 & 게임
      • 🧪 자연과학
      • ✅완료한 도전
      • 기술고시
      • 캐드
      • GIS
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    임팩트 컨퍼런스
    일본대사관
    현대차 정몽구재단
    ChatGPT
    현대차 정몽구 재단 임팩트 컨퍼런스
    ONSOWEEK 2023
    JENESYS2025
    학업
    로스쿨
    티스토리챌린지
    데이터분석
    JPOP
    R
    오블완
    온소위크 2023
    홋카이도
    후쿠시마현
    일본
    변호사시험
    한국
    현대차 정몽구 스칼라십
    후쿠시마
    1학년 1학기
    삿포로
    현대차정몽구재단 2023
    성적
    챗gpt
    일한문화교류기금
    온드림소사이어티
    한국청년방일단
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.5
해랑(Sea-wave)
데이터 분석을 위한 R수업 <4차시 ②: 데이터 합치기>
상단으로

티스토리툴바