CSV3 데이터 분석을 위한 R수업 <4차시 ①: dplyr 활용> 데이터 분석을 위한 R수업 06-1 데이터 전처리 - 원하는 형태로 데이터 가공하기06-2 조건에 맞는 데이터만 추출하기06-3 필요한 변수만 추출하기06-4 순서대로 정렬하기06-5 파생변수 추가하기06-6 집단별로 요약하기06-7 데이터 합치기 06-1 데이터 전처리 - 원하는 형태로 데이터 가공하기 dplyr은 데이터 전처리에 가장 많이 사용되는 패키지 입니다. dplyr 함수filter() 행 추출select() 열(변수) 추출arrange() 정렬mutate() 변수추가summarise() 통계치 산출group_by() 집단별로 나누기left_join() 데이터 합치기(열)bind_rows() 데이터 합치기(행) 06-2 조건에 맞는 데이터만 추출하기 library(dplyr)exam .. 📊 R 데이터 분석 2024. 10. 19. 데이터 분석을 위한 R수업 <3차시 ②: 데이터 다루기> 데이터가 주어졌을 때 가장먼저 해야할일은 데이터의 전반적인 구조를 파악하는 것입니다. 데이터를 파악할 때 사용하는 함수들로 주로 아래 여섯가지가 사용됩니다. head() : 데이터 앞부분 출력tail() : 데이터 뒷부분 출력view() : 뷰어창에서 데이터 확인dim() : 데이터 차원 출력str() : 데이터 속성 출력summary() : 요약 통계량 출력 exam 앞서 csv_exam.csv파일을 read.csv로 읽어왔다. head(exam)head()함수를 이용하면 데이터의 앞에서 여섯번째 행까지 출력해준다. head(exam, 10) 이런식으로 변형을 줄 수 있다. tail(exam, 10) tail 함수역시 마찬가지이다. dim() 함수를 이용하면 데이터 프레임의 행과 열 수를 알 수 있다.. 📊 R 데이터 분석 2024. 10. 5. 데이터 분석을 위한 R수업 <3차시 ①: 데이터 프레임> 데이터 프레임 이해하기 열은 속성을 나타낸다.행은 한 사람의 정보를 나타낸다. 한 명에 대한 데이터는 가로 한 줄에 나타난다.데이터가 크다는 것은 행이 많거나 열이 많다는 것이다. - 행이 많을 경우 컴퓨터가 느려진다. - 열이 많을 경우 분석 방법의 한계를 갖는다. (여러 변수의 영향을 고려하기 어려워진다.) 데이터 분석의 가치는 어떤 현상이 조건에 따라 달라진다는 사실을 발견할 때 생겨난다.ex) 특정 날씨에 어떤 음식이 더 많이 팔린다.ex) 어떤 모양의 돌에서 교통사고가 많이 발생한다. 영어점수수학점수90508060601007020 다음과 같은 데이터 프레임을 만들어보겠다. 우선 학생 네명의 영어점수와 수학점수를 담은 변수를 각각 만든다.combine()함수를 이용한다. english 데이터 .. 📊 R 데이터 분석 2024. 10. 5. 이전 1 다음