R10 데이터 분석을 위한 R수업 <4차시 ②: 데이터 합치기> 데이터 분석을 위한 R수업 06-1 데이터 전처리 - 원하는 형태로 데이터 가공하기06-2 조건에 맞는 데이터만 추출하기06-3 필요한 변수만 추출하기06-4 순서대로 정렬하기06-5 파생변수 추가하기06-6 집단별로 요약하기06-7 데이터 합치기 06-1 데이터 전처리 - 원하는 형태로 데이터 가공하기dplyr은 데이터 전처리에 가장 많이 사용되는 패키지 입니다. dplyr 함수filter() 행 추출select() 열(변수) 추출arrange() 정렬mutate() 변수추가summarise() 통계치 산출group_by() 집단별로 나누기left_join() 데이터 합치기(열)bind_rows() 데이터 합치기(행) 06-7 데이터 합치기 가로로 합치기 left_join() #중간고사 데이터 생성.. 📊 R 데이터 분석 2024. 10. 19. 데이터 분석을 위한 R수업 <4차시 ①: dplyr 활용> 데이터 분석을 위한 R수업 06-1 데이터 전처리 - 원하는 형태로 데이터 가공하기06-2 조건에 맞는 데이터만 추출하기06-3 필요한 변수만 추출하기06-4 순서대로 정렬하기06-5 파생변수 추가하기06-6 집단별로 요약하기06-7 데이터 합치기 06-1 데이터 전처리 - 원하는 형태로 데이터 가공하기 dplyr은 데이터 전처리에 가장 많이 사용되는 패키지 입니다. dplyr 함수filter() 행 추출select() 열(변수) 추출arrange() 정렬mutate() 변수추가summarise() 통계치 산출group_by() 집단별로 나누기left_join() 데이터 합치기(열)bind_rows() 데이터 합치기(행) 06-2 조건에 맞는 데이터만 추출하기 library(dplyr)exam .. 📊 R 데이터 분석 2024. 10. 19. 2024 변호사 시험 기수별 응시자 · 합격자 정보 library(ggplot2)# 데이터 입력data 📊 R 데이터 분석 2024. 10. 10. 데이터 분석을 위한 R수업 <3차시 ④: 파생변수 만들기> 실습용 데이터를 우선 만들어보자.df var1과 var2의 2변수로 만들어진 dataframe이다.이때 var1값과 var2값을 더한 var_sum이라는 변수를 만들어 df에 추가해보겠다. df 변수에 $변수명을 입력하고 df$var_sum ggplot2에 들어있는 mpg 데잍에는 도시연비를 의미하는 cty 변수와 고속도로 엽니를 의미하는 hwy 변수가 있다.이 둘의 평균 변수인 total을 만들어보겠다. mpg$total 변수를 조합할 수도 있지만 함수를 이용해서 파생변수를 만들 수도 있다.summary() 함수로 total 변수를 살펴보자summary(mpg$total)hist() 함수를 이용하면 히스토그램으로 볼 수 있다.이 히스토그램으로 부터 다음을 알 수 있다.평균과 중앙값이 20이.. 📊 R 데이터 분석 2024. 10. 5. 데이터 분석을 위한 R수업 <3차시 ③: 변수명 바꾸기> dplyr 패키지의 rename() 함수를 이용해 변수명을 바꿀 수 있다. 먼저 실습에 사용할 데이터 프레임을 만든다.df_raw rename() 함수를 이용하기 위해 dplyr 패키지를 설치한다. install.packages("dplyr")library(dplyr)packages 창에서 dplyr에 체크가 되있는 걸 확인한다. 변수명을 바꾸기 전에 데이터프레임 복사본을 만들겠다. df_new df_new의 var2 변수명을 v2로 바꾸겠다.df_new dplyr 패키지에 대한 설명 R의 dplyr 패키지는 데이터 조작을 간편하고 효율적으로 할 수 있게 해주는 패키지로, 특히 데이터 프레임을 다루는 데 매우 유용합니다. dplyr은 명확하고 직관적인 문법을 사용하여 데이터를 필터링하고, 변형.. 📊 R 데이터 분석 2024. 10. 5. 데이터 분석을 위한 R수업 <3차시 ②: 데이터 다루기> 데이터가 주어졌을 때 가장먼저 해야할일은 데이터의 전반적인 구조를 파악하는 것입니다. 데이터를 파악할 때 사용하는 함수들로 주로 아래 여섯가지가 사용됩니다. head() : 데이터 앞부분 출력tail() : 데이터 뒷부분 출력view() : 뷰어창에서 데이터 확인dim() : 데이터 차원 출력str() : 데이터 속성 출력summary() : 요약 통계량 출력 exam 앞서 csv_exam.csv파일을 read.csv로 읽어왔다. head(exam)head()함수를 이용하면 데이터의 앞에서 여섯번째 행까지 출력해준다. head(exam, 10) 이런식으로 변형을 줄 수 있다. tail(exam, 10) tail 함수역시 마찬가지이다. dim() 함수를 이용하면 데이터 프레임의 행과 열 수를 알 수 있다.. 📊 R 데이터 분석 2024. 10. 5. 데이터 분석을 위한 R수업 <3차시 ①: 데이터 프레임> 데이터 프레임 이해하기 열은 속성을 나타낸다.행은 한 사람의 정보를 나타낸다. 한 명에 대한 데이터는 가로 한 줄에 나타난다.데이터가 크다는 것은 행이 많거나 열이 많다는 것이다. - 행이 많을 경우 컴퓨터가 느려진다. - 열이 많을 경우 분석 방법의 한계를 갖는다. (여러 변수의 영향을 고려하기 어려워진다.) 데이터 분석의 가치는 어떤 현상이 조건에 따라 달라진다는 사실을 발견할 때 생겨난다.ex) 특정 날씨에 어떤 음식이 더 많이 팔린다.ex) 어떤 모양의 돌에서 교통사고가 많이 발생한다. 영어점수수학점수90508060601007020 다음과 같은 데이터 프레임을 만들어보겠다. 우선 학생 네명의 영어점수와 수학점수를 담은 변수를 각각 만든다.combine()함수를 이용한다. english 데이터 .. 📊 R 데이터 분석 2024. 10. 5. 데이터 분석을 위한 R수업 <2차시 : 변수> 데이터 분석을 위한 R수업 작성일 2024년 10월 3일 3-1a a라는 변수에 1이라는 값을 넣는 명령어 그리고 a라는 변수의 값을 출력하게 명령하는 것 a a에 1을, b에 2를, c에 3을 넣은 상태에서 변수 a+b+c의 값을 출력하면 6이 나온다. 변수명은 문자, 숫자, 언더바(_)를 조합하여 정할 수 있다. c() 함수를 이용하면 하나의 변수에 여러개의 값을 담을 수 있다. a c(숫자, 숫자, 숫자)를 넣는 방식이 있다. 그리고 연속된 숫자를 넣는 방법으로는 :이 있다. a 이 방법으로도 같은 결과를 얻을 수 있다. c(1:5)는 1부터 5까지 연속된 숫자를 a 변수에 넣어달라는 의미이다. a seq() 함수를 이용할 수도 있다. seq(1, 5)는 1부터 5까지 연속된 값을 a변수에 넣.. 📊 R 데이터 분석 2024. 10. 3. 데이터 분석을 위한 R수업 <1차시 : ggplot2> 수업준비- 2시 30분에 수업 장소 도착하기- 일주일에 4일 공부 권장. 매일 30분씩 하기- 코드는 외우는게 아님- 데이터 분석은 나만의 목표가 있어야 함. 나의 경우에는 시각화가 포인트. (이런 그래프 하나 그려보고 싶어요. 할 필요가 있음.)아래 책의 인포그래픽에서 많은 영감을 받았다.https://www.yes24.com/Product/Goods/6231277 정보는 아름답다 - 예스24아인슈타인은 ‘사고 실험’이라는 시각적 사고를 통해 상대성 이론을 발견했고, 다빈치는 이미지를 중심으로 관찰과 분석을 하여 통합적 관점을 이룩할 수 있었다. 얼마 전 타계한 스티브 잡www.yes24.com 통계나 데이터 분석도 [적정기술]에서 만족해야 함.나만의 적정기술을 찾아야함. A부터 Z까지 배울 생각을 .. 📊 R 데이터 분석 2024. 10. 3. 시그마플롯 SigmaPlot 15.0 체험판 다운로드 시그마플롯 SigmaPlot 15.0 체험판 다운로드업데이트 : 2024-05-18 그래프를 만들기 위해 보통은 Excel, 그리고 R이나 SPSS를 많이 사용하지만, 논문이나 보고서를 위해 시그마플롯 (SigmaPlot)을 사용하는 경우가 많습니다. 최신 버젼은 15.0인데, 한글로 검색했을 때 다운로드 사이트가 많이 나오지만 exe 파일을 제공하기 때문에 꺼림직한 경우가 많습니다. 안에 무엇을 섞어놨을지 모르기 때문입니다. 보고서를 편집하려다가 컴퓨터를 고장낼 수 있기때문에 정품을 사용하는게 가장 좋습니다. 다행히 SigmaPlot의 경우는 체험판 30일을 제공하고 있습니다. grafiti.에서 제공하는 시그마플롯 15.0을 다운받는 방법을 아래에 남깁니다. Free Trial (grafiti.. Class 2024. 5. 18. 이전 1 다음