📊 R 데이터 분석7 2024 변호사 시험 기수별 응시자 · 합격자 정보 library(ggplot2)# 데이터 입력data 📊 R 데이터 분석 2024. 10. 10. 데이터 분석을 위한 R수업 <3차시 ④: 파생변수 만들기> 실습용 데이터를 우선 만들어보자.df var1과 var2의 2변수로 만들어진 dataframe이다.이때 var1값과 var2값을 더한 var_sum이라는 변수를 만들어 df에 추가해보겠다. df 변수에 $변수명을 입력하고 df$var_sum ggplot2에 들어있는 mpg 데잍에는 도시연비를 의미하는 cty 변수와 고속도로 엽니를 의미하는 hwy 변수가 있다.이 둘의 평균 변수인 total을 만들어보겠다. mpg$total 변수를 조합할 수도 있지만 함수를 이용해서 파생변수를 만들 수도 있다.summary() 함수로 total 변수를 살펴보자summary(mpg$total)hist() 함수를 이용하면 히스토그램으로 볼 수 있다.이 히스토그램으로 부터 다음을 알 수 있다.평균과 중앙값이 20이.. 📊 R 데이터 분석 2024. 10. 5. 데이터 분석을 위한 R수업 <3차시 ③: 변수명 바꾸기> dplyr 패키지의 rename() 함수를 이용해 변수명을 바꿀 수 있다. 먼저 실습에 사용할 데이터 프레임을 만든다.df_raw rename() 함수를 이용하기 위해 dplyr 패키지를 설치한다. install.packages("dplyr")library(dplyr)packages 창에서 dplyr에 체크가 되있는 걸 확인한다. 변수명을 바꾸기 전에 데이터프레임 복사본을 만들겠다. df_new df_new의 var2 변수명을 v2로 바꾸겠다.df_new dplyr 패키지에 대한 설명 R의 dplyr 패키지는 데이터 조작을 간편하고 효율적으로 할 수 있게 해주는 패키지로, 특히 데이터 프레임을 다루는 데 매우 유용합니다. dplyr은 명확하고 직관적인 문법을 사용하여 데이터를 필터링하고, 변형.. 📊 R 데이터 분석 2024. 10. 5. 데이터 분석을 위한 R수업 <3차시 ②: 데이터 다루기> 데이터가 주어졌을 때 가장먼저 해야할일은 데이터의 전반적인 구조를 파악하는 것입니다. 데이터를 파악할 때 사용하는 함수들로 주로 아래 여섯가지가 사용됩니다. head() : 데이터 앞부분 출력tail() : 데이터 뒷부분 출력view() : 뷰어창에서 데이터 확인dim() : 데이터 차원 출력str() : 데이터 속성 출력summary() : 요약 통계량 출력 exam 앞서 csv_exam.csv파일을 read.csv로 읽어왔다. head(exam)head()함수를 이용하면 데이터의 앞에서 여섯번째 행까지 출력해준다. head(exam, 10) 이런식으로 변형을 줄 수 있다. tail(exam, 10) tail 함수역시 마찬가지이다. dim() 함수를 이용하면 데이터 프레임의 행과 열 수를 알 수 있다.. 📊 R 데이터 분석 2024. 10. 5. 데이터 분석을 위한 R수업 <3차시 ①: 데이터 프레임> 데이터 프레임 이해하기 열은 속성을 나타낸다.행은 한 사람의 정보를 나타낸다. 한 명에 대한 데이터는 가로 한 줄에 나타난다.데이터가 크다는 것은 행이 많거나 열이 많다는 것이다. - 행이 많을 경우 컴퓨터가 느려진다. - 열이 많을 경우 분석 방법의 한계를 갖는다. (여러 변수의 영향을 고려하기 어려워진다.) 데이터 분석의 가치는 어떤 현상이 조건에 따라 달라진다는 사실을 발견할 때 생겨난다.ex) 특정 날씨에 어떤 음식이 더 많이 팔린다.ex) 어떤 모양의 돌에서 교통사고가 많이 발생한다. 영어점수수학점수90508060601007020 다음과 같은 데이터 프레임을 만들어보겠다. 우선 학생 네명의 영어점수와 수학점수를 담은 변수를 각각 만든다.combine()함수를 이용한다. english 데이터 .. 📊 R 데이터 분석 2024. 10. 5. 데이터 분석을 위한 R수업 <2차시 : 변수> 데이터 분석을 위한 R수업 작성일 2024년 10월 3일 3-1a a라는 변수에 1이라는 값을 넣는 명령어 그리고 a라는 변수의 값을 출력하게 명령하는 것 a a에 1을, b에 2를, c에 3을 넣은 상태에서 변수 a+b+c의 값을 출력하면 6이 나온다. 변수명은 문자, 숫자, 언더바(_)를 조합하여 정할 수 있다. c() 함수를 이용하면 하나의 변수에 여러개의 값을 담을 수 있다. a c(숫자, 숫자, 숫자)를 넣는 방식이 있다. 그리고 연속된 숫자를 넣는 방법으로는 :이 있다. a 이 방법으로도 같은 결과를 얻을 수 있다. c(1:5)는 1부터 5까지 연속된 숫자를 a 변수에 넣어달라는 의미이다. a seq() 함수를 이용할 수도 있다. seq(1, 5)는 1부터 5까지 연속된 값을 a변수에 넣.. 📊 R 데이터 분석 2024. 10. 3. 데이터 분석을 위한 R수업 <1차시 : ggplot2> 수업준비- 2시 30분에 수업 장소 도착하기- 일주일에 4일 공부 권장. 매일 30분씩 하기- 코드는 외우는게 아님- 데이터 분석은 나만의 목표가 있어야 함. 나의 경우에는 시각화가 포인트. (이런 그래프 하나 그려보고 싶어요. 할 필요가 있음.)아래 책의 인포그래픽에서 많은 영감을 받았다.https://www.yes24.com/Product/Goods/6231277 정보는 아름답다 - 예스24아인슈타인은 ‘사고 실험’이라는 시각적 사고를 통해 상대성 이론을 발견했고, 다빈치는 이미지를 중심으로 관찰과 분석을 하여 통합적 관점을 이룩할 수 있었다. 얼마 전 타계한 스티브 잡www.yes24.com 통계나 데이터 분석도 [적정기술]에서 만족해야 함.나만의 적정기술을 찾아야함. A부터 Z까지 배울 생각을 .. 📊 R 데이터 분석 2024. 10. 3. 이전 1 다음