📊 R 데이터 분석11 다른 나라보다 높은 한국의 자살률 한국의 자살률은 다른 국가들에 비해 매우 높은 수준입니다. 구체적으로 살펴보면:OECD 국가 중 압도적 1위한국의 자살률은 경제협력개발기구(OECD) 회원국 중 압도적인 1위를 기록하고 있습니다[1][5]. 2023년 기준 한국의 연령표준화 자살률은 인구 10만 명당 24.8명으로, OECD 평균인 10.7명의 2배가 넘는 수치입니다[5][16].다른 국가들과의 비교한국의 자살률(24.8명)은 OECD 평균(10.7명)의 2.3배에 달합니다[5][16].2위인 리투아니아(17.1명)와 비교해도 한국의 자살률이 훨씬 높습니다[5].일본(16.8명), 미국(11.1명) 등 다른 선진국들과 비교해도 한국의 자살률이 현저히 높습니다[8].연령대별 특징노인 자살률의 경우 격차가 더욱 두드러집니다:한국 65세 이상.. 📊 R 데이터 분석 2025. 1. 16. 나스닥과 S&P 500 추종 ETF 비교 (QQQ VS SPLG) 나스닥과 S&P 500 추종 ETF 비교 (QQQ VS SPLG) 나스닥 100 ETF가 S&P 500 ETF보다 장기적으로 더 높은 수익률을 보여왔습니다. 하지만 이는 더 높은 변동성과 위험을 동반합니다.수익률 비교나스닥 100 지수와 S&P 500 지수의 장기 수익률을 비교해보면:지난 15년간 나스닥 100은 연평균 약 16%의 수익률을 기록한 반면, S&P 500은 약 8%의 수익률을 기록했습니다[1].2008년 1월 1일부터 2019년 6월 28일까지 나스닥 100 TR 지수는 누적 수익률 315%, 연평균 수익률 13%를 기록했습니다. 같은 기간 S&P 500 TR 지수는 누적 수익률 156%, 연평균 수익률 9%를 기록했습니다[3].1957년 이후 S&P 500의 역사적 연평균 수익률은 약 1.. 📊 R 데이터 분석 2024. 11. 8. 데이터 분석을 위한 R수업 <4차시 ②: 데이터 합치기> 데이터 분석을 위한 R수업 06-1 데이터 전처리 - 원하는 형태로 데이터 가공하기06-2 조건에 맞는 데이터만 추출하기06-3 필요한 변수만 추출하기06-4 순서대로 정렬하기06-5 파생변수 추가하기06-6 집단별로 요약하기06-7 데이터 합치기 06-1 데이터 전처리 - 원하는 형태로 데이터 가공하기dplyr은 데이터 전처리에 가장 많이 사용되는 패키지 입니다. dplyr 함수filter() 행 추출select() 열(변수) 추출arrange() 정렬mutate() 변수추가summarise() 통계치 산출group_by() 집단별로 나누기left_join() 데이터 합치기(열)bind_rows() 데이터 합치기(행) 06-7 데이터 합치기 가로로 합치기 left_join() #중간고사 데이터 생성.. 📊 R 데이터 분석 2024. 10. 19. 데이터 분석을 위한 R수업 <4차시 ①: dplyr 활용> 데이터 분석을 위한 R수업 06-1 데이터 전처리 - 원하는 형태로 데이터 가공하기06-2 조건에 맞는 데이터만 추출하기06-3 필요한 변수만 추출하기06-4 순서대로 정렬하기06-5 파생변수 추가하기06-6 집단별로 요약하기06-7 데이터 합치기 06-1 데이터 전처리 - 원하는 형태로 데이터 가공하기 dplyr은 데이터 전처리에 가장 많이 사용되는 패키지 입니다. dplyr 함수filter() 행 추출select() 열(변수) 추출arrange() 정렬mutate() 변수추가summarise() 통계치 산출group_by() 집단별로 나누기left_join() 데이터 합치기(열)bind_rows() 데이터 합치기(행) 06-2 조건에 맞는 데이터만 추출하기 library(dplyr)exam .. 📊 R 데이터 분석 2024. 10. 19. 2024 변호사 시험 기수별 응시자 · 합격자 정보 library(ggplot2)# 데이터 입력data 📊 R 데이터 분석 2024. 10. 10. 데이터 분석을 위한 R수업 <3차시 ④: 파생변수 만들기> 실습용 데이터를 우선 만들어보자.df var1과 var2의 2변수로 만들어진 dataframe이다.이때 var1값과 var2값을 더한 var_sum이라는 변수를 만들어 df에 추가해보겠다. df 변수에 $변수명을 입력하고 df$var_sum ggplot2에 들어있는 mpg 데잍에는 도시연비를 의미하는 cty 변수와 고속도로 엽니를 의미하는 hwy 변수가 있다.이 둘의 평균 변수인 total을 만들어보겠다. mpg$total 변수를 조합할 수도 있지만 함수를 이용해서 파생변수를 만들 수도 있다.summary() 함수로 total 변수를 살펴보자summary(mpg$total)hist() 함수를 이용하면 히스토그램으로 볼 수 있다.이 히스토그램으로 부터 다음을 알 수 있다.평균과 중앙값이 20이.. 📊 R 데이터 분석 2024. 10. 5. 데이터 분석을 위한 R수업 <3차시 ③: 변수명 바꾸기> dplyr 패키지의 rename() 함수를 이용해 변수명을 바꿀 수 있다. 먼저 실습에 사용할 데이터 프레임을 만든다.df_raw rename() 함수를 이용하기 위해 dplyr 패키지를 설치한다. install.packages("dplyr")library(dplyr)packages 창에서 dplyr에 체크가 되있는 걸 확인한다. 변수명을 바꾸기 전에 데이터프레임 복사본을 만들겠다. df_new df_new의 var2 변수명을 v2로 바꾸겠다.df_new dplyr 패키지에 대한 설명 R의 dplyr 패키지는 데이터 조작을 간편하고 효율적으로 할 수 있게 해주는 패키지로, 특히 데이터 프레임을 다루는 데 매우 유용합니다. dplyr은 명확하고 직관적인 문법을 사용하여 데이터를 필터링하고, 변형.. 📊 R 데이터 분석 2024. 10. 5. 데이터 분석을 위한 R수업 <3차시 ②: 데이터 다루기> 데이터가 주어졌을 때 가장먼저 해야할일은 데이터의 전반적인 구조를 파악하는 것입니다. 데이터를 파악할 때 사용하는 함수들로 주로 아래 여섯가지가 사용됩니다. head() : 데이터 앞부분 출력tail() : 데이터 뒷부분 출력view() : 뷰어창에서 데이터 확인dim() : 데이터 차원 출력str() : 데이터 속성 출력summary() : 요약 통계량 출력 exam 앞서 csv_exam.csv파일을 read.csv로 읽어왔다. head(exam)head()함수를 이용하면 데이터의 앞에서 여섯번째 행까지 출력해준다. head(exam, 10) 이런식으로 변형을 줄 수 있다. tail(exam, 10) tail 함수역시 마찬가지이다. dim() 함수를 이용하면 데이터 프레임의 행과 열 수를 알 수 있다.. 📊 R 데이터 분석 2024. 10. 5. 데이터 분석을 위한 R수업 <3차시 ①: 데이터 프레임> 데이터 프레임 이해하기 열은 속성을 나타낸다.행은 한 사람의 정보를 나타낸다. 한 명에 대한 데이터는 가로 한 줄에 나타난다.데이터가 크다는 것은 행이 많거나 열이 많다는 것이다. - 행이 많을 경우 컴퓨터가 느려진다. - 열이 많을 경우 분석 방법의 한계를 갖는다. (여러 변수의 영향을 고려하기 어려워진다.) 데이터 분석의 가치는 어떤 현상이 조건에 따라 달라진다는 사실을 발견할 때 생겨난다.ex) 특정 날씨에 어떤 음식이 더 많이 팔린다.ex) 어떤 모양의 돌에서 교통사고가 많이 발생한다. 영어점수수학점수90508060601007020 다음과 같은 데이터 프레임을 만들어보겠다. 우선 학생 네명의 영어점수와 수학점수를 담은 변수를 각각 만든다.combine()함수를 이용한다. english 데이터 .. 📊 R 데이터 분석 2024. 10. 5. 데이터 분석을 위한 R수업 <2차시 : 변수> 데이터 분석을 위한 R수업 작성일 2024년 10월 3일 3-1a a라는 변수에 1이라는 값을 넣는 명령어 그리고 a라는 변수의 값을 출력하게 명령하는 것 a a에 1을, b에 2를, c에 3을 넣은 상태에서 변수 a+b+c의 값을 출력하면 6이 나온다. 변수명은 문자, 숫자, 언더바(_)를 조합하여 정할 수 있다. c() 함수를 이용하면 하나의 변수에 여러개의 값을 담을 수 있다. a c(숫자, 숫자, 숫자)를 넣는 방식이 있다. 그리고 연속된 숫자를 넣는 방법으로는 :이 있다. a 이 방법으로도 같은 결과를 얻을 수 있다. c(1:5)는 1부터 5까지 연속된 숫자를 a 변수에 넣어달라는 의미이다. a seq() 함수를 이용할 수도 있다. seq(1, 5)는 1부터 5까지 연속된 값을 a변수에 넣.. 📊 R 데이터 분석 2024. 10. 3. 데이터 분석을 위한 R수업 <1차시 : ggplot2> 수업준비- 2시 30분에 수업 장소 도착하기- 일주일에 4일 공부 권장. 매일 30분씩 하기- 코드는 외우는게 아님- 데이터 분석은 나만의 목표가 있어야 함. 나의 경우에는 시각화가 포인트. (이런 그래프 하나 그려보고 싶어요. 할 필요가 있음.)아래 책의 인포그래픽에서 많은 영감을 받았다.https://www.yes24.com/Product/Goods/6231277 정보는 아름답다 - 예스24아인슈타인은 ‘사고 실험’이라는 시각적 사고를 통해 상대성 이론을 발견했고, 다빈치는 이미지를 중심으로 관찰과 분석을 하여 통합적 관점을 이룩할 수 있었다. 얼마 전 타계한 스티브 잡www.yes24.com 통계나 데이터 분석도 [적정기술]에서 만족해야 함.나만의 적정기술을 찾아야함. A부터 Z까지 배울 생각을 .. 📊 R 데이터 분석 2024. 10. 3. 이전 1 다음