📊 R 데이터 분석13

2090년까지 장래 한국 인구 예상 "> 작성일 2025-04-06 90-99세까지의 생존률이 상당이 낮은 점을 고려한다면 2060년부터 인구 3000만선이 아슬아슬하다. 구분2020년 (기준)2030년2040년2050년2060년2070년2080년2090년0~9세3,332,8922,400,0002,400,0001,100,0001,100,0001,100,000400,000400,00010~19세4,651,4603,313,8932,385,6002,385,6001,100,0001,100,0001,100,000400,00020~29세6,197,4864,609,2453,281,5032,362,2852,385,6001,100,0001,100,0001,100,00030~39세6,575,5486,118,5014,553,7543,239,5012,362,.. 📊 R 데이터 분석 2025. 4. 6.

겨울철 사고 선박 인명피해율 겨울철은 해양사고, 특히 어선 사고의 위험이 높은 계절입니다. 주요 원인과 특징은 다음과 같습니다:사고 발생 현황최근 5년간(2018-2022년) 겨울철 해양사고 건수는 2,798건으로, 사계절 중 가장 적었습니다[1].그러나 사고 선박 100척당 인명피해율(사망·실종)은 4.8%로 가장 높았습니다[12].겨울철 해양사고 인명피해의 대다수는 안전사고(86명)에서 발생했습니다[14].주요 원인기상 악화강한 풍랑, 폭설, 한파 등 급격한 기상 변화로 인한 위험 증가[4].북서풍이 부는 겨울과 초봄에는 바람이 강하고 파도가 높아 침수, 침몰 위험이 높아집니다[11].화재 및 폭발 위험겨울철 선박 화재·폭발 사고 발생률이 5.6%로 가장 높습니다[14].주요 원인은 기관·화기 등의 취급 불량(43.9%), 기계.. 📊 R 데이터 분석 2025. 2. 12.

다른 나라보다 높은 한국의 자살률 한국의 자살률은 다른 국가들에 비해 매우 높은 수준입니다. 구체적으로 살펴보면:OECD 국가 중 압도적 1위한국의 자살률은 경제협력개발기구(OECD) 회원국 중 압도적인 1위를 기록하고 있습니다[1][5]. 2023년 기준 한국의 연령표준화 자살률은 인구 10만 명당 24.8명으로, OECD 평균인 10.7명의 2배가 넘는 수치입니다[5][16].다른 국가들과의 비교한국의 자살률(24.8명)은 OECD 평균(10.7명)의 2.3배에 달합니다[5][16].2위인 리투아니아(17.1명)와 비교해도 한국의 자살률이 훨씬 높습니다[5].일본(16.8명), 미국(11.1명) 등 다른 선진국들과 비교해도 한국의 자살률이 현저히 높습니다[8].연령대별 특징노인 자살률의 경우 격차가 더욱 두드러집니다:한국 65세 이상.. 📊 R 데이터 분석 2025. 1. 16.

나스닥과 S&P 500 추종 ETF 비교 (QQQ VS SPLG) 나스닥과 S&P 500 추종 ETF 비교 (QQQ VS SPLG) 나스닥 100 ETF가 S&P 500 ETF보다 장기적으로 더 높은 수익률을 보여왔습니다. 하지만 이는 더 높은 변동성과 위험을 동반합니다.수익률 비교나스닥 100 지수와 S&P 500 지수의 장기 수익률을 비교해보면:지난 15년간 나스닥 100은 연평균 약 16%의 수익률을 기록한 반면, S&P 500은 약 8%의 수익률을 기록했습니다[1].2008년 1월 1일부터 2019년 6월 28일까지 나스닥 100 TR 지수는 누적 수익률 315%, 연평균 수익률 13%를 기록했습니다. 같은 기간 S&P 500 TR 지수는 누적 수익률 156%, 연평균 수익률 9%를 기록했습니다[3].1957년 이후 S&P 500의 역사적 연평균 수익률은 약 1.. 📊 R 데이터 분석 2024. 11. 8.

데이터 분석을 위한 R수업 <4차시 ②: 데이터 합치기> 데이터 분석을 위한 R수업 06-1 데이터 전처리 - 원하는 형태로 데이터 가공하기06-2 조건에 맞는 데이터만 추출하기06-3 필요한 변수만 추출하기06-4 순서대로 정렬하기06-5 파생변수 추가하기06-6 집단별로 요약하기06-7 데이터 합치기 06-1 데이터 전처리 - 원하는 형태로 데이터 가공하기dplyr은 데이터 전처리에 가장 많이 사용되는 패키지 입니다. dplyr 함수filter() 행 추출select() 열(변수) 추출arrange() 정렬mutate() 변수추가summarise() 통계치 산출group_by() 집단별로 나누기left_join() 데이터 합치기(열)bind_rows() 데이터 합치기(행) 06-7 데이터 합치기 가로로 합치기 left_join() #중간고사 데이터 생성.. 📊 R 데이터 분석 2024. 10. 19.

데이터 분석을 위한 R수업 <4차시 ①: dplyr 활용> 데이터 분석을 위한 R수업 06-1 데이터 전처리 - 원하는 형태로 데이터 가공하기06-2 조건에 맞는 데이터만 추출하기06-3 필요한 변수만 추출하기06-4 순서대로 정렬하기06-5 파생변수 추가하기06-6 집단별로 요약하기06-7 데이터 합치기 06-1 데이터 전처리 - 원하는 형태로 데이터 가공하기 dplyr은 데이터 전처리에 가장 많이 사용되는 패키지 입니다. dplyr 함수filter() 행 추출select() 열(변수) 추출arrange() 정렬mutate() 변수추가summarise() 통계치 산출group_by() 집단별로 나누기left_join() 데이터 합치기(열)bind_rows() 데이터 합치기(행) 06-2 조건에 맞는 데이터만 추출하기 library(dplyr)exam .. 📊 R 데이터 분석 2024. 10. 19.

2024 변호사 시험 기수별 응시자 · 합격자 정보 library(ggplot2)# 데이터 입력data 📊 R 데이터 분석 2024. 10. 10.

데이터 분석을 위한 R수업 <3차시 ④: 파생변수 만들기> 실습용 데이터를 우선 만들어보자.df var1과 var2의 2변수로 만들어진 dataframe이다.이때 var1값과 var2값을 더한 var_sum이라는 변수를 만들어 df에 추가해보겠다. df 변수에 $변수명을 입력하고 df$var_sum ggplot2에 들어있는 mpg 데잍에는 도시연비를 의미하는 cty 변수와 고속도로 엽니를 의미하는 hwy 변수가 있다.이 둘의 평균 변수인 total을 만들어보겠다. mpg$total 변수를 조합할 수도 있지만 함수를 이용해서 파생변수를 만들 수도 있다.summary() 함수로 total 변수를 살펴보자summary(mpg$total)hist() 함수를 이용하면 히스토그램으로 볼 수 있다.이 히스토그램으로 부터 다음을 알 수 있다.평균과 중앙값이 20이.. 📊 R 데이터 분석 2024. 10. 5.

데이터 분석을 위한 R수업 <3차시 ③: 변수명 바꾸기> dplyr 패키지의 rename() 함수를 이용해 변수명을 바꿀 수 있다. 먼저 실습에 사용할 데이터 프레임을 만든다.df_raw rename() 함수를 이용하기 위해 dplyr 패키지를 설치한다. install.packages("dplyr")library(dplyr)packages 창에서 dplyr에 체크가 되있는 걸 확인한다. 변수명을 바꾸기 전에 데이터프레임 복사본을 만들겠다. df_new df_new의 var2 변수명을 v2로 바꾸겠다.df_new dplyr 패키지에 대한 설명 R의 dplyr 패키지는 데이터 조작을 간편하고 효율적으로 할 수 있게 해주는 패키지로, 특히 데이터 프레임을 다루는 데 매우 유용합니다. dplyr은 명확하고 직관적인 문법을 사용하여 데이터를 필터링하고, 변형.. 📊 R 데이터 분석 2024. 10. 5.

데이터 분석을 위한 R수업 <3차시 ②: 데이터 다루기> 데이터가 주어졌을 때 가장먼저 해야할일은 데이터의 전반적인 구조를 파악하는 것입니다. 데이터를 파악할 때 사용하는 함수들로 주로 아래 여섯가지가 사용됩니다. head() : 데이터 앞부분 출력tail() : 데이터 뒷부분 출력view() : 뷰어창에서 데이터 확인dim() : 데이터 차원 출력str() : 데이터 속성 출력summary() : 요약 통계량 출력 exam 앞서 csv_exam.csv파일을 read.csv로 읽어왔다. head(exam)head()함수를 이용하면 데이터의 앞에서 여섯번째 행까지 출력해준다. head(exam, 10) 이런식으로 변형을 줄 수 있다. tail(exam, 10) tail 함수역시 마찬가지이다. dim() 함수를 이용하면 데이터 프레임의 행과 열 수를 알 수 있다.. 📊 R 데이터 분석 2024. 10. 5.

데이터 분석을 위한 R수업 <3차시 ①: 데이터 프레임> 데이터 프레임 이해하기 열은 속성을 나타낸다.행은 한 사람의 정보를 나타낸다. 한 명에 대한 데이터는 가로 한 줄에 나타난다.데이터가 크다는 것은 행이 많거나 열이 많다는 것이다. - 행이 많을 경우 컴퓨터가 느려진다. - 열이 많을 경우 분석 방법의 한계를 갖는다. (여러 변수의 영향을 고려하기 어려워진다.) 데이터 분석의 가치는 어떤 현상이 조건에 따라 달라진다는 사실을 발견할 때 생겨난다.ex) 특정 날씨에 어떤 음식이 더 많이 팔린다.ex) 어떤 모양의 돌에서 교통사고가 많이 발생한다. 영어점수수학점수90508060601007020 다음과 같은 데이터 프레임을 만들어보겠다. 우선 학생 네명의 영어점수와 수학점수를 담은 변수를 각각 만든다.combine()함수를 이용한다. english 데이터 .. 📊 R 데이터 분석 2024. 10. 5.

데이터 분석을 위한 R수업 <2차시 : 변수> 데이터 분석을 위한 R수업 작성일 2024년 10월 3일 3-1a a라는 변수에 1이라는 값을 넣는 명령어 그리고 a라는 변수의 값을 출력하게 명령하는 것 a a에 1을, b에 2를, c에 3을 넣은 상태에서 변수 a+b+c의 값을 출력하면 6이 나온다. 변수명은 문자, 숫자, 언더바(_)를 조합하여 정할 수 있다. c() 함수를 이용하면 하나의 변수에 여러개의 값을 담을 수 있다. a c(숫자, 숫자, 숫자)를 넣는 방식이 있다. 그리고 연속된 숫자를 넣는 방법으로는 :이 있다. a 이 방법으로도 같은 결과를 얻을 수 있다. c(1:5)는 1부터 5까지 연속된 숫자를 a 변수에 넣어달라는 의미이다. a seq() 함수를 이용할 수도 있다. seq(1, 5)는 1부터 5까지 연속된 값을 a변수에 넣.. 📊 R 데이터 분석 2024. 10. 3.

이전 1 2 다음

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

📊 R 데이터 분석13

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역