빅데이터 분석1 데이터 분석을 위한 R수업 <3차시 ④: 파생변수 만들기> 실습용 데이터를 우선 만들어보자.df var1과 var2의 2변수로 만들어진 dataframe이다.이때 var1값과 var2값을 더한 var_sum이라는 변수를 만들어 df에 추가해보겠다. df 변수에 $변수명을 입력하고 df$var_sum ggplot2에 들어있는 mpg 데잍에는 도시연비를 의미하는 cty 변수와 고속도로 엽니를 의미하는 hwy 변수가 있다.이 둘의 평균 변수인 total을 만들어보겠다. mpg$total 변수를 조합할 수도 있지만 함수를 이용해서 파생변수를 만들 수도 있다.summary() 함수로 total 변수를 살펴보자summary(mpg$total)hist() 함수를 이용하면 히스토그램으로 볼 수 있다.이 히스토그램으로 부터 다음을 알 수 있다.평균과 중앙값이 20이.. 📊 R 데이터 분석 2024. 10. 5. 이전 1 다음