R은 뉴질랜드 오클랜드 대학교의 통계학과 교수인 로스 이하카(Ross Ihaka)와 로버트 젠틀맨(Robert Gentleman)이 개발한 데이터 분석 프로그래밍 언어입니다. 상용분석도구인 SPSS, SAS, Minitab, JMP등을 사용하기 위해서는 매우 비싼 비용이 요구됩니다. R은 Open Source로서 무료로 사용할 수 있으며, 누구나 R의 기능을 향상시킬 수 있는 Package를 개발할 수 있다는 장점이 있습니다.
-
정보화사회에서 생성되고 있는 엄청나게 방대하고 종류가 다양한 Big data를 분석하여 그 속에서 가치를 찾는 데이터 사이언스와 전통적인 통계적 데이터분석간의 연결이 요구되고 있습니다.
-
R은 통계분석과 데이터 시각화를 위한 프로그램으로 개발 되었기에 전통적인 통계분석과 데이터사이언스를 연결할 수 있는 연결고리라 할 수 있습니다.
-
모집단으로 부터 일부 추출된 정형의 전통적인 데이터와 빅데이터간에는 어떤 차이점이 있을까요?
-
Volume : 데이터의 사이즈
-
Variety : 데이터의 다양성
-
Velocity : 데이터의 발생 및 처리속도
-
본 교육은 R기반의 빅데이터 전처리, 시각화 및 보고서 작성 등의 기초적인 빅데이터 분석의 내용을 포함합니다. 이를 통해 빅데이터 분석에 대한 기본적인 능력을 배양할 수 있도록 지원합니다.
-
또한, 스마트팩토리 환경에서 생성되는 방대한 데이터를 통해 공정 최적화 및 신제품개발 설계를 할 수 있는 실험계획법(DOE) 실행역량을 배양합니다.
-
Factorial Design, Response Surface Design, Taguchi Method와 같은 전통적인 실험계획법을 소개하고, 머신러닝기법(Logistic Regression, Decision Tree, Random Forest, Support Vector Machine, Neural Network 등)을 이용한 최적화 방법론을 체득할 수 있도록 이론강의와 R 실습이 병행됩니다.