빅데이터 분석에 필요한 R프로그램을 배워봅니다.
21회로 구성되어 있으면 데이터분석과 머신러닝의 기본개념을 배워봅니다.
첫회에서는 강의 안내와 머신러닝의 개요에 대해 공부합니다.
2회에서는 명목형 데이터와 수치형 데이터 분류 및 특징 설명합니다.
3회 R프로그램에서는 데이터 중심경향으로 평균, 중앙값, 최빈수 계산을 해봅니다.
4회에서는 데이터 분포분석으로 범위, 사분위수, 분산, 표준편차 계산을 해봅니다.
5회차는 데이터 분포 시각화로 히스토그램과 상자도표 구현합니다.
6회에서는 빈도분석을 실습작업하는 R 데이터분석 실습입니다.
7에서는 교통사건사고 파일 이용한 지역별 교통사고사상자 분석 코딩 및 시각화작업을 해봅니다.
8회에서는 dplyr 패키지를 알아봅니다.
9회에서도 Dplyr 패키지 주요함수 설명해 줍니다.
10회 강좌에서는 Summarise()함수와 aggreagate()함수를 배우기 합니다.
열한번째 강좌에서는 데이터 수집으로 트위터에 연결하기를 해봅니다.
12회는 데이터 전처리, 13회는 불필요한 트윗내용 제거하기
14회는 트윗에서 분석에 불필요한 트윗태그, 특수문자, url제거방법 등을 공부합니다.
15회 워드클라우드 시각화 작업까지 활용하는 방법을
16회는 tm패키지를 이용한 텍스트마이닝을
17회에서는 tm패키지에서 텍스트 분석과정 및 해당 관련 함수 설명 및 실습합니다.
18회는 KoNLP 패키지를 통한 형태소를 분석해봅니다.
19회 데이터분석에는 보통명사를 추출하는 프로그램 실습합니다.
20회 R프로그램 컴퓨터 데이터분석과 머신러닝 강좌 배우기에서는
연관성 규칙 및 apriori 알고리즘 개략적 설명합니다.
마지막 21회에서는 문서에서 단어간의 연관성 규칙을 생성하여 문서를 요약해 보는 강좌입니다.