처음 시작하는 R 데이터 분석 요약정보 및 구매

  • 총금액 : 19,000원 (10%할인)
    17,100원
  • 저자 김은옥
  • ISBN 978-89-5897-402-4
  • 출간일 2022년 2월 25일
  • 페이지수 : 320페이지
  • 판매가 : 17,100원
  • 배송비결제 주문시 결제(50,000원결제시 무료배송)
  • 수량 :
    처음 시작하는 R 데이터 분석 (+0원)

상품 선택옵션 0 개, 추가옵션 0 개

 

 

​​​​R 프로그램을 처음 시작하는 초보자를 위한 최적의 입문서!

 

이 책은 R/Rstudio 프로그램의 설치와 실행부터 Rstudio를 이용한 전처리 과정, 시각화, 시각화를 통한 통계 분석 등 데이터 분석에 필요한 다양한 기본기를 다루었습니다. 각 장에서 배워야 할 중요 개념들을 먼저 다룬 후 해당 기능에 대한 예제를 이용하여 충분한 연습을 할 수 있습니다. 또한 실제 예제를 이용하여 데이터 분석과 통계 분석에 필요한 다양한 작업을 해봄으로써 지금까지 배운 내용을 종합적으로 학습할 수 있도록 하였습니다.

 

[저자 소개]

김은옥

현재 프로브미디어 대표로 국가인재개발원, 서울시 인재개발원, 한국지역정보개발원 등의 주요 공무원 교육원에서 빅데이터 분석, 인공지능, 파이썬, Java JSP 프로그래밍 강사로 활동하고 있습니다. 주요 저서로는 <기초부터 활용까지 실전으로 배우는 Ajax 웹 프로그래밍>, <막힘없이 배우는 Java Programming>, <은노기의 JSP 웹 프로그래밍 입문>, <안드로이드 프로그래밍>, <쉽게 배우는 HTML5&CSS3 그리고 jQuary>, <쉽게 배우는 파이썬> 등이 있습니다.

R 프로그램을 처음 시작하는 분들을 단시간에 R 전문가로 이끌어 드립니다.
[이 책의 특징]

​누구나 쉽게 배울 수 있는 R 프로그램 입문서!

이 책은 R 프로그램 입문자들을 위한 책으로 처음 배우는 입문자들이 반드시 익혀야 하는 필수 기술들을 중심으로 작성되었습니다.

 

[이 책의 구성]

- 이 장의 핵심 : 각 장의 핵심 사항을 개괄적으로 설명

- 예제 : 문법 설명을 이해하기 위한 간단한 예제

- 여기서 잠깐 : 내용이나 문제에 도움이 될 만한 추가 내용

- 추가 실습 : 예제를 확장한 실습 예제(CHAPTER 06, CHAPTER 08)

- 단원 문제 : 예제 또는 추가 실습의 응용으로 주어진 문제를 직접 해결 하는 문제(CHAPTER 08, CHAPTER 11)

[CHAPTER의 학습 개요]

CHAPTER 01 데이터 분석 개요

데이터 분석의 정의, 데이터 분석의 기능, 데이터 분석을 위해 알아야 할 사항

 

CHAPTER 02 데이터 분석 툴 R / RStudio 설치 및 환경 설정

R 기반에서 데이터를 분석하기 위한 프로그램 설치와 개발 환경 설정

CHAPTER 03 R 기본 문법

R을 사용한 데이터 분석에 필요한 가장 기본적인 R 문법인 변수, 데이터 타입, 데이터 로드, 함수 선언

 

CHAPTER 04 통계 기초

기본적인 통계 개념인 대표값, 요약 통계량에 사용되는 값, 기초 개념 학습

 

CHAPTER 05 탐색적 데이터 분석 (EDA) 개요 - 데이터 분석 1단계

전체 데이터 분석 중 탐색적 데이터 분석을 하는 순서에 대한 학습

 

CHAPTER 06 데이터 전처리 - 가공/처리

데이터 추출, 필터, 정렬, 변수(필드) 생성, 그룹화 등의 전처리 함수를 사용한 데이터 전처리

 

CHAPTER 07 결측치와 이상치 처리

분석에 사용할 수 없거나 예측 시 잘못된 결과를 가져오는 결측치와 이상치의 처리 방법

 

CHAPTER 08 시각화

데이터의 분포나 형태를 알 수 있어서 데이터를 한층 더 잘 이해하게 시각화하는 방법

 

CHAPTER 09 통계적 데이터 분석 개요 - 데이터 분석 2단계

통계적 데이터 분석을 하는 순서와 각 단계별 개괄적인 내용 학습

 

CHAPTER 10 통계 분석에 필요한 기본 개념

통계의 개념들이 의외로 매우 적고 간단한 개념을 이해함으로써 해결하기 위해 통계 분석에 필요한 필수적이고 기본적인 개념 학습

 

CHAPTER 11 데이터 타입에 따른 분석 기법

변수 종류나 수에 따라 분석하는 방법과 필수적으로 고려해야 하는 것들에 대한 학습

 

CHAPTER 12 데이터 분석 프로젝트

지금까지 학습한 데이터 분석을 익히기 위해 데이터 분석으로부터 이면의 사실을 파악하고, 그 이면의 사실이 의미하는 것을 이해함으로써 사고를 종합하고 이해하는 능력을 익히는 프로젝트 학습

 
[미리 보기]
97a49b3da9e7dd714f1e94de0c8f57e2_1645082459_6011.png
97a49b3da9e7dd714f1e94de0c8f57e2_1645082461_3253.png
97a49b3da9e7dd714f1e94de0c8f57e2_1645082463_2943.png
97a49b3da9e7dd714f1e94de0c8f57e2_1645082465_0429.png
97a49b3da9e7dd714f1e94de0c8f57e2_1645082467_347.png
97a49b3da9e7dd714f1e94de0c8f57e2_1645082469_3629.png
97a49b3da9e7dd714f1e94de0c8f57e2_1645082471_7182.png
97a49b3da9e7dd714f1e94de0c8f57e2_1645082473_6769.png
97a49b3da9e7dd714f1e94de0c8f57e2_1645082475_5852.png

상품 정보 고시

CHAPTER 01 데이터 분석 개요
1. 데이터 분석의 의미와 활용
2. 데이터 분석에 필요한 것
(1) 데이터 분석에 필요한 3요소
(2) 데이터 분석 과제 수행 순서
(3) 데이터 분석 단계

CHAPTER 02 데이터 분석 툴 R/RStudio 설치 및 환경 설정
1. R의 다운로드 및 설치
(1) 선수 작업
(2) R 다운로드
(3) R 설치
(4) R 아이콘에 관리자 권한 설정
2. RStudio의 다운로드 및 설치
(1) RStudio 다운로드
(2) RStudio 설치
(3) RStudio 바로 가기 아이콘 만들기
(4) RStudio 실행 시 관리자 권한 설정
3. RStudio의 실행 및 설정
(1) RStudio 실행
(2) 패키지 업데이트
(3) RStudio 창의 구성
(4) RStudio 개발 환경 설정
4. 프로젝트 작성과 스크립트 사용
(1) 프로젝트 관리 폴더 작성
(2) 프로젝트 작성
(3) 프로젝트에 작업 폴더 작성
(4) 스크립트 작성
(5) [R script] 창에서 코드 실행 방법
5. R의 도움말 사용 및 패키지 추가 설치
(1) R의 도움말 사용법
(2) 패키지 관리 : [Package] 탭
(3) R에서 제공하는 모든 패키지 목록 확인
(4) 프로젝트에서 필요한 패키지 설치 및 사용
• 하나 더

CHAPTER 03 R 기본 문법
1. 변수
(1) 변수 개요
(2) 변수 선언
(3) 변수 사용
(4) 변수 제거
2. 데이터 타입
(1) 데이터 타입 개요
(2) 타입 확인
(3) 타입 변환 함수
(4) 타입 검사 함수
3. 벡터
(1) 벡터를 만드는 방법
(2) 벡터 원소값 추출
4. 여러 개의 값 저장
(1) 벡터 : c()
(2) 리스트 : list()
(3) 행렬 : matrix()
(4) 배열 : array()
5. 데이터프레임 : data.frame()
(1) 데이터프레임 직접 생성
(2) 데이터 파일을 로드하여 데이터프레임 생성
6. 함수 이해
(1) 함수 개요
(2) 사용자 정의 함수
• 하나 더

CHAPTER 04 통계 기초
1. 개요
(1) 기술 통계
(2) 추리 통계
2. 대표값과 기초 개념
(1) 평균값, 분산, 표준편차
(2) 최빈수(mode)
(3) R에서 평균, 분산, 표준편차, 최빈수 구하기
(4) 요약 통계량
(5) R에서 최소값, 최대값, 사분위수 구하기

CHAPTER 05 탐색적 데이터 분석(EDA) 개요 – 데이터 분석 1단계
1. 실무 데이터를 사용한 작업 순서
(1) 실무 데이터를 읽어옴
(2) 읽어온 데이터 처리 : 전처리
(3) 전처리된 데이터를 통계 분석하거나 시각화
2. 모든 데이터에 공통으로 해야 할 분석 : EDA
(1) 수량형 변수와 범주형 변수
(2) 데이터의 내용과 구조 파악 – 기본 함수 또는 dplyr 패키지의 함수 사용
(3) 데이터의 요약 통계량, 빈도표 파악
(4) 결측치 확인 – 결측치/이상치 처리
(5) 무조건 시각화함 – plot(), ggplot(), pairs()를 사용
3. 수량형 변수 분석에서 추가로 해야 할 작업
(1) 데이터 정규성 검사
(2) 가설 검정과 신뢰 구간
(3) 이상점 찾기
4. 범주형 변수 분석에서 추가로 해야 할 작업 – 성공과 실패형
(1) 요약 통계량 계산
(2) 데이터 분포 시각화
(3) 가설 검정과 신뢰 구간

CHAPTER 06 데이터 전처리 - 가공/처리
1. 데이터 탐색 함수
(1) 데이터 탐색에 사용할 데이터프레임 생성
(2) head() 함수
(3) tail() 함수
(4) dim() 함수
(5) str() 함수
(6) summary() 함수
(7) data.frame() 함수
(8) name() 함수
2. 데이터 전처리를 하는 dplyr 패키지의 함수 사용 개요
(1) dplyr 패키지 설치 및 로드
(2) dplyr 패키지의 함수 사용법
(3) %>%(파이프 연산자)
3. filter() 함수 - 행(데이터) 추출
(1) 기본 사용 방법
(2) 조건 지정
4. select() 함수 - 열(변수) 추출
(1) 기본 사용 방법
(2) 데이터프레임에서 변수를 추출하는 다양한 방법
(3) 전처리 함수 중첩
5. arrange() 함수 – 정렬
(1) 기본 사용 방법
(2) 다차 정렬
(3) 사용자 정의 정렬
6. mutate() 함수 - 변수(필드) 추가
(1) df_gap 데이터프레임 생성
(2) 기본 사용 방법
(3) 새 변수 만드는 방법
(4) 추가 실습
(5) 6장 문제
7. summarize() 함수 – 요약 통계치 산출
(1) 기본 사용 방법
8. group_by() 함수 - 그룹별로 나누기
(1) 기본 사용 방법
9. left_join() 함수 - 조인
(1) 기본 사용 방법
(2) 추가 실습
10. bind_rows() 함수 - 바인딩
(1) 기본 사용 방법
11. 랜덤 샘플링 함수
(1) sample_n( ) 함수
(2) sample_frac( ) 함수
12, distinct() 함수

CHAPTER 07 결측치와 이상치 처리
1 결측치 처리
(1) 결측치 확인 함수
(2) 결측치 제외
(3) 결측지 보정
2 이상치 처리
(1) 이상치를 결측치로 바꿔서 제외
(2) 이상치 보정

CHAPTER 08 시각화
1 시각화 개요
(1) 산점도 행렬
(2) 플롯 파일로 저장
(3) 요약 통계량과 상관관계
(4) 시각화 순서
2 ggplot() 함수를 사용한 그래프 작성 기본
(1) 작성 방법
(2) 그래프 종류별 작도
3. 변수의 개수와 종류별 시각화
(1) 수량형 변수 1개 : x축
(2) 범주형 변수 1개 : x축
(3) 수량형 변수 2개 : x축, y축
(4) 변수 2개(x축 날짜 데이터, y축 값)
(5) 범주형 변수 1개, 수량형 변수 1개 : x축, y축
(6) 추가 실습
• 단원 문제

CHAPTER 09 통계적 데이터 분석 개요- 데이터 분석 2단계
1. 실무 데이터를 사용한 전체 데이터 분석 순서
(1) 실무 데이터 로드
(2) 탐색적 데이터 분석
(3) 통계적 데이터 분석

CHAPTER 10 통계 분석에 필요한 기본 개념
1. 가설 검정과 p값, 신뢰 구간
(1) 가설 검정과 p값
(2) 대응표본 t-test : 코로나19 사태 전과 후의 지하철 이용객 수 차이
(3) 독립표본 t-test : 전륜 구동차(f)와 4륜 구동차(4) 간의 도시 주행 연비(cty) 차이
(4) 단일표본 t-test : 지하철 2호선의 역별, 일별 하차 승객 수와 지하철 평균 역별, 일별 하차 승객 수 비교
2. 모집단, 모수, 표본

CHAPTER 11 데이터 타입에 따른 분석 기법
1. 개요
(1) 모든 데이터에 공통으로 해야 할 분석 기법 : 탐색적 데이터 분석(EDA)
(2) 변수 종류와 수에 따른 통계 분석
2. 1개의 수량형 변수 분석 : t-test
(1) 데이터 로드 및 파악
(2) 작업 대상 변수 선택 및 통계량 확인
(3) 데이터 형태 파악을 위한 시각화
(4) 일변량 t-test
(5) 이상치와 로버스트 통계 방법
3. 1개의 범주형 변수 분석 : 성공/실패 값
(1) 데이터 로드 및 파악
(2) 작업 대상 변수 선택 및 빈도표 확인
(3) 데이터 형태 파악을 위한 시각화
(4) 이항 검정(binomial test) binom.test( )
(5) 오차 한계, 표본 크기
4. 2개의 변수(수량형 변수-x, 수량형 변수-y) 분석 : 회귀분석
(1) 데이터 로드 및 파악
(2) 요약 통계량, 결측치 확인
(3) 데이터 형태 파악을 위한 시각화
(4) 상관계수
(5) 단순 회귀분석 - lm(y ~ x)
(6) 모형 적합도 검정
(7) 선형 회귀 모형 예측
(8) 선형 회귀 모형의 가정 진단
(9) 로버스트 선형 회귀분석 - lqs( )
(10) 비선형(비모수적) 회귀분석 방법 - 평활법 : LOESS
5. 2개의 변수(범주형 변수-x, 수량형 변수-y) 분석 : 분산분석
(1) 데이터 로드 및 파악
(2) 통계량, 빈도표 확인
(3) 데이터 형태 파악을 위한 시각화
(4) 분산분석 - lm(y ~ x)
(5) 분산분석 진단 플롯
• 단원 문제

CHAPTER 12 데이터 타입에 따른 분석 기법
1. 대한민국 인구 변화 분석
(1) 개요
(2) 대한민국 50년간의 인구 예측 데이터를 사용한 인구 변화 확인
(3) 혼인건수의 변화와 출생건수 변화 관계 분석
2. 연령대별 가구의 재정 변화 분석
(1) 개요
(2) 연도별 자산, 부채의 변화 추이 파악 및 예측
(3) 연도별 자산, 소득 현황 비교
(4) 연령대별 재산의 건전성 및 소득 추이 비교
• 하나 더

등록된 상품문의

상품문의가 없습니다.

마이 삼양