R Cookbook

Book description

실용적인 275가지 레시피로 배우는 R 데이터 분석
R은 통계, 그래픽 작업, 통계적 프로그래밍을 하는 데 매우 효과적인 툴로 통계 관련 작업을 하기 위해 필요한 모든 것을 제공하지만, 언어의 구조상 완전히 마스터하기는 어렵다. 이 책은 기본적인 태스크부터 입출력, 기초 통계, 그래픽, 그리고 선형회귀까지 폭넓게 다루고 있으며, 이 책에 수록되어 있는 태스크 중심의 레시피들은 R을 사용해서 곧바로 생산적인 일을 할 수 있게 도와줄 것이다. 각각의 레시피는 특정한 ‘문제’, ‘해결책’과 그것이 어떻게 동작하는지 설명하는 ‘논의’ 섹션으로 구성되어 있다. R 입문자라면 기본기를 다질 수 있을 것이며, 중급 사용자라면 기억을 되짚어 주고 지평을 넓혀 줄 것이다. 특히 2판에서는 RStudio를 설치하고 사용하는 방법이 추가되었으며, 간단한 프로그래밍과 마크다운 문서를 만들고 출력하는 방법까지 다루고 있어 데이터 분석에 필요한 모든 것을 배울 수 있다.

Table of contents

  1. 차례 (1/2)
  2. 차례 (2/2)
  3. 옮긴이의 글
  4. 지은이의 글 (1/2)
  5. 지은이의 글 (2/2)
  6. 1장 시작하기와 도움 얻기
    1. 1.1 R 다운로드와 설치
    2. 1.2 RStudio 설치하기
    3. 1.3 RStudio 시작하기
    4. 1.4 커맨드 입력하기
    5. 1.5 RStudio 종료하기
    6. 1.6 R을 잠깐 중단하기
    7. 1.7 제공된 문서 읽기
    8. 1.8 함수 도움말 보기
    9. 1.9 제공된 문서를 검색하기
    10. 1.10 패키지 도움말 보기
    11. 1.11 인터넷 검색으로 도움말 보기
    12. 1.12 적절한 함수와 패키지 찾기
    13. 1.13 메일링 리스트 검색하기
    14. 1.14 Stack Overflow 또는 다른 커뮤니티에 질문 보내기
  7. 2장 기초 사항들
    1. 2.1 스크린에 출력하기
    2. 2.2 변수 설정하기
    3. 2.3 변수 목록 보기
    4. 2.4 변수 삭제하기
    5. 2.5 벡터 생성하기
    6. 2.6 기본적인 통계량 계산하기
    7. 2.7 수열 생성하기
    8. 2.8 벡터 비교하기
    9. 2.9 벡터에 있는 원소 선택하기
    10. 2.10 벡터 연산 수행하기
    11. 2.11 연산자 우선순위 틀리지 않기
    12. 2.12 더 적게 입력하고 많이 얻어내기
    13. 2.13 함수 호출 파이프라인 만들기
    14. 2.14 흔히 하는 실수 (1/2)
    15. 2.14 흔히 하는 실수 (2/2)
  8. 3장 R 둘러보기
    1. 3.1 작업 디렉터리 알아내기와 설정하기
    2. 3.2 새로운 RStudio 프로젝트 생성하기
    3. 3.3 작업공간 저장하기
    4. 3.4 커맨드 히스토리 보기
    5. 3.5 이전 커맨드의 결과 저장하기
    6. 3.6 검색 경로를 통해 로딩된 패키지 보기
    7. 3.7 설치된 패키지 목록 보기
    8. 3.8 패키지의 함수에 접근하기
    9. 3.9 내장된 데이터세트에 접근하기
    10. 3.10 CRAN에서 패키지 설치하기
    11. 3.11 깃허브에서 패키지 설치하기
    12. 3.12 CRAN 미러 사이트 기본 설정하기 또는 변경하기
    13. 3.13 스크립트 실행하기
    14. 3.14 일괄 실행 스크립트 실행하기
    15. 3.15 R의 홈 디렉터리 찾아내기
    16. 3.16 R 시작 커스터마이징하기
    17. 3.17 클라우드에서 R과 RStudio 사용하기
  9. 4장 입력과 출력
    1. 4.1 키보드로 데이터 입력하기
    2. 4.2 자릿수 더 적게(혹은 더 많이) 출력하기
    3. 4.3 출력을 파일에 쓰기
    4. 4.4 파일 목록 보기
    5. 4.5 윈도우에서 나타나는‘Cannot Open File(파일을 열 수 없음)’ 해결하기
    6. 4.6 고정폭 레코드 읽기
    7. 4.7 테이블로 된 데이터 파일 읽기
    8. 4.8 CSV 파일에서 읽어오기
    9. 4.9 CSV 파일로 쓰기
    10. 4.10 웹에서 테이블 혹은 CSV 데이터를 읽어오기
    11. 4.11 엑셀 데이터 읽어오기
    12. 4.12 데이터 프레임을 엑셀로 쓰기
    13. 4.13 SAS 파일에서 데이터 읽어오기
    14. 4.14 HTML 테이블에서 데이터 읽어오기
    15. 4.15 복잡한 구조를 가진 파일 읽기
    16. 4.16 MySQL 데이터베이스에서 읽어오기
    17. 4.17 dbplyr로 데이터베이스 접근하기
    18. 4.18 객체를 저장하고 전송하기
  10. 5장 데이터 구조 (1/2)
  11. 5장 데이터 구조 (2/2)
    1. 5.1 벡터에 데이터 추가하기
    2. 5.2 벡터에 데이터 삽입하기
    3. 5.3 재활용 규칙 이해하기
    4. 5.4 요인 생성하기(범주형 변수)
    5. 5.5 여러 벡터를 합쳐서 하나의 벡터와 요인으로 만들기
    6. 5.6 리스트 생성하기
    7. 5.7 위치를 통해 리스트의 원소 선택하기
    8. 5.8 이름으로 리스트의 원소 선택하기
    9. 5.9 이름/값 연계 리스트 만들기
    10. 5.10 리스트에서 원소 제거하기
    11. 5.11 리스트의 구조를 없애 벡터로 만들기
    12. 5.12 NULL 원소를 리스트에서 제거하기
    13. 5.13 조건을 사용해 리스트의 원소 제거하기
    14. 5.14 행렬의 초기 내용 설정하기
    15. 5.15 행렬의 연산 수행하기
    16. 5.16 행렬의 행과 열에 설명이 담긴 이름 붙이기
    17. 5.17 행렬에서 하나의 행 또는 열을 선택하기
    18. 5.18 열 데이터로 데이터 프레임 만들기
    19. 5.19 행 데이터로 데이터 프레임 만들기
    20. 5.20 데이터 프레임에 행 추가하기
    21. 5.21 위치를 통해 데이터 프레임의 열 선택하기
    22. 5.22 이름으로 데이터 프레임의 열 선택하기
    23. 5.23 데이터 프레임의 열 이름 바꾸기
    24. 5.24 데이터 프레임에서 NA 제거하기
    25. 5.25 이름으로 열 제외하기
    26. 5.26 두 데이터 프레임 합치기
    27. 5.27 하나의 공통된 열로 데이터 프레임 병합하기
    28. 5.28 단일값을 다른 형식으로 변환하기
    29. 5.29 구조화된 자료형을 다른 형식으로 변환하기
  12. 6장 데이터 변형
    1. 6.1 리스트의 각 원소에 함수 적용하기
    2. 6.2 데이터 프레임의 모든 행에 함수 적용하기
    3. 6.3 행렬의 모든 행에 함수 적용하기
    4. 6.4 모든 열에 함수 적용하기
    5. 6.5 병렬 벡터들 또는 리스트들에 함수 적용하기
    6. 6.6 데이터 집단에 함수 적용하기
    7. 6.7 조건에 따라 새로운 열 만들기
  13. 7장 문자열과 날짜
    1. 7.1 문자열의 길이 알아내기
    2. 7.2 문자열 연결하기
    3. 7.3 하위 문자열 추출하기
    4. 7.4 구분자로 문자열 분할하기
    5. 7.5 하위 문자열 대체하기
    6. 7.6 문자열의 모든 쌍별 조합 만들기
    7. 7.7 현재 날짜 알아내기
    8. 7.8 문자열을 날짜로 변환하기
    9. 7.9 날짜를 문자열로 변환하기
    10. 7.10 연, 월, 일을 날짜로 변환하기
    11. 7.11 율리우스력 날짜 알아내기
    12. 7.12 날짜의 일부 추출하기
    13. 7.13 날짜로 된 수열 생성하기
  14. 8장 확률
    1. 8.1 조합의 개수 세기
    2. 8.2 조합 생성하기
    3. 8.3 난수 생성하기
    4. 8.4 재현 가능한 난수 생성하기
    5. 8.5 확률 표본 생성하기
    6. 8.6 랜덤 수열 생성하기
    7. 8.7 랜덤으로 벡터의 순열 만들기
    8. 8.8 이산분포의 확률 계산하기
    9. 8.9 연속분포의 확률 계산하기
    10. 8.10 확률을 분위수로 변환하기
    11. 8.11 밀도 함수 그래프 그리기
  15. 9장 일반 통계
    1. 9.1 데이터 요약 보기
    2. 9.2 상대도수 계산하기
    3. 9.3 요인의 도수분포표 만들기와 분할표 생성하기
    4. 9.4 범주형 변수의 독립성 검정하기
    5. 9.5 데이터세트의 분위수 및 사분위수 계산하기
    6. 9.6 역분위수 구하기
    7. 9.7 데이터를 z 점수로 변환하기
    8. 9.8 표본을 이용한 모평균 검정(t 검정)
    9. 9.9 모평균의 신뢰구간 구하기
    10. 9.10 중앙값에 대한 신뢰구간 구하기
    11. 9.11 표본비율을 이용한 모비율 검정
    12. 9.12 모비율의 신뢰구간 구하기
    13. 9.13 정규성 검정
    14. 9.14 런(runs) 검정
    15. 9.15 두 모집단의 평균 비교하기
    16. 9.16 비모수적으로 두 표본의 위치 비교하기
    17. 9.17 모상관계수의 유의성 검정하기
    18. 9.18 집단들이 동일 비율로 되어 있는지 검정하기
    19. 9.19 집단의 모평균을 쌍별로 비교하기
    20. 9.20 두 표본이 동일 분포에서 왔는지 검사하기
  16. 10장 그래픽스
    1. 10.1 산점도 그리기
    2. 10.2 제목과 레이블 추가하기
    3. 10.3 격자 추가(또는 제거)하기
    4. 10.4 ggplot 그래프에 테마 적용하기
    5. 10.5 여러 집단의 산점도 생성하기
    6. 10.6 범례 추가(또는 제거)하기
    7. 10.7 산점도의 회귀선 그리기
    8. 10.8 모든 변수들 간 그래프 그리기
    9. 10.9 집단별 산점도 하나씩 생성하기
    10. 10.10 막대그래프 그리기
    11. 10.11 막대그래프에 신뢰구간 추가하기
    12. 10.12 막대그래프 칠하기
    13. 10.13 x와 y점으로 선 그리기
    14. 10.14 선의 유형, 두께, 색상 변경하기
    15. 10.15 여러 개의 데이터세트를 그래프로 그리기
    16. 10.16 수직선 또는 수평선 추가하기
    17. 10.17 박스플롯 그리기
    18. 10.18 각 요인 수준별 박스플롯 하나씩 그리기
    19. 10.19 히스토그램 그리기
    20. 10.20 히스토그램에 추정 밀도 추가하기
    21. 10.21 정규분포의 분위수-분위수 그래프 그리기
    22. 10.22 다른 분포의 분위수-분위수 그래프 그리기
    23. 10.23 변수를 다양한 색상으로 그리기
    24. 10.24 함수를 그래프로 그리기
    25. 10.25 한 페이지에 그래프 여러 개 그리기
    26. 10.26 그래프를 파일에 쓰기
  17. 11장 선형회귀와 분산분석
    1. 11.1 단순선형회귀 실시하기
    2. 11.2 다중선형회귀 실시하기
    3. 11.3 회귀통계량 알아내기
    4. 11.4 회귀 모형의 요약 결과 이해하기
    5. 11.5 절편이 없는 선형회귀 실시하기
    6. 11.6 종속변수와 상관성이 높은 변수들만 회귀 모형에 포함시키기
    7. 11.7 상호작용 항을 넣어 선형회귀 실시하기
    8. 11.8 최선의 회귀변수 선택하기
    9. 11.9 데이터의 부분집합에 대해 회귀분석하기
    10. 11.10 회귀식 내에서 표현식 사용하기
    11. 11.11 다항식 회귀분석하기
    12. 11.12 변형된 데이터로 회귀분석하기
    13. 11.13 최적의 거듭제곱 변형 찾기(박스-콕스 절차)
    14. 11.14 회귀계수의 신뢰구간 구하기
    15. 11.15 회귀 잔차 그래프 그리기
    16. 11.16 선형회귀 진단하기
    17. 11.17 영향력이 큰 관찰 판별하기
    18. 11.18 잔차의 자기상관 검정하기(더빈-왓슨 검정)
    19. 11.19 새로운 값들 예측하기
    20. 11.20 예측구간 구하기
    21. 11.21 일원분산분석 수행하기
    22. 11.22 상호작용 그래프 생성하기
    23. 11.23 집단 평균 간의 차이 알아내기
    24. 11.24 로버스트 분산분석(크러스칼-월리스 검정) 수행하기
    25. 11.25 분산분석을 사용해서 모형 비교하기
  18. 12장 쓸만한 요령들
    1. 12.1 데이터 조금만 보기
    2. 12.2 대입 결과 출력하기
    3. 12.3 행과 열 합계 내기
    4. 12.4 열의 형태로 데이터 출력하기
    5. 12.5 데이터 묶기
    6. 12.6 특정 값의 위치 찾기
    7. 12.7 벡터의 매 n번째 원소 선택하기
    8. 12.8 원소쌍의 최솟값 또는 최댓값 찾기
    9. 12.9 여러 요인의 모든 조합 생성하기
    10. 12.10 데이터 프레임의 구조 없애기
    11. 12.11 데이터 프레임 정렬하기
    12. 12.12 변수에서 속성 제거하기
    13. 12.13 객체의 구조 알아내기
    14. 12.14 코드 시간 재기
    15. 12.15 경고와 에러 메시지 숨기기
    16. 12.16 리스트에서 함수 인자 꺼내기
    17. 12.17 자신만의 이항 연산자 정의하기
    18. 12.18 시작 메시지 숨기기
    19. 12.19 환경변수 알아내기 및 설정하기
    20. 12.20 코드 섹션 사용하기
    21. 12.21 R을 로컬에서 병렬 실행하기
    22. 12.22 원격으로 R 병렬 실행하기
  19. 13장 고급 수치 연산과 통계
    1. 13.1 단일 매개변수 함수를 최대화 또는 최소화하는 값 찾기
    2. 13.2 다중 매개변수 함수를 최소화 또는 최대화하는 값 찾기
    3. 13.3 고윳값과 고유벡터 계산하기
    4. 13.4 주성분 분석 수행하기
    5. 13.5 단순 직교회귀 실시하기
    6. 13.6 데이터에서 군집 찾기
    7. 13.7 이진값으로 된 변수 예측하기(로지스틱 회귀)
    8. 13.8 통계량 부트스트랩하기
    9. 13.9 요인분석 (1/2)
    10. 13.9 요인분석 (2/2)
  20. 14장 시계열 분석
    1. 14.1 시계열 데이터 표현하기
    2. 14.2 시계열 데이터 그래프로 그리기
    3. 14.3 가장 오래전 또는 가장 최근 관찰 추출하기
    4. 14.4 시계열 부분집합 만들기
    5. 14.5 여러 시계열 병합하기
    6. 14.6 시계열 끼워 넣기 또는 채우기
    7. 14.7 시계열 늦추기
    8. 14.8 연속차분 계산하기
    9. 14.9 시계열 데이터에 계산 수행하기
    10. 14.10 이동평균 계산하기
    11. 14.11 달력 주기로 함수 적용하기
    12. 14.12 롤링 함수 적용하기
    13. 14.13 자기상관 함수 그리기
    14. 14.14 시계열의 자기상관 검정하기
    15. 14.15 부분 자기상관 함수 그리기
    16. 14.16 두 시계열 사이의 시차상관 찾아내기
    17. 14.17 시계열의 추세 제거하기
    18. 14.18 ARIMA 모형 적합시키기
    19. 14.19 유의미하지 않은 ARIMA 계수 제거하기
    20. 14.20 ARIMA 모형 진단하기
    21. 14.21 ARIMA 모형을 통해 예측하기
    22. 14.22 예측값 그래프로 그리기
    23. 14.23 평균회귀성 검사하기
    24. 14.24 시계열 평활하게 만들기
  21. 15장 간단한 프로그래밍
    1. 15.1 if/else 두 가지 중 하나 선택하기
    2. 15.2 루프 반복하기
    3. 15.3 함수 정의하기
    4. 15.4 지역 변수 생성하기
    5. 15.5 여러 대안 중 한 가지 선택하기: switch
    6. 15.6 함수 매개변수들의 기본값 정의하기
    7. 15.7 에러 표시하기
    8. 15.8 에러로부터 보호하기
    9. 15.9 익명함수 만들기
    10. 15.10 재사용 가능한 함수들 만들기
    11. 15.11 자동으로 코드 들여쓰기 바꾸기
  22. 16장 R 마크다운과 퍼블리싱
    1. 16.1 새로운 문서 만들기
    2. 16.2 문서 제목, 작성자, 작성일 정보 추가하기
    3. 16.3 문서 텍스트 서식 적용하기
    4. 16.4 문서에 제목 삽입하기
    5. 16.5 문서에 목록 삽입하기
    6. 16.6 문서에 R 코드 결과물 출력하기
    7. 16.7 출력되는 코드와 결과물 제어하기
    8. 16.8 문서에 그래프 삽입하기
    9. 16.9 문서에 테이블 삽입하기
    10. 16.10 문서에 데이터 테이블 삽입하기
    11. 16.11 문서에 수식 삽입하기
    12. 16.12 HTML 파일 형식으로 출력하기
    13. 16.13 PDF 파일 형식으로 출력하기
    14. 16.14 MS 워드 파일 형식으로 출력하기 (1/2)
    15. 16.14 MS 워드 파일 형식으로 출력하기 (2/2)
    16. 16.15 프레젠테이션 형식으로 출력하기
    17. 16.16 파라미터 기반 보고서 생성하기
    18. 16.17 R 마크다운 작업 흐름 구조화하기
  23. 찾아보기 (1/6)
  24. 찾아보기 (2/6)
  25. 찾아보기 (3/6)
  26. 찾아보기 (4/6)
  27. 찾아보기 (5/6)
  28. 찾아보기 (6/6)

Product information

  • Title: R Cookbook
  • Author(s): JD Long, Paul Titer, Jee -Won Lee
  • Release date: May 2022
  • Publisher(s): Insight
  • ISBN: None