내용 소개
카탈로그
1 장 파이썬 데이터 분석 개요 1
작업 1 ..1데이터 분석 이해1
1..1..1데이터 분석의 개념 파악 2
1..1.2 데이터 분석 프로세스 2 파악
1..1.3 데이터 분석 애플리케이션 시나리오 이해 4
작업 1.2 파이썬 데이터 분석 도구 5 에 익숙함
1.2. 1 데이터 분석 이해 공통 도구 6
1.2.2 파이썬 데이터 분석의 이점 이해 7
1.2.3 파이썬 데이터 분석에 일반적으로 사용되는 클래스 라이브러리 이해 7
작업 1.3 파이썬의 Anaconda 버전 9 설치
1.3. 1 파이썬 아나콘다 버전 9 이해
1.3.2 Windows 시스템에 Anaconda 9 설치
1.3.3 Linux 시스템에 Anaconda 12 설치.
작업 1.4 Jupyter 노트북 14 의 공통 기능 파악
목성 노트북의 기본 기능 파악 14
1.4.2 Jupiter 메모장의 고급 기능 파악 16
요약 19
수업 후 연습 19
제 2 장 NumPy 수치 계산 기초 2 1
작업 2. 1 제어 NumPy 배열 개체 ndarray 2 1
배열 객체 생성 2 1
2. 1.2 난수 생성 27
2. 1.3 인덱스별 배열 액세스 29
2. 1.4 변환 배열 형식 3 1
작업 2.2 NumPy 행렬 및 일반 함수 마스터 34
2.2. 1 NumPy 행렬 만들기 34
2.2.2 ufunc 기능 파악 37
작업 2.3 통계 분석을 위해 NumPy 4 1 사용
2.3. 1 파일 읽기/쓰기 4 1
2.3.2 함수 사용에 대한 간단한 통계 분석 44
임무 달성 48
요약 50
교육 50
1 배열 만들기 연습 및 작업 50 수행
연습 2 바둑판 만들기 50
수업 후 연습 5 1
3 장 Matplotlib 데이터 시각화 기본 사항 52
작업 3. 1 기본 구문 및 제도 52 의 공통 매개변수 파악
3.1..1pyplot 53 의 기본 구문 파악
3. 1.2 pyplot 56 에 대한 동적 RC 매개 변수 설정
작업 3.2 분석 피쳐 간의 관계 59
산포 그래프 그리기 59
3.2.2 선 그래프 그리기 62
임무 실현 65
작업 3.3 내부 데이터 분포 및 피쳐 분산 분석 68
3.3. 1 히스토그램 그리기 68
3.3.2 원형 차트 그리기 70
3.3.3 상자 그림 그리기 7 1
임무 실현 73
요약 77
교육 78
교육 1 분석 1996 20 15 인구 데이터 특징 78
연습 2 1996 에서 20 15 인구 데이터의 다양한 특성 분포 및 이산화를 분석합니다.
수업 후 연습 79
제 4 장 팬더 통계 분석 기본 80 페이지
작업 4. 1 다른 데이터 소스에서 데이터 읽기/쓰기 80
4.1..1읽기/쓰기 데이터베이스 데이터 80
4. 1.2 텍스트 파일 읽기/쓰기 83
4. 1.3 Excel 파일 읽기/쓰기 87
4. 1.4 작업 구현 88
작업 4.2 데이터 프레임 89 의 일반적인 작업 파악
데이터 프레임 89 의 공통 속성 보기
4.2.2 데이터 프레임 데이터 9 1 을 확인, 수정, 추가 및 삭제합니다.
4.2.3 데이터 프레임 10 1 을 설명하고 분석합니다.
4.2.4 임무 구현 104
작업 4.3 시계열 데이터 변환 및 처리 107
4.3. 1 문자열을 변환하는 시간은 107 입니다.
4.3.2 시계열 데이터 정보 추출 109
4.3.3 플러스-마이너스 시간 데이터 1 10
4.3.4 작업 구현 1 1 1
작업 4.4 그룹 집계를 사용한 그룹 내 계산 1 13
4.4. 1 그룹 기준 방법을 사용하여 1 14 데이터 분할.
4.4.2 합계 방법을 사용하여 1 16 데이터 합계.
4.4.3 적용 방법을 통해 1 19 데이터를 집계합니다.
4.4.4 변환 방법 12 1 합산 데이터 사용.
4.4.5 작업 구현 12 1
태스크 4.5 피벗 및 크로스탭 생성 123
4.5. 1 pivot_table 함수를 사용하여 피벗 123 생성.
4.5.2 크로스탭 함수를 사용하여 크로스탭 생성 127.
4.5.3 작업 구현 128
요약 130
교육 130
교육 1 읽기 P2P 인터넷 대출 데이터 마스터 테이블 기본 정보 보기 130
연습 2 에서는 사용자 정보 업데이트 테이블 및 로그인 정보 테이블에 대한 시간 정보 130 을 추출합니다.
연습 3 에서는 그룹 집계 방법을 통해 사용자 정보 업데이트 테이블 및 로그인 정보 테이블 13 1 을 추가로 분석합니다.
연습 4 에서는 사용자 정보 업데이트 테이블과 로그인 정보 테이블이 긴 테이블과 짧은 테이블 13 1 으로 변환됩니다.
수업 후 운동 13 1
5 장 pandas 를 사용한 데이터 사전 처리 133
작업 5. 1 데이터 병합 133
5.1..1스택 통합 데이터 133
5. 1.2 기본 키 통합 데이터 136
5. 1.3 통합 데이터 중복 139
5. 1.4 임무 구현 140
작업 5.2 데이터 정리 14 1
5.2. 1 중복 값 감지 및 처리
5.2.2 누락 값 감지 및 처리 146
5.2.3 이상값 감지 및 처리 149
5.2.4 임무 구현 152
작업 5.3 표준화된 데이터 154
5.3. 1 편차 표준화 데이터 154
5.3.2 표준 편차 표준화 데이터 155
5.3.3 10 진수 교정 표준화 데이터 156
5.3.4 임무 구현 157
작업 5.4 데이터 변환 158
5.4. 1 가상 변수 범주 데이터 처리 158
5.4.2 불연속 연속 데이터 160
5.4.3 작업 구현 162
요약 163
교육 164
교육 1 보간 사용자 전력 데이터 누락 값 164
연습 2 라인 손실, 전력 동향 및 회선 경보 데이터 164 통합
교육 3 표준화된 모델링 전문가 샘플 데이터 164
수업 후 연습 165
6 장에서는 scikit-learn 을 사용하여 167 모델을 구축합니다.
작업 6. 1 sklearn 변환기로 데이터 처리 167.
6.1..1데이터 세트 모듈에 데이터 세트 로드 167.
6. 1.2 데이터 세트를 교육 세트와 테스트 세트 170 으로 나눕니다.
6. 1.3 데이터 사전 처리 및 차원 감소에 sklearn converter65438 사용 172
6. 1.4 임무 구현 174
작업 6.2 클러스터 모델 구축 및 평가 176
6.2. 1 sklearn 예측기를 사용하여 클러스터 모델 만들기 176.
6.2.2 클러스터 모델 평가 179
6.2.3 작업 구현 182
태스크 6.3 분류 모델 작성 및 평가 183
6.3. 1 sklearn 예측기를 사용하여 분류 모델 작성 183.
6.3.2 평가 분류 모델 186
6.3.3 작업 구현 188
작업 6.4 회귀 모형 작성 및 평가 190
6.4. 1 sklearn 추정치를 사용하여 선형 회귀 모형 작성 190.
6.4.2 회귀 모델 평가 193
6.4.3 작업 구현 194
요약 196
교육 196
교육 1 sklearn 을 사용하여 와인 및 와인 처리 _ 품질 데이터 세트 196.
연습 2: 와인 데이터 세트 196 을 기반으로 K-Means 클러스터 모델 구축
연습 3: 와인 데이터 세트 197 을 기반으로 SVM 분류 모델 구축
연습 4: wine_quality 데이터 세트 197 을 기반으로 회귀 모형 작성.
수업 후 연습 198
제 7 장 항공사 고객 가치 분석 199
임무 7. 1 항공사 현황 및 고객 가치 분석 이해 199
7.1..1항공사 현황 이해 200
7. 1.2 고객 가치 분석 이해 20 1
7. 1.3 항공 고객 가치 분석 단계 및 프로세스 20 1
임무 7.2 항공사 고객 데이터 전처리 202
7.2. 1 누락된 데이터 및 예외 데이터 처리 202
7.2.2 항공 고객 가치 분석의 핵심 특징 수립 202
7.2.3 표준화된 LRFMC 모델 206 의 다섯 가지 특징
임무 실현 207
태스크 7.3 고객 그룹핑 209 에 k-means 알고리즘 사용
7.3. 1 k-means 클러스터링 알고리즘 이해 209
7.3.2 클러스터 결과 분석 2 10
7.3.3 모델 애플리케이션 2 13
7.3.4 작업 구현 2 14
요약 2 15
교육 2 15
교육 1 신용카드 데이터 이상 처리 2 15
연습 2 신용 카드 고객 위험 평가의 핵심 특징 구축 2 17
연습 3 k-means 클러스터링 모델 구축 2 18
수업 후 연습 2 18
제 8 장 재정 수입 예측 및 분석 220 페이지
태스크 8. 1 재정 수익 예측의 배경과 방법 이해 220
8.1..1재정 수입 예측 배경 분석 220
8. 1.2 재정 수입 예측 이해 방법 222
8. 1.3 재정 수익 예측 단계 및 프로세스 223 에 익숙
태스크 8.2 재정 수입 데이터 특성의 상관 관계 분석 223
8.2. 1 상관 분석 이해 223
계산 결과 분석 224
임무 실현 225
태스크 8.3 Lasso 회귀를 사용하여 재정 수입 예측의 핵심 특징 선택 225
8.3. 1 케이블 회귀법 이해 226
8. 3. 2 Lasso 회귀 결과 분석 227
8.3.3 임무 달성
태스크 8.4 회색 예측 및 지원 벡터 회귀를 사용하여 재정 수익 예측 모델 구축 228
회색 예측 알고리즘 이해 228
8.4.2 SVR 알고리즘 이해 229
8.4.3 분석 및 예측 결과 232
임무 실현 234
요약 236
교육 236
연습 1 기업 소득세 특성 간 상관 계수 찾기 236
연습 2 기업 소득세 예측의 핵심 특성 선택 237
연습 3: 기업 소득세 예측 모델 구축 237
수업 후 연습 237
제 9 장 가정용 온수기 사용자 행동 분석 및 사건 인식 239
작업 9. 1 가정용 온수기 사용자 행동 분석의 배경 및 단계 이해 239
9. 1. 1 국내 온수기 산업 현황 분석 240
9. 1.2 온수기 240 이 데이터를 수집하는 기본 상황을 이해합니다
9. 1.3 가정용 온수기 사용자 행동 분석 절차 및 절차 24 1
임무 9.2 온수기 사용자의 물 소비량 데이터 전처리 242
중복 피쳐 삭제 242
9.2.2 물 분할 사건 243
9.2.3 단일 물 이벤트에 대한 기간 임계값 결정 244
임무 실현 246
작업 9.3 물 행동 특성 구축 및 물 이벤트 심사 247
9.3. 1 시공수 기간과 주파수 특성 248
9.3.2 건설 용수 소비량 및 변동 특성 249
9.3.3 심사 후보 수영 프로젝트 250
9.3.4 임무 달성 25 1
작업 9.4 행동 이벤트 분석을 위한 BP 신경망 모델 구축 255
9.4. 1 BP 신경망 알고리즘의 원리 이해 255
9.4.2 건물 모델 259
9.4.3 평가 모델 260
임무 실현 260
요약 263
교육 263
교육 1 청소 운영자 고객 데이터 263
연습 2 고객 운영자 데이터 필터링 264
연습 3 신경망 예측 모델 구축 265
수업 후 연습 265
부록 A 267
부록 B 270
참조 문서 295
필기를 배우다
Jupyter Notebook (이전 명칭: IPython notebook) 은 40 개 이상의 프로그래밍 언어 실행을 지원하는 대화형 노트북입니다. Jupyter Notebook 의 본질은 문학 프로그램 문서를 쉽게 작성하고 즐길 수 있는 웹 어플리케이션으로 실시간 코드, 수학 방정식, 시각화 및 markdown 을 지원합니다. 용도에는 데이터 청소 및 변환, 수치 시뮬레이션, 통계 모델링, 기계 학습 등이 포함됩니다. 정의 (Python 비디오 자습서 권장) 사용자는 이메일, Dropbox, GitHub, Jupyter 노트북 뷰어를 통해 Jupiter 노트북을 다른 사람과 공유할 수 있습니다. Jupyter Notebook 에서 코드는 이미지, 비디오, LaTeX 및 JavaScript 를 실시간으로 생성할 수 있습니다. 데이터 마이닝 분야에서 가장 핫한 경쟁 Kaggle 의 데이터는 Jupyter 형식입니다. 스키마 Jupiter 구성 요소 Jupiter 에는 Jupyter 노트북 및 ...
이 문서에서는 Python 으로 구현된 위챗 친구 데이터 분석 기능의 예를 제공합니다. 다음과 같이 참고할 수 있도록 공유하십시오. 여기서는 주로 python 을 사용하여 개인 위챗 친구를 분석하고 결과를 html 문서로 출력합니다. 주로 사용하는 파이썬 가방은 itchat, pandas, pyecharts 등 1, itchat 위챗 설치를 위한 파이썬 SDK 로 개인 우정을 얻는다. 결과 코드는 import it chat import panda as PD from pye charts import geo 입니다. Baritchat.login () friends = itchat.get _ friends (update = true) [0:] def user 2 dict (user) = user ["nickname"] if user ["nickname"] else "nan" user _ dict ["city"] = user [""
위챗 오픈 개인 번호 인터페이스를 기반으로 한 python 라이브러리 Itchat 은 위챗 친구 획득을 실현하고 주, 성별, 위챗 서명에 대한 데이터 분석을 수행합니다. 효과: stopwords.txt, newdit.txt, unionWords.txt, 글꼴 simhei.ttf 다운로드 또는 글꼴 제거에 필요한 코드 등 세 개의 빈 텍스트 파일을 직접 인코딩하고 빌드하면 바로 실행할 수 있습니다. # wxfriends.py2065 438+08-07-09 import it chat import sys import pandas as PD import matplotlib.py plot as PLT plt.rcc ] = ['simhei'] # Chinese plt.rcparams ['axes.unicode _ MINUS'] = false # 그릴 때 표시할 수 있습니다. 중국 수입. 아마 시피에서 온 모조품일 겁니다. 잘못된 imread from word cloud 가져오기 wordcloud from osimport 경로 # 그림을 그릴 때 나타납니다. 인코딩 문제 해결 non _ BMP _ map = dict.from keys (range (0x10000, sys.max 유니코드+/kloc- ...
파이썬 데이터 분석을 위한 이색구의 예로, 선형 회귀 알고리즘을 기반으로 다음 당첨 결과를 예측합니다.
이 문서에서는 Python 데이터 분석을 예로 들어 선형 회귀 알고리즘을 기반으로 다음 당첨 결과를 예측합니다. 나는 너에게 참고할 수 있도록 공유한다. 구체적으로 다음과 같습니다. 저는 이중색구에 대한 다양한 알고리즘을 설명했습니다. 여기서, 나는 다음 2 색 볼의 번호를 예측할 것이다. 생각만 해도 좀 설렌다. 코드에 선형 회귀 알고리즘이 사용되었습니다. 이 장면은 바로 이 알고리즘을 사용하며, 예측 효과는 보통이다. 다른 알고리즘으로 결과를 시험해 보는 것을 고려해 볼 수 있다. 나는 이전에 많은 코드가 반복적인 작업이었다는 것을 알았다. 코드를 더욱 우아하게 보이게 하기 위해 함수를 정의했는데, 그것을 호출했는데, 갑자기 키가 커졌다. #! /usr/bin/python# -*- 인코딩: UTF-8 -*-# 가져오기에 필요한 패키지 가져오기 팬더 as PD 가져오기 numpy as NP 가져오기 mapplotlib.py plot as PLT 가져오기 연산자 sklearn 에서 가져오기 ...
이것이 바로 이번에 소개된 파이썬 데이터 전자책의 모든 관련 내용이다. 우리가 정리한 자원이 여러분을 도울 수 있기를 바랍니다. 귀신에 대한 여러분의 지지에 감사드립니다.
참고: 액세스 방법: 개인 메시지 (666)