有人評(píng)價(jià)這樣評(píng)價(jià)R語(yǔ)言與網(wǎng)站分析這本書(shū),說(shuō)它是一本內(nèi)容挺實(shí)在的書(shū)。在這本書(shū)的字里行間你都能看到作者的用心。本節(jié)內(nèi)容東坡小編為大家整理帶來(lái)的這份r語(yǔ)言與網(wǎng)站分析電子書(shū)為pdf格式高清版,以下有關(guān)于R語(yǔ)言與網(wǎng)站分析這本書(shū)的內(nèi)容及目錄簡(jiǎn)介,如果你想要查閱這本電子書(shū)的話,點(diǎn)擊本文相應(yīng)的下載地址進(jìn)行下載即可!
r語(yǔ)言與網(wǎng)站分析目錄
前言
第1章 統(tǒng)計(jì)思維與網(wǎng)站分析 1
1.1 不確定與確定 1
1.2 統(tǒng)計(jì)分析方法 4
1.2.1 細(xì)分分析 4
1.2.2 對(duì)比分析 6
1.2.3 趨勢(shì)分析 7
1.3 網(wǎng)站分析概要 7
1.3.1 解決用戶(hù)需求 7
1.3.2 尋找新的用戶(hù)需求 10
第2章 R語(yǔ)言數(shù)據(jù)操作基礎(chǔ) 11
2.1 R簡(jiǎn)介 11
2.2 了解R軟件 11
2.2.1 軟件安裝 11
2.2.2 R軟件界面 12
2.2.3 工作目錄 14
2.2.4 命令行交互 15
2.2.5 命令腳本文件 16
2.2.6 工作空間數(shù)據(jù) 16
2.2.7 幫助 17
2.2.8 R語(yǔ)言入門(mén) 18
2.2.9 擴(kuò)展算法包 19
2.3 R語(yǔ)言的數(shù)據(jù)類(lèi)型 21
2.4 對(duì)象及其屬性 23
2.4.1 固有屬性:模式和長(zhǎng)度 24
2.4.2 讀取和設(shè)置屬性值 24
2.4.3 對(duì)象的搜索和刪除 25
2.5 向量 26
2.5.1 創(chuàng)建向量 26
2.5.2 向量索引 26
2.5.3 向量編輯 29
2.5.4 向量排序 29
2.5.5 向量去重 30
2.5.6 缺失值處理 30
2.5.7 向量間操作 31
2.6 矩陣和數(shù)組 31
2.6.1 創(chuàng)建矩陣 32
2.6.2 矩陣索引 33
2.6.3 矩陣編輯 34
2.6.4 矩陣的運(yùn)算 35
2.6.5 數(shù)組 37
2.6.6 apply函數(shù)應(yīng)用 38
2.7 列表和數(shù)據(jù)框 39
2.7.1 列表的創(chuàng)建和索引 39
2.7.2 列表編輯 40
2.7.3 數(shù)據(jù)框的創(chuàng)建和名稱(chēng) 40
2.7.4 數(shù)據(jù)框索引 41
2.7.5 數(shù)據(jù)框編輯 43
2.7.6 缺失值處理 44
2.8 因子 44
2.8.1 無(wú)序和有序因子 45
2.8.2 連續(xù)數(shù)據(jù)的離散化 46
2.9 字符串操作 47
2.9.1 字符串長(zhǎng)度nchar 48
2.9.2 字符串合并和分割 48
2.9.3 字符串內(nèi)部字符的讀取和替換 49
2.9.4 正則表達(dá)式 52
2.10 常用數(shù)據(jù)的創(chuàng)建 53
2.10.1 因子序列的創(chuàng)建 53
2.10.2 等差序列的創(chuàng)建 54
2.10.3 隨機(jī)抽樣sample 54
2.10.4 重復(fù)序列rep 55
2.10.5 概率分布 55
2.11 控制流 58
2.11.1 分支語(yǔ)句 58
2.11.2 循環(huán)語(yǔ)句 59
2.12 運(yùn)算符、函數(shù)和過(guò)程 61
2.12.1 常用運(yùn)算符 61
2.12.2 函數(shù) 62
2.12.3 過(guò)程 63
2.13 數(shù)據(jù)的讀寫(xiě)等操作 64
2.13.1 讀取數(shù)據(jù) 64
2.13.2 輸出數(shù)據(jù) 68
第3章 R語(yǔ)言的繪圖基礎(chǔ) 69
3.1 概述 69
3.2 顏色以及文字/點(diǎn)/線參數(shù)的設(shè)置 69
3.2.1 顏色 71
3.2.2 文字元素相關(guān)參數(shù)設(shè)置 76
3.2.3 點(diǎn)元素相關(guān)參數(shù)設(shè)置 77
3.2.4 線元素相關(guān)參數(shù)設(shè)置 79
3.3 低級(jí)繪圖函數(shù) 80
3.3.1 引例 80
3.3.2 標(biāo)題 81
3.3.3 圖例 83
3.3.4 坐標(biāo)軸 84
3.3.5 邊框 88
3.3.6 網(wǎng)格線 89
3.3.7 點(diǎn) 90
3.3.8 線 91
3.3.9 文字 94
3.3.10 多邊形 96
3.4 高級(jí)繪圖函數(shù)以及常用繪圖應(yīng)用 96
3.4.1 圖形類(lèi)型的選擇 96
3.4.2 散點(diǎn)圖 98
3.4.3 氣泡圖 100
3.4.4 曲線圖 102
3.4.5 柱狀圖 105
3.4.6 條形圖 109
3.4.7 餅圖 111
3.4.8 面積堆積圖 115
3.4.9 直方圖和密度曲線圖 118
3.5 繪圖窗口操作函數(shù) 120
3.5.1 單一窗口中的子繪圖區(qū)域布局 120
3.5.2 繪圖窗口操作 120
第4章 單指標(biāo)分析 121
4.1 指標(biāo)描述 121
4.1.1 平均值和集中趨勢(shì) 121
4.1.2 正態(tài)分布 126
4.1.3 頻數(shù)分析 130
4.1.4 描述性分析指標(biāo) 131
4.2 異常點(diǎn)監(jiān)控 133
4.2.1 概述 133
4.2.2 P控制圖:監(jiān)控轉(zhuǎn)化率型指標(biāo) 135
4.2.3 單值–均值控制圖 142
4.2.4 單值–移動(dòng)極差控制圖 147
4.3 連續(xù)型指標(biāo)的對(duì)比 150
4.3.1 數(shù)據(jù)變換 150
4.3.2 假設(shè)檢驗(yàn) 152
4.3.3 相同指標(biāo)內(nèi)的兩組數(shù)對(duì)比:T檢驗(yàn) 153
4.3.4 相同指標(biāo)內(nèi)的多組數(shù)據(jù)對(duì)比:?jiǎn)我蛩胤讲罘治?156
4.3.5 單因素協(xié)方差分析 163
4.4 分類(lèi)型指標(biāo)的對(duì)比 167
4.4.1 列聯(lián)表分析 167
4.4.2 卡方獨(dú)立性檢驗(yàn) 172
第5章 時(shí)間序列分析 177
5.1 時(shí)間序列 177
5.2 增長(zhǎng)率 180
5.2.1 環(huán)比增長(zhǎng)率 180
5.2.2 同比增長(zhǎng)率 181
5.3 移動(dòng)平均 181
5.3.1 數(shù)學(xué)原理概述 181
5.3.2 filter函數(shù) 182
5.3.3 R語(yǔ)言實(shí)現(xiàn) 184
5.4 指數(shù)平滑 185
5.4.1 一次指數(shù)平滑 186
5.4.2 二次指數(shù)平滑 187
5.4.3 三次指數(shù)平滑 191
5.5 ARIMA模型 194
5.5.1 自相關(guān)性 194
5.5.2 平穩(wěn)性和白噪聲 199
5.5.3 MA滑動(dòng)平均過(guò)程 200
5.5.4 AR自回歸過(guò)程 202
5.5.5 ARMA自回歸滑動(dòng)平均混合過(guò)程 203
5.5.6 檢驗(yàn)?zāi)P唾|(zhì)量 205
5.5.7 非平穩(wěn)時(shí)間序列的ARIMA過(guò)程 208
第6章 連續(xù)指標(biāo)建模:回歸分析 213
6.1 一元線性回歸分析 213
6.1.1 引例 213
6.1.2 一元線性回歸分析的原理及R語(yǔ)言實(shí)現(xiàn) 214
6.2 多元回歸分析 221
6.2.1 引例 222
6.2.2 多元線性回歸分析建模 222
6.2.3 模型修正函數(shù)update() 223
6.2.4 逐步回歸分析函數(shù)step() 226
6.2.5 自變量中包含分類(lèi)型數(shù)據(jù)的回歸分析 228
6.3 Logic回歸分析 230
6.3.1 引例及數(shù)據(jù) 230
6.3.2 logic分析的原理 230
6.3.3 R語(yǔ)言實(shí)現(xiàn) 232
6.4 回歸樹(shù)CART 237
6.4.1 rpart函數(shù) 237
6.4.2 預(yù)測(cè)及模型性能衡量 240
6.4.3 過(guò)度擬合和剪枝 240
第7章 分類(lèi)指標(biāo)建模:分類(lèi)分析 243
7.1 決策樹(shù)分類(lèi)分析 243
7.1.1 概述 243
7.1.2 C4.5算法 247
7.1.3 CART算法 258
7.1.4 條件推理決策樹(shù)算法 265
7.1.5 隨機(jī)森林算法 267
7.2 貝葉斯分類(lèi) 268
7.2.1 貝葉斯定理 268
7.2.2 樸素貝葉斯分類(lèi)器 270
7.3 支持向量機(jī)SVM 271
7.3.1 原理 271
7.3.2 在R語(yǔ)言中實(shí)現(xiàn)非線性SVM分析 273
7.4 人工神經(jīng)網(wǎng)絡(luò) 274
7.4.1 神經(jīng)元 274
7.4.2 兩層網(wǎng)絡(luò) 275
7.4.3 反向傳播算法 276
7.4.4 R語(yǔ)言實(shí)現(xiàn) 282
7.4.5 隱藏層中神經(jīng)單元數(shù)目的確定 283
7.5 分類(lèi)器的性能評(píng)估 284
7.5.1 混淆矩陣 284
7.5.2 ROC曲線和AUC 287
7.5.3 提升度和提升曲線 291
7.5.4 洛倫茲曲線 292
第8章 樣本細(xì)分 293
8.1 數(shù)據(jù)降維 293
8.1.1 問(wèn)題引入 293
8.1.2 因子分析概述 294
8.1.3 factanal函數(shù) 296
8.1.4 實(shí)例:?jiǎn)柧碚{(diào)查的因子分析 297
8.2 聚類(lèi)分析 303
8.2.1 距離 303
8.2.2 層次聚類(lèi) 313
8.2.3 kmeans聚類(lèi) 318
8.3 樣本判別 321
8.3.1 knn(k最近鄰分類(lèi))算法 323
8.3.2 實(shí)例:基于knn算法的商品推薦系統(tǒng) 324
第9章 樣本間的關(guān)系 329
9.1 關(guān)聯(lián)分析 329
9.1.1 關(guān)聯(lián)分析的原理 329
9.1.2 Apriori算法的R語(yǔ)言實(shí)現(xiàn) 331
9.2 序列模式關(guān)聯(lián)分析 334
9.2.1 序列模式關(guān)聯(lián)分析的原理 334
9.2.2 序列模式關(guān)聯(lián)分析的R語(yǔ)言實(shí)現(xiàn) 336
9.2.3 實(shí)例:用戶(hù)點(diǎn)擊頁(yè)面的行為分析 338
9.3 關(guān)系網(wǎng)絡(luò)分析 346
9.3.1 網(wǎng)絡(luò)關(guān)系分析的基本概念 346
9.3.2 中心度 356
9.3.3 中心勢(shì) 362
9.3.4 社群發(fā)現(xiàn) 363
9.3.5 實(shí)例:分析微博的傳播特性 367
9.3.6 實(shí)例:購(gòu)物車(chē)商品分類(lèi)分析 370
第10章 文本分析 378
10.1 數(shù)據(jù)處理 378
10.1.1 數(shù)據(jù)引例 378
10.1.2 分詞和詞條 380
10.1.3 語(yǔ)料庫(kù)和文檔 381
10.1.4 詞條—文檔關(guān)系矩陣 384
10.2 實(shí)例:QQ群消息歷史分析 387
10.2.1 數(shù)據(jù)集 387
10.2.2 數(shù)據(jù)集格式轉(zhuǎn)化 389
10.2.3 留言文本的分詞操作 390
10.2.4 分析常用話題詞匯 391
10.2.5 建立用戶(hù)–詞條間的網(wǎng)絡(luò)關(guān)系圖 392
10.2.6 繪制重點(diǎn)詞條和用戶(hù)的網(wǎng)絡(luò)圖 392
10.3 XML包爬取網(wǎng)頁(yè)數(shù)據(jù) 394
10.3.1 htmlParse函數(shù) 395
10.3.2 getNodeSet函數(shù) 395
10.3.3 xmlValue函數(shù) 396
10.3.4 xmlGetAttr函數(shù) 396
10.3.5 實(shí)例:爬取某電商網(wǎng)站襯衫類(lèi)目商品的部分信息 397
第11章 網(wǎng)站指標(biāo)監(jiān)控系統(tǒng)的搭建 400
11.1 gWidgets包基礎(chǔ) 400
11.1.1 環(huán)境搭建 400
11.1.2 引例 401
11.1.3 常用控件 406
11.2 實(shí)例:商品搜索算法參數(shù)配置監(jiān)控GUI系統(tǒng) 414
11.2.1 商品搜索算法概述 414
11.2.2 原始商品信息 415
11.2.3 系統(tǒng)概述 417
11.2.4 模塊布局 418
11.2.5 計(jì)算除關(guān)鍵字匹配以外的指標(biāo)得分 420
11.2.6 模擬一次搜索行為數(shù)據(jù) 421
11.2.7 模擬多次搜索行為數(shù)據(jù) 423
11.2.8 繪圖 423
第12章 基于RFM模型的客戶(hù)價(jià)值系統(tǒng) 427
12.1 馬爾科夫鏈 427
12.1.1 引例 427
12.1.2 概念 428
12.1.3 預(yù)測(cè)實(shí)例 428
12.2 RFM模型 431
12.2.1 RFM的概念 431
12.2.2 數(shù)據(jù)集 431
12.2.3 購(gòu)買(mǎi)行為隨機(jī)模型 432
12.3 結(jié)合馬爾科夫鏈的RFM模型 436
12.3.1 購(gòu)買(mǎi)狀態(tài)轉(zhuǎn)移矩陣 437
12.3.2 預(yù)測(cè)用戶(hù)購(gòu)買(mǎi)狀態(tài) 445
r語(yǔ)言與網(wǎng)站分析簡(jiǎn)介
該書(shū)是目前為止國(guó)內(nèi)唯一一本闡述如何使用R語(yǔ)言來(lái)分析和挖掘互聯(lián)網(wǎng)數(shù)據(jù)的應(yīng)用性書(shū)籍。書(shū)中使用大量的實(shí)際案例,把數(shù)學(xué)原理同R語(yǔ)言實(shí)現(xiàn)方案有機(jī)結(jié)合起來(lái)。力圖通過(guò)案例分析達(dá)到舉一反三的效果,進(jìn)而指導(dǎo)讀者在日后的實(shí)際工作中進(jìn)行應(yīng)用。同時(shí)書(shū)中也闡述眾多常用的數(shù)據(jù)分析和挖掘的方法和原理,對(duì)于非互聯(lián)網(wǎng)的從業(yè)人員也很有指導(dǎo)意義
該書(shū)從互聯(lián)網(wǎng)應(yīng)用角度對(duì)R語(yǔ)言如何實(shí)現(xiàn)數(shù)據(jù)挖掘和指標(biāo)分析等問(wèn)題做了闡述。通過(guò)諸多真實(shí)應(yīng)用案例的分析,作者試圖為讀者建立起一座溝通數(shù)學(xué)原理和互聯(lián)網(wǎng)實(shí)際業(yè)務(wù)應(yīng)用的橋梁。同時(shí)本書(shū)給出了案例中的完整代碼以及分析過(guò)程,力圖幫助讀者充分理解R語(yǔ)言是如何實(shí)現(xiàn)算法的。
r語(yǔ)言與網(wǎng)站分析電子書(shū)內(nèi)容截圖
- PC官方版
- 安卓官方手機(jī)版
- IOS官方手機(jī)版