評論

滿額折

R語言數據挖掘方法及應用（簡體書）

系列名：統計分析系列
ISBN13：9787121283277
出版社：電子工業出版社
作者：薛薇
出版日：2016/04/01
裝訂／頁數：平裝／392頁
規格：26cm*19cm (高/寬)
版次：一版
關鍵字： R語言數據挖掘方法及應用（簡體書）、語言、數據、挖掘、方法、應用、簡體、電子工業出版社、薛薇、簡體書、電腦〈計算機〉、電腦入門、程序語言、算法語言、

中國圖書館分類

：

程序語言、算法語言

人民幣定價：49 元

定價

：NT$ 294 元

優惠價

：87 折 256 元

領券後再享88折起

領

海外經銷商無庫存，到貨日平均30天至45天

可得紅利積點：7 點

相關商品

商品簡介

作者簡介

序

商品簡介

大資料不僅意味著資料的積累、存儲與管理，更意味著大資料的分析。資料採擷無可爭議地成為當今大資料分析的核心利器。R語言因徹底的開放性策略業已躋身資料採擷工具之首列。本書以“R語言資料採擷入門並不難”為開篇，總覽了資料採擷的理論和應用輪廓，明確了R語言入門的必備知識和學習路線，並展示了資料採擷的初步成果，旨在使讀者快速起步資料採擷實踐。後續圍繞資料採擷應用的四大核心方面，安排了資料預測篇：立足資料預測未知，資料分組篇：發現資料中的自然群組，資料關聯篇：發現資料的內在關聯性，離群資料探索篇：發現資料中的離群點。每篇下各設若幹章節，各章節從簡單易懂且具代表性的案例問題入手，剖析理論方法原理，講解R語言實現，並給出案例的R語言資料採擷代碼和結果解釋。本書內容覆蓋之廣泛，原理講解之通俗，R語言實現步驟之詳盡，在國內外同類書籍中尚不多見。相關資料資料及電子教案，可登錄華信教育資源網www.hxedu.com.cn免費下載。

作者簡介

薛薇，中國人民大學副教授，教研室主任，資深作者。主要著作：《SPSS統計分析方法及應用》、《SPSS MODOLER資料採擷方法及應用》。

序

前言
大資料時代不僅僅意味著資料的積累、存儲與管理，更意味著對資料的建模與分析。資料採擷無可爭議地成為當今大資料分析的核心利器。
儘管早在20世紀末資料採擷的概念就被提出來，但資料採擷的蓬勃應用其實才剛剛起步。這不僅得益於資料採擷不斷汲取並集成機器學習、統計學和視覺化等學科領域的研究成果，理論日趨成熟，得益於大資料環境基礎和大資料分析需求，更得益於開放性的資料採擷應用實施平臺。
因採取徹底的開放性策略，R語言已成為近年來出類拔萃的資料採擷工具之一。其特點主要是：開源性，即可以免費下載並升級；全面性，即資料採擷方法豐富全面，覆蓋面廣泛；操作簡便性，即直接採用函式呼叫相關演算法，且通過簡單程式設計可完成複雜的資料處理和方法拓展；可擴展性，即R語言通過網路社區平臺，吸引越來越多的專家學者和應用人員成為R的開發者，為R語言不斷增添更有效、更前沿的資料採擷方法。所以，R語言是一款應用前景廣闊的資料採擷工具。
本書以R語言資料採擷入門並不難為起步篇，總覽了資料採擷的理論輪廓，厘清了相關概念，明確了R語言入門的必備知識和深入學習路線，並給出了對資料的直觀印象這個R語言資料採擷的初步成果。旨在使讀者在沒有相關知識儲備的情況下，也能夠快速起步資料採擷實踐。後續，本書圍繞資料採擷應用的四大核心方面，安排了資料預測篇：立足資料預測未知，資料分組篇：發現資料中的自然群組，資料關聯篇：發現資料的內在關聯性，離群資料探索篇：發現資料中的離群點。每篇下各設若幹章節，每個章節從簡單的案例問題入手，剖析理論方法原理，講解R語言實現，給出案例的R語言資料採擷代碼和結果解釋。覆蓋內容之廣泛，R實現步驟之詳盡，都是國內外同類書籍中不多見的。這是本書的特點之一。
我們認為“道”和“術”的結合，無論對資料採擷的初學者還是應用實踐者都是必要的。“道”是資料採擷方法，“道”是原理，此原理不是數學公式的簡單羅列，而是透徹的知識認知。所以，本書希望努力給出“道”的直觀闡述，並以儘量準確、簡短和通俗的語言，將“道”體現在章節的主副題目上，使讀者一目了然。“術”是資料採擷的R代碼，“術”是操作，此操作不是R函數的簡單呈現，而是演算法實現和應用的通用範本，是説明讀者實現資料採擷實踐的有效工具。所以，本書力圖利用R語言類比充分直觀展現“道”，並通過有代表性的資料案例，畫龍點睛地闡明R的“術”。每章都配有案例數據和R程式碼，使讀者不但知其然，更知其所以然和如何然。此外，各章均以附錄形式給出本章涉及的R函數清單，方便讀者查閱。這是本書的特點之二。
進一步，目前R語言包的數量已多達7000多個，且還在快速增長。R的開放性決定了可能有諸多包都可以實現相同的資料採擷演算法。對此，本書選擇R中主流的且被有效驗證和廣泛使用的包，既保證經典性也兼顧有效性，同時也解決了初學者因陷於眾多R的“包”圍中而無從下手的問題。這是本書的特點之三。
最後，對R語言資料採擷的初學者，建議按照本書章節結構，循序漸進地學習，並參照書中示例，邊學邊做，加深概念理解和提升R語言熟練度。對有一定R語言基礎或資料採擷應用經驗的學習者，因本書各篇和章節具有相對獨立性，採用“以資料為導向”和“以問題為導向”的有針對性的R語言資料採擷學習策略均是可行的。
本書適合高等院校相關專業的本科生和研究生學習使用，也適合商業企業、科研機構、政府管理部門等相關人員閱讀參考。感謝付強、高峰、何建成、王曉靜、肖偉、黃玉婷、陳笑語等同仁同學對本書的貢獻和寶貴建議。書中不妥和錯誤之處，誠望讀者不吝指正。
薛薇
于中國人民大學統計學院

目錄

第一篇起步篇：R語言資料採擷入門並不難

第1章資料採擷與R語言概述
【本章學習目標】
1.1 為什麼要學習資料採擷和R語言
1.2 什麼是資料採擷
1.3資料採擷能給出什麼
1.3.1資料採擷結果有哪些呈現方式
1.3.2 資料採擷結果有哪些基本特徵
1.4 資料採擷能解決什麼問題
1.4.1 資料預測
1.4.2 發現資料的內在結構
1.4.3 發現關聯性
1.4.4 模式診斷
1.5 資料採擷解決問題的思路
1.6資料採擷有哪些典型的商業應用
1.6.1 資料採擷在客戶細分中的應用
1.6.2 資料採擷在客戶流失分析中的應用
1.6.3 資料採擷在行銷回應分析中的應用
1.6.4 資料採擷在交叉銷售中的應用
1.6.5 資料採擷在欺詐甄別中的應用
1.7 R語言入門需要知道什麼
1.7.1 什麼是R的包
1.7.2 如何獲得 R
1.7.3 R如何起步
1.7.4 R的基本操作和其他
【本章附錄】

第2章 R語言資料採擷起步：R物件和資料組織
【本章學習目標】
2.1 什麼是R的資料物件
2.1.1 R的資料物件有哪些類型
2.1.2 如何創建和訪問R的資料物件
2.2 如何用R的向量組織資料
2.2.1 創建只包含一個元素的向量
2.2.2 創建包含多個元素的向量
2.2.3 訪問向量中的元素
2.3 如何用R的矩陣組織資料
2.3.1 創建矩陣
2.3.2 訪問矩陣中的元素
2.4 如何用R的資料框組織資料
2.4.1 創建資料框
2.4.2 訪問資料框
2.5 如何用R的陣列、清單組織資料
2.5.1 創建和訪問陣列
2.5.2 創建和訪問清單
2.6 R資料物件的相互轉換
2.6.1 不同存儲類型之間的轉換
2.6.2 不同結構類型之間的轉換
2.7 如何將外部資料組織到R資料物件中
2.7.1 將文本資料組織到R物件中
2.7.2 將SPSS資料組織到R物件中
2.7.3 將資料庫和Excel表資料組織到R物件中
2.7.4 將網頁表格資料組織到R物件中
2.7.5 R有哪些自帶的資料包
2.7.6 如何將R物件中的資料保存起來
2.8 R程式設計需哪些必備知識
2.8.1 R程式設計涉及哪些基本概念
2.8.2 R有哪些常用的系統函數
2.8.3 使用者自訂函數提升程式設計水準
2.8.4 如何提高R程式處理的能力
2.9 R程式設計與資料整理綜合應用
2.9.1 綜合應用一：資料的基本處理
2.9.2 綜合應用二：如何將匯總資料還原為原始資料
【本章附錄】

第3章 R語言資料採擷初體驗：對資料的直觀印象
【本章學習目標】
【案例與思考】
3.1 資料的直觀印象
3.1.1 R的資料視覺化平臺是什麼?
3.1.3 R的圖形邊界和佈局
3.1.2 R的圖形組成和圖形參數
3.1.4 如何修改R的圖形參數？
3.2如何獲得單變數分佈特徵的直觀印象
3.2.1核密度圖：車險理賠次數的分佈特點是什麼？
3.2.2 小提琴圖：不同車型車險理賠次數的分佈有差異嗎？
3.2.3克利夫蘭點圖：車險理賠次數存在異常嗎？
3.3如何獲得多變數聯合分佈的直觀印象
3.3.1 曲面圖和等高線圖
3.3.2 二元核密度曲面圖：投保人年齡和車險理賠次數的聯合分佈特點是什麼？
3.3.3 雷達圖：不同區域氣候特點有差異嗎？
3.4如何獲得變數間相關性的直觀印象
3.4.1 馬賽克圖：車型和車齡有相關性嗎？
3.4.2 散點圖：這些因素會影響空氣濕度嗎？
3.4.3 相關係數圖：淘寶各行業商品成交指數有相關性嗎？
3.5如何獲得GIS資料的直觀印象
3.5.1 繪製世界地圖和美國地圖
3.5.2 繪製中國行政區劃地圖
3.5.3 依據地圖繪製熱力圖：不同省市的淘寶女裝成交指數有差異嗎？
3.7如何獲得文本詞頻資料的直觀印象：政府工作報告中有哪些高頻詞?
【本章附錄】

第二篇資料預測篇：立足資料預測未知

第4章基於近鄰的分類預測：與近鄰有趨同的選擇！
【本章學習目標】
【案例與思考】
4.1近鄰分析： K-近鄰法
4.1.1 K-近鄰法中的距離
4.1.2 K-近鄰法中的近鄰個數
4.1.3 R的K-近鄰法和模擬分析
4.1.4 K-近鄰法應用：天貓成交顧客的分類預測
4.2 K-近鄰法的適用性及特徵選擇
4.2.1 K-近鄰法的適用性
4.2.2 特徵選擇：找到重要變數
4.3基於變數重要性的加權K-近鄰法
4.3.1 基於變數重要性的加權K-近鄰法的基本原理
4.3.2 變數重要性判斷應用：天貓成交顧客預測中的重要變數
4.4基於觀測相似性的加權K-近鄰法
4.4.1 加權K-近鄰法的權重設計
4.4.2 加權K-近鄰法的距離和相似性變換
4.4.3 加權K-近鄰法的R實現
4.4.4加權K-近鄰法應用：天貓成交顧客的分類預測
【本章附錄】

第5章基於規則的分類和組合預測：給出易懂且穩健的預測！
【本章學習目標】
【案例與思考】
5.1決策樹概述
5.1.1 什麼是決策樹？
5.1.2 決策樹的幾何意義是什麼？
5.1.3 決策樹的核心問題
5.2 分類回歸樹的生長過程
5.2.1 分類樹的生長過程
5.2.2 回歸樹的生長過程
5.2.3損失矩陣對分類樹的影響
5.3 分類回歸樹的剪枝
5.3.1 最小代價複雜度的測度
5.3.2 分類回歸樹後剪枝過程
5.3.3 分類回歸樹的交叉驗證剪枝
5.4 分類回歸樹的R實現和應用
5.4.1 分類回歸樹的R實現
5.4.2 分類回歸樹的應用：提煉不同消費行為顧客的主要特徵
5.5 建立分類回歸樹的組合預測模型：給出穩健的預測
5.5.1 袋裝技術
5.5.2 袋裝技術的R實現
5.5.3 袋裝技術的應用：穩健定位目標客戶
5.5.4 推進技術
5.5.5 推進技術的R實現
5.5.6 推進技術的應用：穩健定位目標客戶
5.6 隨機森林：具有隨機性的組合預測
5.6.1 什麼是隨機森林？
5.6.2 隨機森林的R實現
5.6.3 隨機森林的應用：穩健定位目標客戶
【本章附錄】

第6章基於神經網路的分類預測：給出高精確的預測！
【本章學習目標】
【案例與思考】
6.1 人工神經網路概述
6.1.1 人工神經網路和種類
6.1.2 節點：人工神經網路的核心處理器
6.1.3 建立人工神經網路的一般步驟
6.1.4感知機模型：確定連接權重的基本策略
6.2 B-P反向傳播網路：最常見的人工神經網路
6.2.1 B-P反向傳播網路的三大特點
6.2.2 B-P反向傳播演算法：確定連接權重
6.2.3 學習率：影響連接權重調整的重要因素
6.3 B-P反向傳播網路的R實現和應用
6.3.1 neuralnet包中的neuralnet函數
6.3.2 neuralnet函數的應用：精准預測顧客的消費行為
6.3.3 利用ROC曲線確定概率分割值
6.3.4 nnet包中的nnet函數
【本章附錄】

第7章基於支援向量的分類預測：給出最大把握的預測！
【本章學習目標】
【案例與思考】
7.1 支持向量分類概述
7.1.1支持向量分類的基本思路：確保把握程度
7.1.2支持向量分類的三種情況
7.2理想條件下的分類：線性可分時的支援向量分類
7.2.1如何求解超平面
7.2.1如何利用超平面進行分類預測
7.3 一般條件下的分類：廣義線性可分時的支援向量分類
7.3.1如何求解超平面
7.3.2 可調參數的意義：把握程度和精度的權衡
7.4 複雜條件下的分類：線性不可分時支援向量分類
7.4.1 線性不可分的一般解決途徑和維災難問題
7.4.2 支持向量分類克服維災難的途徑
7.5 多分類的支持向量分類：二分類的拓展
7.6 支持向量回歸：解決數值預測問題
7.6.1 支援向量回歸與一般線性回歸：目標和策略
7.6.2 支持向量回歸的基本思路
7.7 支持向量機的R實現及應用
7.7.1支持向量機的R實現
7.7.2 利用R類比線路性可分下的支持向量分類
7.7.3 利用R類比線路性不可分下的支持向量分類
7.7.4 利用R模擬多分類的支援向量分類
7.7.5 支援向量分類應用：天貓成交顧客的預測
【本章附錄】

第三篇資料分組篇：發現資料中的自然群組

第8章常規聚類：直觀的資料全方位自動分組
【本章學習目標】
【案例與思考】
8.1 聚類分析概述
8.1.1聚類分析目標：發現資料中的“自然小類”
8.1.2 有哪些主流的聚類演算法？
8.2基於質心的聚類：K-Means聚類
8.2.1 K-Means聚類中的距離測度：體現全方位性
8.2.2 K-Means聚類過程：多次自動分組
8.2.3 K-Means聚類的R實現和模擬分析
8.2.4 K-Means聚類的應用：環境污染的區域劃分
8.3 PAM聚類：改進的K- Means聚類
8.3.1 PAM聚類過程
8.3.2 PAM聚類的R實現和模擬分析
8.3基於聯通性的聚類：層次聚類
8.3.1 層次聚類的基本過程：循序漸進的自動分組
8.3.2 層次聚類的R實現和應用：環境污染的區域劃分
8.4基於統計分佈的聚類：EM聚類
8.4.1 基於統計分佈的聚類出發點：有限混合分佈
8.4.2 EM聚類：如何估計類參數和聚類解
8.4.3 EM聚類的R實現和模擬分析
8.4.4 EM聚類的應用：環境污染的區域劃分
【本章附錄】
第9章特色聚類：資料分組還可以這樣做！
【本章學習目標】
【案例與思考】
9.1 BIRCH聚類概述
9.1.1 BRICH聚類有哪些特點？
9.1.2 聚類特徵和聚類特徵樹：BIRCH聚類的重要策略
9.1.3 BIRCH的聚類過程：由存儲空間決定的動態聚類
9.1.4 BRICH聚類的R實現
9.1.5 BRICH聚類應用：兩期崗位培訓的比較
9.2 SOM網路聚類概述
9.2.1 SOM網路聚類設計出發點

主題書展

主題書展

更多書展

本週66折

日本近代藝術史

一星期零一夜：電話爺爺貝爾說故事

敲療：經絡對位敲打法－比拍打更有效，比刀療更安全！第一本完整介紹經絡原理的治痠止痛圖解書

大喜妙懲壞地主─大喜說故事系列10

滿分必考英文單字帶著走：擴散式聯想記憶＋分級程度對照＋重要考點練習＆解析應考速記三大策略（外掛！滿分策略必考單字隨掃即聽英中對照音檔）

日本近代文學概說

不只蘋果掉下來！：現代科學之父牛頓

種瓜得瓜種豆得豆：遺傳學之父孟德爾

零基礎AI入門書：看圖就懂的AI應用實作

Diamond：鮮血、汗水與泥土，一部鑽石貿易的全球史

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大，除封面破損、內頁脫落等較嚴重的狀態，其餘商品將正常出貨。

特別提醒：部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供，需以QR CODE 連結至當地網站註冊“並通過驗證程序”，方可下載使用。

無現貨庫存之簡體書，將向海外調貨：
海外有庫存之書籍，等候約45個工作天;
海外無庫存之書籍，平均作業時間約60個工作天，然不保證確定可調到貨，尚請見諒。

為了保護您的權益，「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨，請在商品鑑賞期內寄回，且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

熱搜：

R語言數據挖掘方法及應用（簡體書）

商品資訊

系列名：統計分析系列

ISBN13：9787121283277

出版社：電子工業出版社

作者：薛薇

出版日：2016/04/01

裝訂／頁數：平裝／392頁

規格：26cm*19cm (高/寬)

版次：一版

商品簡介

作者簡介

序

目次

主題書展

簡體熱門影劇書展

簡體書新到貨

魅力．花火特展

悅讀紀特展

簡體新書搶先報

簡體新生代華文原創小說特展

領券專區

文具禮品大賞

泰戈爾經典詩集與小說戲劇集

母親節書展

本週66折

日本近代藝術史

一星期零一夜：電話爺爺貝爾說故事

敲療：經絡對位敲打法－比拍打更有效，比刀療更安全！第一本完整介紹經絡原理的治痠止痛圖解書

大喜妙懲壞地主─大喜說故事系列10

滿分必考英文單字帶著走：擴散式聯想記憶＋分級程度對照＋重要考點練習＆解析 應考速記三大策略（外掛！滿分策略必考單字隨掃即聽英中對照音檔）

日本近代文學概說

不只蘋果掉下來！：現代科學之父牛頓

種瓜得瓜種豆得豆：遺傳學之父孟德爾

零基礎AI入門書：看圖就懂的AI應用實作

Diamond：鮮血、汗水與泥土，一部鑽石貿易的全球史

您曾經瀏覽過的商品

購物須知

滿分必考英文單字帶著走：擴散式聯想記憶＋分級程度對照＋重要考點練習＆解析應考速記三大策略（外掛！滿分策略必考單字隨掃即聽英中對照音檔）