TOP
0
0
【簡體曬書節】 單本79折,5本7折,優惠只到5/31,點擊此處看更多!
Python數據分析實戰:從Excel輕鬆入門Pandas(簡體書)
滿額折

Python數據分析實戰:從Excel輕鬆入門Pandas(簡體書)

商品資訊

人民幣定價:79 元
定價
:NT$ 474 元
優惠價
87412
領券後再享89折起
海外經銷商無庫存,到貨日平均30天至45天
可得紅利積點:12 點
相關商品
商品簡介
作者簡介
名人/編輯推薦
目次

商品簡介

本書從零開始系統講解了使用Pandas導入Excel數據,然後使用Pandas技術對數據做整理和分析,後導出為不同形式的Excel文件。完整實現了數據的導入、處理、輸出的處理流程。 全書共10章。第1章為Pandas數據處理環境的搭建,第2章為使用Pandas對Excel數據讀取與保存,第3章介紹與Pandas底層數據相關的NumPy庫,第4章介紹了Pandas中DataFrame表格的增、刪、改、查等常用操作,第5章介紹了對Series與DataFrame兩種數據的運算、分支、遍歷等處理,第6章介紹了字符串的各種清洗技術,第7章介紹時間戳與時間差數據的處理,第8章介紹Pandas中分層索引及與索引相關的操作,第9章介紹了對數據的分組處理及做數據透視表處理,第10章介紹了表格的數據結構轉換,以及多表讀取與保存。書中包含相應示例,不僅可以學會理論知識還可以靈活應用。 本書可作為Excel愛好者和數據分析初學者的入門書籍,以及想提高數據分析效率,拓展數據分析手段相關人員的參考書籍。

作者簡介

曾賢志,Office技術培訓專家,我要自學網專家講師,特邀技術圖書作者,擅長使用VBA、SQL、Power BI、Python等技術做數據分析。著有《Power Query For Excel讓工作化繁為簡》《加薪不加班:174個Excel函數案例闖職場》《從Excel到Python:用Python輕鬆處理Excel數據》等與數據分析相關的技術圖書。 

名人/編輯推薦

本書是一本基礎入門加實戰的書籍,既有基礎知識,又有豐富示例,包括詳細的操作步驟,實操性強。本書對Pandas的基本概念講解很詳細,包括基本概念及代碼示例。

Excel是一款非常流行的電子表格軟件。它是一種很好的數據存儲方式,同時也是一款強大的數據清洗、分析工具。任何事物有強就有弱。Excel本身已經內置了很多實用的功能,為什麼還要選擇Pandas工具來處理Excel數據呢?
首先,在Excel進行數據清洗時,如果工作重復度比較高,反復使用手動操作效率太低,不具有自動化功能。當然,也可以用Excel內置的VBA編程進行二次開發,解決自動化問題,但Pandas更勝一籌,其代碼簡潔,靈活性強,運算速度更快。
其次,Pandas是跨平臺的,在不同的操作系統上均可以使用。即使沒有安裝電子表格軟件,也可以使用。不但如此,Pandas還支持TXT、CSV、HTML和數據庫等更多格式的數據獲取方式。
那麼,什麼是Pandas?Pandas是Python中的一個數據分析包,是基於NumPy的(提供高性能的矩陣運算,這就標志著它的運算速度快)。並且Pandas提供了超強的數據清洗功能,可以用於數據挖掘和數據分析,可以說Pandas就是為數據分析而生的。
本書從學習Excel數據清洗的視角來學習Pandas,更易上手。很多時候,Pandas中編寫的數據處理代碼像Excel中的工作表函數公式一樣,一條代碼就能完成任務,優雅又簡潔。
本書主要內容
第1章介紹Anaconda集成環境的安裝,Jupyter Notebook的使用,以及Python語言的基礎語法應用。
第2章介紹Pandas對Excel/CSV文件的讀取與保存設置,並介紹Pandas的DataFrame和Series兩大核心數據結構。
第3章介紹NumPy數組的創建與轉換,並介紹NumPy數組的類型、缺失值、重復值等預處理,以及Series和DataFrame兩種數據結構的各種創建方法。
第4章介紹對DataFrame表格屬性的獲取與修改,表格的各種切片選擇方法,以及對表格增、刪、改、查的設置。
第5章介紹DataFrame、Series和單值3種不同結構數據之間的運算方法,並介紹Pandas中常用的分支判斷函數,以及Pandas中常用的循環遍歷函數和常用的統計函數。
第6章講解正則表達式的使用方法,Pandas中拆分、提取、查找、替換、去重、排序、合並等常用字符串處理函數。
第7章介紹時間戳、時間差數據處理的相關函數。
第8章介紹Pandas中分層索引的設置、創建,分層索引的切片選擇方法,以及分層索引的重命名、重置、排序、刪除等操作。
第9章講解Pandas中的分組處理技術,以及Pandas中的數據透視表技術。
第10章介紹DataFrame表格的縱向和橫向拼接技術,如何批量讀取Excel工作表數據為DataFrame表格,以及批量保存DataFrame表格數據到多工作表、多工作簿。
閱讀建議
本書是一本基礎入門加實戰的圖書,既有基礎知識,又有豐富示例,包括詳細的操作步驟,實操性強。本書對Pandas的基本概念講解很詳細,從第4章開始,在每章的後一節配有對整章知識應用的示例,並提供完整代碼,運行代碼就可以立即看到效果。這樣會給讀者信心,在輕鬆掌握基礎知識的同時快速進入實戰階段。
建議讀者對Excel有一定的操作基礎,這樣更方便對照學習。如果讀者有一定的Python基礎則更好,沒有Python基礎也不用擔心,第1章講解關於Python的基礎知識,在Pandas中應用Python的技術點也不多,例如在Pandas中基本不會使用Python循環語句。因而不用擔心Python基礎不好而學不會Pandas。
本書源代碼
掃描下方二維碼,可獲取本書示例的源代碼 

 致謝
成書不易,在寫作本書的過程中,筆者得到了很多人的支持與幫助。首先,感謝我的父母、岳父母及妻子,感謝你們一如既往對我工作的支持,成為我堅實的後盾; 然後還要感謝女兒雨柔、兒子果兒。你們是我堅持寫作的動力,一位普普通通的父親想給你們樹立一個榜樣。無論何時都不能忘記學習,哪怕每天只能進步一點點。只有知識才是我們一生中重要的財富。希望你們在自己的人生道路上,能保持一顆不拋棄、不放棄的心。
由於時間倉促,書中難免存在不妥之處,請讀者見諒,並提寶貴意見。
曾賢志
2022年1月

目次

第1章Pandas數據處理環境搭建

1.1Pandas環境配置

1.1.1安裝Python發行版本Anaconda

1.1.2程序編寫工具Jupyter Notebook

1.2Python基礎操作

1.2.1變量

1.2.2注釋

1.2.3代碼縮進

1.2.4數據結構

1.2.5控制語句

1.2.6函數

第2章Pandas中數據的存取

2.1讀取Excel文件數據

2.2讀取CSV文件數據

2.3保存為Excel文件格式

2.4保存為CSV文件格式

2.5Pandas中表格的結構

2.5.1DataFrame數據結構

2.5.2Series數據結構

第3章NumPy數據處理基石

3.1NumPy的定義

3.2NumPy數組的創建與轉換

3.2.1普通數組

3.2.2序列數組

3.2.3隨機數組

3.2.4轉換數組

3.3NumPy數組的預處理

3.3.1類型轉換

3.3.2缺失值處理

3.3.3重復值處理

3.4NumPy數組維度轉換

3.4.1數組維度轉換

3.4.2數組合並

3.5Series數據的創建

3.6DataFrame表格的創建

3.6.1使用NumPy數組創建DataFrame表格

3.6.2使用Python列表創建DataFrame表格

3.6.3使用Python字典創建DataFrame表格

第4章表格管理技術

4.1表格屬性獲取與修改

4.1.1表格屬性的獲取

4.1.2表格屬性修改

4.2表格的切片選擇

4.2.1切片法

4.2.2篩選法

4.2.3loc切片法

4.2.4iloc切片法

4.3添加表格的行和列

4.3.1添加行

4.3.2添加列

4.4刪除表格的行和列

4.4.1刪除行

4.4.2刪除列

4.4.3刪除有缺失值的行和列

4.5表格數據的修改

4.6鞏固案例

第5章數據處理基礎

5.1數據運算處理

5.1.1運算符與運算函數

5.1.2Series與單值的運算

5.1.3DataFrame與單值運算

5.1.4Series與Series運算

5.1.5DataFrame與DataFrame運算

5.1.6DataFrame與Series運算

5.1.7數據運算時的對齊特性

5.2數據分支判斷

5.2.1條件判斷處理1(mask()與where())

5.2.2條件判斷處理2(np.where())

5.3數據遍歷處理

5.3.1遍歷Series元素(map())

5.3.2遍歷DataFrame行和列(apply())

5.3.3遍歷DataFrame元素(applymap())

5.4數據統計處理

5.4.1聚合統計

5.4.2邏輯統計

5.4.3極值統計

5.4.4排名統計

5.5鞏固案例

5.5.1根據不同蔬菜的采購數量統計每天采購金額

5.5.2篩選出成績表中各科目均大於或等於100的記錄

5.5.3篩選出成績表中各科目的和大於或等於300的記錄

5.5.4統計每個人各科目總分之和的排名

5.5.5統計每個人所有考試科目的科目

第6章字符串清洗技術

6.1正則

6.1.1正則表達式的導入與創建

6.1.2正則表達式處理函數

6.1.3正則表達式編寫規則

6.2拆分

6.2.1普通拆分

6.2.2正則拆分

6.2.3拆分次數

6.2.4拆為表格

6.2.5實例應用

6.3提取

6.3.1將數據提取到列方向

6.3.2將數據提取到行方向

6.3.3實例應用

6.4查找

6.4.1查找位置

6.4.2查找判斷

6.4.3查找數據

6.4.4實例應用

6.5替換

6.5.1Series數據替換

6.5.2DataFrame表格替換

6.5.3實例應用

6.6長度

6.7重復

6.8修剪

6.9填充

6.9.1元素填充

6.9.2字符填充

6.10去重

6.10.1重復項判斷

6.10.2重復項刪除

6.11排序

6.11.1單列排序

6.11.2多列排序

6.11.3自定義排序

6.12合並

6.12.1Series數據自身元素合並

6.12.2Series數據與其他數據合並

6.13擴展

6.14鞏固案例

6.14.1篩選出分數中至少有3個大於或等於90分的記錄

6.14.2兩表查詢合並應用

6.14.3給關鍵信息加掩碼

6.14.4提取文本型單價後與數量做求和統計

6.14.5提取不重復名單

6.14.6對文本中的多科目成績排序

第7章日期和時間處理技術

7.1時間戳

7.1.1單個時間戳

7.1.2時間戳序列

7.1.3時間戳轉換

7.1.4時間戳信息獲取

7.2時間差

7.2.1單個時間差

7.2.2時間差序列

7.2.3時間差信息獲取

7.2.4時間差偏移

7.3鞏固案例

7.3.1根據出生日期計算年齡

7.3.2將不規範日期整理為標準日期

7.3.3根據開始時間到結束時間的時長計算金額

7.3.4根據借書起始時間及租借天數計算歸還日期

第8章高級索引技術

8.1Pandas索引

8.1.1Series索引

8.1.2DataFrame索引

8.2分層索引的設置

8.2.1Series的分層索引設置

8.2.2DataFrame的分層索引設置

8.3分層索引設置的4種方法

8.4文件導入導出時分層索引設置

8.5行索引與列數據的相互轉換

8.5.1列數據設置為行索引

8.5.2行索引設置為列數據

8.6分層索引切片

8.6.1選擇單行

8.6.2選擇單列

8.6.3選擇單值

8.6.4選擇多行多列

8.6.5選擇指定級別數據

8.6.6篩選索引

8.7索引的修改

8.7.1索引重命名

8.7.2索引重置

8.7.3索引排序

8.7.4索引層級交換

8.7.5索引刪除

8.8鞏固案例

8.8.1篩選出下半年總銷量大於上半年的記錄

8.8.2對文本型數字月份排序

8.8.3根據分數返回等級設置索引

第9章數據匯總技術

9.1分組處理

9.1.1分組

9.1.2聚合

9.1.3轉換

9.1.4過濾

9.1.5高級分組

9.2數據透視表

9.2.1指定索引方向分組聚合

9.2.2多列執行單種聚合

9.2.3單列執行多種聚合

9.2.4多列執行多種聚合

9.2.5指定列做指定聚合

9.2.6行索引和列索引分組聚合

9.2.7跟列數據長度相同的數組做分組

9.2.8數據透視表缺失值處理

9.2.9數據透視表的行和列總計設置

9.3鞏固案例

9.3.1提取各分組的前兩名記錄

9.3.2按條件篩選各分組的記錄

9.3.3提取各分組下的值

9.3.4分組批量拆分表格到Excel文件

9.3.5將數據透視表拆分為Excel文件

第10章表格轉換技術

10.1表格方向轉換

10.1.1列索引數據轉換成行索引數據

10.1.2將行索引數據轉換成列索引數據

10.2表格縱橫拼接

10.2.1表格縱向拼接(初級)

10.2.2表格縱向拼接(進階)

10.2.3表格橫向拼接(初級)

10.2.4表格橫向拼接(進階)

10.3表格數據存取

10.3.1批量讀取

10.3.2批量保存

10.4鞏固案例

10.4.1多個工作表數據合並

10.4.2工資條製作

10.4.3特殊的縱向表格拼接

10.4.4多工作表合並與聚合處理

10.4.5跨表查詢後再聚合匯總

10.4.6將匯總結果分發到不同工作表

 

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 412
海外經銷商無庫存,到貨日平均30天至45天

暢銷榜

客服中心

收藏

會員專區