Book description
阅读本书可以获得关于在Python下操作、处理、清洗、规整数据集的完整说明。本书第2版针对Python 3.6进行了更新,并增加了实际案例向你展示如何高效地解决一系列数据分析问题。你将在阅读过程中学习到较新版本的pandas、NumPy、IPython和Jupyter。
本书作者Wes McKinney是Python pandas项目的创始人。本书是对Python数据科学工具的实操化、现代化的介绍,非常适合刚学Python的数据分析师或刚学数据科学以及科学计算的Python编程者。数据文件和相关的材料可以在GitHub上找到。
- 使用IPython shell和Jupyter notebook进行探索性计算
- 学习NumPy(Numerical Python)的基础和高级特性
- 入门pandas库中的数据分析工具
- 使用灵活工具对数据进行载入、清洗、变换、合并和重塑
- 使用matplotlib创建富含信息的可视化
- 将pandas的groupby功能应用于对数据集的切片、切块和汇总
- 分析并操作规则和不规则的时间序列数据
- 利用完整的、详细的示例学习如何解决现实中的数据分析问题
Table of contents
- 封面
- 扉页
- 版权页
- 译者序
- 目录 (1/2)
- 目录 (2/2)
- 前言
- 第1章 准备工作
- 第2章 Python语言基础、IPython及Jupyter notebook
- 第3章 内建数据结构、函数及文件
- 第4章 NumPy基础:数组与向量化计算
- 第5章 pandas入门
- 第6章 数据载入、存储及文件格式
- 第7章 数据清洗与准备
- 第8章 数据规整:连接、联合与重塑
- 第9章 绘图与可视化
- 第10章 数据聚合与分组操作
- 第11章 时间序列
- 第12章 高阶pandas
- 第13章 Python建模库介绍
- 第14章 数据分析示例
- 附录A 高阶NumPy (1/7)
- 附录A 高阶NumPy (2/7)
- 附录A 高阶NumPy (3/7)
- 附录A 高阶NumPy (4/7)
- 附录A 高阶NumPy (5/7)
- 附录A 高阶NumPy (6/7)
- 附录A 高阶NumPy (7/7)
- 附录B 更多IPython系统相关内容 (1/4)
- 附录B 更多IPython系统相关内容 (2/4)
- 附录B 更多IPython系统相关内容 (3/4)
- 附录B 更多IPython系统相关内容 (4/4)
- 作者介绍
- 封面介绍
Product information
- Title: 利用 Python 进行数据分析(原书第2版)
- Author(s):
- Release date: July 2018
- Publisher(s): China Machine Press
- ISBN: 9787111603702
You might also like
book
社交网站的数据挖掘与分析 (原书第3 版)
本书指导你挖掘隐藏在Twitter、Facebook、LinkedIn、Instagram和GitHub等流行社交网站上的丰富数据。通过这本畅销指南,数据科学家、分析师和程序员将学习如何在Jupyter Notebook或者Docker容器中使用Python代码分析社交媒体中的真知灼见——哪些人正在通过社交媒体进行联系?他们正在谈论什么?他们目前身在何处? 在本书的第一部分,每一章都聚焦社交网站生态的某个具体方面,囊括了各大主流社交网站,也包括了网页、博客和订阅源、邮箱、GitHub以及新增加的Instagram的内容。第二部分提供了实用指南,其中包括超过20个供挖掘Twitter数据之用的简短代码解决方案。 通过阅读本书,你将能够: 极速鸟瞰社交网站生态。 将每章的代码打包为Jupyter Notebook,并使用Docker轻松运行。 借用并活用开源GitHub代码库。 了解如何使用Python 3工具对收集的数据条分缕析。 使用先进的数据挖掘技术,如TF-IDF、余弦相似度、共现分析、团检测和图像识别。 借助Python和JavaScript工具包构建漂亮的数据可视化。
book
Java 9 模块化开发:核心原则与实践
Java 9向Java平台引入了模块系统,这是一个非常重要的飞跃,标志着模块化Java软件开发的新纪元。当需要创建灵活且易于维护的代码时,模块化是一个关键的架构设计原则。本书给出了Java模块系统的明确概述,并演示了如何通过创建模块化应用程序来帮助管理以及降低复 杂性。 作者引导我们了解了模块系统中的相关概念以及工具,介绍了可以将现有代码迁移到模块中的模式并以模块的方式构建新的应用程序。 了解Java平台自身如何实现模块化 学习模块化如何影响应用程序的设计、编译、打包以及开发 编写自己的模块 使用模式改进任意代码库的可维护性、灵活性以及重用性 学习如何使用服务来创建解耦模块 将现有代码迁移到模块,并学习如何使用并不是模块的现有库 创建优化的自定义运行时映像,从而改变装载模块化Java应用程序的方式
book
Python 技術手冊 第三版
涵蓋Python 2.7&3.5 重點提示3.6新功能 快速參考指南 「本書不僅無所不包,Python有的書中都有,而且容易理解。它清楚解釋了Python中每個部分存在的理由,以及你應該用何種思維組合它們。」 —Peter Norvig Google研究總監 從設計和原型製作,到測試、部署和維護,用途多樣的Python在當今最受歡迎的程式語言中始終名列前茅。這本實用書籍的第三版為此語言提供了快速的參考指南,包含Python 3.5、2.7,以及3.6 新功能的重點提示,介紹其龐大標準程式庫最常用到的部分,還有一些好用的第三方模組與套件。 適用於具有一些Python經驗或從其他程式語言而來的程式設計師,本書涵蓋了廣泛的應用領域,包括Web和網路程式設計、XML處理、資料庫互動,以及高速的數值運算,並能幫助你了解Python如何結合優雅性、簡潔性、實用性和純粹的力量來提供獨特的功能組合。 本版涵蓋: ‧Python語法、物件導向的Python、標準程式庫模組,以及第三方的Python套件 ‧Python對檔案與文字作業、續存與資料庫、共時執行,以及數值計算的支援 ‧網路基本知識、事件驅動程式設計,以及客戶端網路協定模組 …
book
Python机器学习基础教程
机器学习已成为许多商业应用和研究项目不可或缺的一部分,海量数据使得机器学习的应用范围远超人们想象。本书将向所有对机器学习技术感兴趣的初学者展示,自己动手构建机器学习解决方案并非难事! 书中重点讨论机器学习算法的实践而不是背后的数学,全面涵盖在实践中实现机器学习算法的所有重要内容,帮助读者使用Python和scikit-learn库一步一步构建一个有效的机器学习应用。 机器学习的基本概念及其应用 常用机器学习算法的优缺点 机器学习所处理的数据的表示方法,包括重点关注数据的哪些方面 模型评估和调参的高级方法 管道的概念 处理文本数据的方法,包括文本特有的处理方法 进一步提高机器学习和数据科学技能的建议