Book description
本书的第2版涵盖了277个R语言实用方法,可以帮助你快速而有效地使用R进行数据分析。R语言给我们提供了统计分析的一切工具,但是R本身的结构可能不容易掌握。本书提供的面向任务的R语言实用方法涉及从基本的分析任务到输入和输出、常用统计分析、绘图、线性回归等内容,它们可以让你马上应用R高效地工作。
每一个R语言方法都专注于一个特定的问题,随后的讨论则对问题的解决方案给出解释,并阐释该方法的工作机理。对于R的初级用户,本书将帮助你步入R的殿堂;对于R的中级用户,本书将加深你对R的理解并拓展你的视野。通过本书,可以使你的分析工作顺利完成并学习更多R语言知识。
本书主要内容:
- 建立向量、处理变量,以及执行其他基本函数。
- 简化数据的输入和输出。
- 处理矩阵、列表、因子和数据框等数据结构。
- 分析概率、概率分布和随机变量。
- 计算统计量和置信区间,进行统计检验。
- 创建各种图形。
- 构建线性回归和方差分析(ANOVA)等统计模型。
- 探索高级统计技术,如聚类分析等。
Table of contents
- 封面
- 扉页
- 版权页
- O'Reilly介绍
- 译者序
- 目录 (1/2)
- 目录 (2/2)
- 前言
- 第1章 R入门和获得帮助
- 第2章 基础知识
- 第3章 R软件导览
- 第4章 输入与输出
- 第5章 数据结构 (1/2)
-
第5章 数据结构 (2/2)
- 5.1 对向量添加数据
- 5.2 在向量中插入数据
- 5.3 理解循环规则
- 5.4 构建因子
- 5.5 将多个向量合并成单个向量以及一个并行因子
- 5.6 创建列表
- 5.7 根据位置选定列表元素
- 5.8 根据名称选定列表元素
- 5.9 构建一个名称/值关联表
- 5.10 从列表中移除元素
- 5.11 将列表转换为向量
- 5.12 从列表中移除取值为空值的元素
- 5.13 使用条件来移除列表元素
- 5.14 矩阵初始化
- 5.15 执行矩阵运算
- 5.16 将描述性名称赋给矩阵的行和列
- 5.17 从矩阵中选定一行或一列
- 5.18 用列数据初始化数据框
- 5.19 用行数据初始化数据框
- 5.20 对数据框添加行
- 5.21 根据位置选择数据框的列
- 5.22 根据列名选择数据框的列
- 5.23 修改数据框的列名
- 5.24 从数据框中移除NA值
- 5.25 根据名称排除列
- 5.26 合并两个数据框
- 5.27 根据共有列合并数据框
- 5.28 基本数据类型之间的转换
- 5.29 从一种结构化数据类型转换到另一种数据类型
- 第6章 数据转换
- 第7章 字符串和日期
- 第8章 概率
- 第9章 统计概论
-
第10章 图形
- 10.1 创建散点图
- 10.2 添加标题和标签
- 10.3 添加(或去除)网格
- 10.4 给ggplot图形添加主题
- 10.5 创建多组散点图
- 10.6 添加(或去除)图例
- 10.7 绘制散点图的回归线
- 10.8 多变量散点图的绘制
- 10.9 创建多个分组的散点图
- 10.10 创建条形图
- 10.11 对条形图添加置信区间
- 10.12 给条形图上色
- 10.13 绘制从点x到点y的线
- 10.14 改变线的类型、宽度或者颜色
- 10.15 绘制多个数据集
- 10.16 添加垂直线和水平线
- 10.17 创建箱线图
- 10.18 对每个因子水平创建箱线图
- 10.19 创建直方图
- 10.20 对直方图添加密度估计
- 10.21 创建正态Q-Q图
- 10.22 创建其他Q-Q图
- 10.23 用多种颜色绘制变量
- 10.24 绘制函数
- 10.25 在一页中显示多个图形
- 10.26 在文档中绘制图形
-
第11章 线性回归和方差分析
- 11.1 简单线性回归
- 11.2 多元线性回归
- 11.3 得到回归统计量
- 11.4 理解回归的汇总结果
- 11.5 运行无截距项的线性回归
- 11.6 只应用与因变量高度相关的变量进行回归
- 11.7 运行有交互项的线性回归
- 11.8 选择最合适的回归变量
- 11.9 对数据子集进行回归
- 11.10 在回归公式中使用表达式
- 11.11 多项式回归
- 11.12 对变换后的数据进行回归
- 11.13 寻找最佳幂变换(Box-Cox过程)
- 11.14 回归系数的置信区间
- 11.15 绘制回归残差
- 11.16 线性回归的诊断
- 11.17 识别有影响的观察值
- 11.18 残差自相关检验(Durbin-Watson检验)
- 11.19 预测新值
- 11.20 建立预测区间
- 11.21 执行单因素方差分析
- 11.22 创建交互关系图
- 11.23 找到组间均值的差异
- 11.24 执行稳健方差分析(Kruskal-Wallis检验)
- 11.25 运用方差分析比较模型
-
第12章 有用的方法
- 12.1 查看你的数据
- 12.2 输出赋值结果
- 12.3 对行和列求和
- 12.4 按列输出数据
- 12.5 对数据分组
- 12.6 找到特定值的位置
- 12.7 每隔n个选定一个向量元素
- 12.8 找到最小值或最大值
- 12.9 生成多个变量的组合
- 12.10 转换一个数据框
- 12.11 对数据框排序
- 12.12 移除变量属性
- 12.13 显示对象的结构
- 12.14 代码运行时间
- 12.15 避免显示警告和错误消息
- 12.16 从列表中提取函数参数
- 12.17 定义你自己的二元运算符
- 12.18 不显示R启动消息
- 12.19 获取和设置环境变量
- 12.20 使用代码段
- 12.21 本地并行运行R代码
- 12.22 远程并行运行R代码
- 第13章 高级数值分析和统计方法
-
第14章 时间序列分析
- 14.1 表示时间序列
- 14.2 绘制时序图
- 14.3 提取最早或者最新的观测值
- 14.4 选取时间序列的子集
- 14.5 合并多个时间序列
- 14.6 缺失时间序列的填充
- 14.7 时间序列的滞后
- 14.8 计算逐次差分
- 14.9 时间序列的相关计算
- 14.10 计算移动平均
- 14.11 在日历时间范围内应用函数
- 14.12 应用滚动函数
- 14.13 绘制自相关函数图
- 14.14 检验时间序列的自相关
- 14.15 绘制偏自相关函数
- 14.16 两个时间序列间的滞后相关性
- 14.17 剔除时间序列的趋势
- 14.18 拟合ARIMA模型
- 14.19 剔除ARIMA模型中不显著的系数
- 14.20 对ARIMA模型进行诊断
- 14.21 用ARIMA模型进行预测
- 14.22 绘制预测结果
- 14.23 均值回归的检验
- 14.24 时间序列的平滑
- 第15章 简单编程
- 第16章 R Markdown和发表
- 作者简介
- 封面介绍
Product information
- Title: R 语言经典实例(原书第 2 版)
- Author(s):
- Release date: June 2020
- Publisher(s): China Machine Press
- ISBN: 9787111656814
You might also like
book
大规模数据分析和建模:基于 Spark 与 R
如果你和大多数R语言用户一样,那你肯定喜欢统计学,也能够深入理解统计学。但是随着组织内部不断收集大量数据,添加Apache Spark这类工具就变得理所当然。在本书中,数据科学家和使用大规模数据应用的专业人员会学到如何使用Spark和R解决大数据和大计算问题。 作者会展示如何将Spark和R结合起来进行大数据分析。本书涵盖相关的数据科学话题、聚类计算,以及高级用户会感兴趣的问题。 在Apache Spark环境下,使用R来分析、探索、转换、可视化数据。 构建统计模型来提取信息并预测输出,自动化生产级的工作流程。 使用分布式计算技术在多台机器上进行分析和建模。 轻松使用Spark处理多个数据源和格式的大规模数据。 学习其他用于大规模图处理、地理空间分析和基因组学分析的建模框架。 深入高级话题,包括定制转换、实时数据处理和创建定制化Spark扩展。
book
数据库可靠性工程:数据库系统设计与运维指南
信息技术领域的基础设施即代码革命正在影响着数据库管理。本书从实践角度介绍如何将网站可靠性工程的实践应用于数据库架构和运维,为想成为数据库可靠性工程师的专业人士提供一个指导框架,开发人员、系统管理员和初中级数据库管理员等都能从中受益。 本书首先介绍数据库可靠性工程师需要掌握的核心运维概念,然后介绍各种数据库持久性选项,包括如何利用关键技术提供有弹性、可扩展、高性能的数据存储和检索。有了数据库可靠性工程的坚实基础,读者便能深入研究任何现代数据库的架构和运维。 服务等级要求和风险管理 构建并演进具有运维可见性的架构 基础设施工程和基础设施管理 如何推动发布管理流程 数据存储、索引和复制 明确数据存储的特性和用例 数据存储架构组件和数据驱动的架构
book
解密金融数据
技术是获取和解释金融数据的强大工具,能给你华尔街上所有人都想要的东西:优势。你不需要成为一名程序员就能从彭博、IHS Markit或其他系统获取金融信息。 通过本书并结合你的见解与彭博或Markit的数据,你将了解分析金融信息和生成专业报告的技能。 如果你是一名程序员,本书也包含用C#来覆盖相同主题的方法。 对比公司、债券或贷款,并使用在彭博屏幕上看不到的数据。 为单个公司建立两页的活页报告,包含重要的金融数据、与其对等组的相对价值比较和价格趋势。 建立投资组合总结报告,包含业绩、增长、风险调整后收益和组合。 探索公司债券和贷款市场的每日价格和贷款信息。 利用相关性和回归确定两种证券(或指数)之间的关系。 通过计算方差、标准差和夏普比率来衡量投资组合风险调整后的收益。 使用Markit数据来识别有意义的趋势。
book
C++程序设计:原理与实践(基础篇)(原书第2版)
C++之父Bjarne Stroustrup的经典著作《C++程序设计:原理与实践(原书第2版)》基于最新的C++11和C++14,广泛地介绍了程序设计的基本概念和技术,包括类型系统、算术运算、控制结构、错误处理等;介绍了从键盘和文件获取数值和文本数据的方法以及以图形化方式表示数值数据、文本和几何图形;介绍了C++标准库中的容器(如向量、列表、映射)和算法(如排序、查找和内积)的设计和使用。同时还对C++思想和历史进行了详细的讨论,很好地拓宽了读者的视野。为方便读者循序渐进地学习,加上篇幅所限,《C++程序设计:原理与实践(原书第2版)》分为基础篇和进阶篇两册出版,基础篇包括第1~11章、第17~19章和附录A、C,进阶篇包括第12~16章、第20~27章和附录B、D、E。本书是基础篇。