Python贝叶斯分析(第2版)

Book description

PyMC3和ArviZ的核心开发者教你用Python实现统计建模和概率编程

Key Features

  • 来自核心开发者的经验总结
  • 经典好书,全彩升级
  • 图文并茂,通俗易懂

Book Description

本书是一本概率编程的入门书。本书使用概率编程库 PyMC3以及可视化库 ArviZ对贝叶斯统计分析的相关知识进行讲解,包括概率思维、概率编程、线性回归建模、广义线性模型、模型比较、混合模型、高斯过程以及推断引擎等知识。全书图文并茂,通俗易懂,适合具备一定 Python基础的读者学习使用。学完本书,读者可以利用概率思维建立贝叶斯模型并解决自己的数据分析问题。

What you will learn

  • 掌握高斯分布、组间比较、分层模型、泊松回归、鲁棒逻辑回归、GLM模型、后验预测检查、信息准则、WAIC、有限混合模型、非有限混合模型、Cox过程、推断引擎等内容
  • 可以利用概率思维建立贝叶斯模型并解决自己的数据分析问题

Who this book is for

这是一本概率编程的入门书,读者不需要掌握复杂的统计学知识,只要具备一定的Python 基础即可。 无论是数据科学的新手,还是有经验的专业人士,都可以从本书学到贝叶斯分析的方法,并运用Python实现。

Table of contents

  1. 版权信息
  2. 版 权
  3. 内 容 提 要
  4. 序 言
  5. 前 言
  6. 作者简介
  7. 英文版审校者简介
  8. 致 谢
  9. 服务与支持
  10. 第1章 概率思维
    1. 1.1 统计学、模型以及本书采用的方法
      1. 1.1.1 与数据打交道
      2. 1.1.2 贝叶斯建模
    2. 1.2 概率论
      1. 1.2.1 解释概率
      2. 1.2.2 定义概率
    3. 1.3 单参数推断
      1. 抛硬币问题
    4. 1.4 报告贝叶斯分析结果
      1. 1.4.1 模型表示和可视化
      2. 1.4.2 总结后验
    5. 1.5 后验预测检查
    6. 1.6 总结
    7. 1.7 练习
  11. 第2章 概率编程
    1. 2.1 简介
    2. 2.2 PyMC3指南
      1. 用PyMC3解决抛硬币问题
    3. 2.3 总结后验
      1. 基于后验的决策
    4. 2.4 随处可见的高斯分布
      1. 2.4.1 高斯推断
      2. 2.4.2 鲁棒推断
    5. 2.5 组间比较
      1. 2.5.1 Cohen’s d
      2. 2.5.2 概率优势
      3. 2.5.3 “小费”数据集
    6. 2.6 分层模型
      1. 2.6.1 收缩
      2. 2.6.2 额外的例子
    7. 2.7 总结
    8. 2.8 练习
  12. 第3章 线性回归建模
    1. 3.1 一元线性回归
      1. 3.1.1 与机器学习的联系
      2. 3.1.2 线性回归模型的核心
      3. 3.1.3 线性模型与高自相关性
      4. 3.1.4 对后验进行解释和可视化
      5. 3.1.5 皮尔逊相关系数
    2. 3.2 鲁棒线性回归
    3. 3.3 分层线性回归
      1. 相关性与因果性
    4. 3.4 多项式回归
      1. 3.4.1 解释多项式回归的系数
      2. 3.4.2 多项式回归——终极模型
    5. 3.5 多元线性回归
      1. 3.5.1 混淆变量和多余变量
      2. 3.5.2 多重共线性或相关性太高
      3. 3.5.3 隐藏效果变量
      4. 3.5.4 增加相互作用
      5. 3.5.5 变量的方差
    6. 3.6 总结
    7. 3.7 练习
  13. 第4章 广义线性模型
    1. 4.1 简介
    2. 4.2 逻辑回归
      1. 4.2.1 逻辑回归模型
      2. 4.2.2 鸢尾花数据集
    3. 4.3 多元逻辑回归
      1. 4.3.1 决策边界
      2. 4.3.2 模型实现
      3. 4.3.3 解释逻辑回归的系数
      4. 4.3.4 处理相关变量
      5. 4.3.5 处理不平衡分类
      6. 4.3.6 softmax回归
      7. 4.3.7 判别式模型和生成式模式
    4. 4.4 泊松回归
      1. 4.4.1 泊松分布
      2. 4.4.2 零膨胀泊松模型
      3. 4.4.3 泊松回归和ZIP回归
    5. 4.5 鲁棒逻辑回归
    6. 4.6 GLM模型
    7. 4.7 总结
    8. 4.8 练习
  14. 第5章 模型比较
    1. 5.1 后验预测检查
    2. 5.2 奥卡姆剃刀原理——简单性和准确性
      1. 5.2.1 参数过多会导致过拟合
      2. 5.2.2 参数太少会导致欠拟合
      3. 5.2.3 简单性与准确性之间的平衡
      4. 5.2.4 预测精度度量
    3. 5.3 信息准则
      1. 5.3.1 对数似然和偏差
      2. 5.3.2 赤池信息量准则
      3. 5.3.3 广泛适用的信息准则
      4. 5.3.4 帕累托平滑重要性采样留一法交叉验证
      5. 5.3.5 其他信息准则
      6. 5.3.6 使用PyMC3比较模型
      7. 5.3.7 模型平均
    4. 5.4 贝叶斯因子
      1. 5.4.1 一些讨论
      2. 5.4.2 贝叶斯因子与信息准则
    5. 5.5 正则化先验
    6. 5.6 深入WAIC
      1. 5.6.1 熵
      2. 5.6.2 KL散度
    7. 5.7 总结
    8. 5.8 练习
  15. 第6章 混合模型
    1. 6.1 简介
    2. 6.2 有限混合模型
      1. 6.2.1 分类分布
      2. 6.2.2 狄利克雷分布
      3. 6.2.3 混合模型的不可辨识性
      4. 6.2.4 怎样选择K
      5. 6.2.5 混合模型与聚类
    3. 6.3 非有限混合模型
      1. 狄利克雷过程
    4. 6.4 连续混合模型
      1. 6.4.1 贝塔-二项分布和负二项分布
      2. 6.4.2 t分布
    5. 6.5 总结
    6. 6.6 练习
  16. 第7章 高斯过程
    1. 7.1 线性模型和非线性数据
    2. 7.2 建模函数
      1. 7.2.1 多元高斯函数
      2. 7.2.2 协方差函数与核函数
    3. 7.3 高斯过程回归
    4. 7.4 空间自相关回归
    5. 7.5 高斯过程分类
    6. 7.6 Cox过程
      1. 7.6.1 煤矿灾害
      2. 7.6.2 红杉数据集
    7. 7.7 总结
    8. 7.8 练习
  17. 第8章 推断引擎
    1. 8.1 简介
    2. 8.2 非马尔可夫方法
      1. 8.2.1 网格计算
      2. 8.2.2 二次近似法
      3. 8.2.3 变分法
    3. 8.3 马尔可夫方法
      1. 8.3.1 蒙特卡洛
      2. 8.3.2 马尔可夫链
      3. 8.3.3 梅特罗波利斯-黑斯廷斯算法
      4. 8.3.4 哈密顿蒙特卡洛
      5. 8.3.5 序贯蒙特卡洛
    4. 8.4 样本诊断
      1. 8.4.1 收敛
      2. 8.4.2 蒙特卡洛误差
      3. 8.4.3 自相关
      4. 8.4.4 有效样本量
      5. 8.4.5 分歧
    5. 8.5 总结
    6. 8.6 练习
  18. 第9章 拓展学习

Product information

  • Title: Python贝叶斯分析(第2版)
  • Author(s): Posts & Telecom Press, Osvaldo Martin
  • Release date: February 2024
  • Publisher(s): Packt Publishing
  • ISBN: 9781835462447

You might also like

book

Python无监督学习

by Posts & Telecom Press, Giuseppe Bonaccorso

拥抱机器学习,用Python实现无监督学习算法,构建高效且实用的解决方案 Key Features 包含多个示例和讲解 全面揭示了无监督学习的内涵与实现技巧 Book Description 机器学习是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。无监督学习是机器学习中的一种学习方式,是数据科学的一个重要分支,常用于数据挖掘领域,通过构建模型来为业务决策提供依据。 本书通过Python语言讲解无监督学习,全书内容包括10章,前面9章由浅入深地讲解了无监督学习的基础知识、聚类的基础知识、高级聚类、层次聚类、软聚类和高斯混合模型、异常检测、降维和分量分析、无监督神经网络模型、生成式对抗网络和自组织映射,第10章以问题解答的形式对前面9章涉及的问题给出了解决方案。 本书适合数据科学家、机器学习从业者和普通的软件开发人员阅读,通过学习本书介绍的无监督学习理论和Python编程方法,读者能够在业务实践中获得有价值的参考。 What you will learn 了解无监督学习的实践技巧 熟练掌握一些列机器学习算法 …

book

流畅的Python(第2版)

by Luciano Ramalho

不要浪费时间让Python屈就你在其他语言中学到的模式。Python的简洁性有助于你迅速提升编程效率,但这通常意味着你并未使用它所提供的所有功能。《流畅的Python》是编程领域的实用经典参考书,第2版做了与时俱进的修订和升级,教你利用Python特性,写出高效且现代的Python 3代码。 打破旧有经验,探索并运用地道的Python 3特性。本书作者带你一览Python语言核心功能和库,教你编写更简洁、快速和易读的代码。 第2版分为如下五部分,每一部分均可单独成书。 数据结构:序列、字典、集合、Unicode和数据类。 函数即对象:一等函数、相关设计模式和函数声明中的类型提示。 类和协议:组合、继承、混入、接口、运算符重载、协议和更多静态类型。 控制流:上下文管理器、生成器、协程、async/await及线程和进程池。 元编程:特性、属性描述符、类装饰器,以及可取代或简化元类的类元编程新钩子。

book

Python预测分析实战

by Posts & Telecom Press, Alvaro Fuentes

基于Python语言的预测分析实战 Key Features 涵盖从问题识别到模型部署的预测分析全过程 基于Python语言实现,辅以实例,侧重于实战 用Python实现高性能预测分析方案 用Keras构建可实现精准预测的神经网络模型 Book Description 本书先介绍预测分析的重要概念和原则,然后给出一系列的代码示例和算法讲解,引导读者了解完整的预测分析流程,进而用Python工具构建高性能的预测分析解决方案。全书所涵盖的内容包括预测分析过程、理解问题和准备数据、理解数据集—探索性数据分析、基于机器学习的数值预测、基于机器学习的类别预测、调整模型和提高性能、基于Dash的模型实现等。 本书适合想要学习预测建模并对用 Python 工具实现预测分析解决方案感兴趣的数据分析师、数据科学家、数据工程师和Python开发人员阅读,也适合对预测分析感兴趣的读者参考。 What you will …

book

计算机科学导论:跨学科方法

by 罗伯特 塞奇威克, 凯文 韦恩

本书面向初学者,以跨学科的方法介绍计算机科学的基本知识。全书包括两个部分,第一部分围绕学习编程的三个阶段进行组织,包括基本元素、函数和面向对象编程。第二部分则介绍计算机科学的高级主题,包括算法和数据结构、计算理论和计算机体系结构。本书内容丰富、循序渐进,适合作为高等院校本科生计算机科学入门的教材。