刘嘉概率论通识讲义笔记

您所在的位置：网站首页 › 八卦预测法讲义 › 刘嘉概率论通识讲义笔记

刘嘉概率论通识讲义笔记

2023-07-05 03:52| 来源: 网络整理| 查看: 265

概率论解决随机问题的本质，就是把局部的随机性转变为整体上的确定性。概率论的产生让我们能对未来发生的随机的事情，做出数学上确定性的判断。这不仅是概率论的思想基石，也是概率论作为一种数学工具的基本思路。

00 发刊词 _ 学一门让你抓住未来的学问01 全局：从局部随机性到整体确定性

1.把局部的随机性转变为整体的确定性，是概率论解决问题的本质。

2.概率论不是用来预测未来，也不是对一次偶然的结果进行计算，它是更高层次的、确定性的认知。

3.概率论的大厦像什么? 我更愿意说概率论不是一栋建筑，而是一个城市。我可以不知道城市里每一栋建筑的样子，但我确定地知道这个城市的建筑模式

02 随机：随机性不等于不确定性

1.随机性不等于不确定性。概率论研究的是随机性，而不是不确定性。

2.随机分真伪。真随机是数学上的理想概念，是绝对不可预测。而我们最常遇到的，是在效果上类似于真随机的效果随机。

3.随机是这个世界的决定性力量。

03 概率：对世界可能性的度量

1.概率是随机事件发生可能性大小的定量描述。

2.概率是随机事件在样本空间的比率。

3.样本空间的完备性是一个幽灵。从某种角度来说，我们对世界的认识，就是对样本空间完备性的认识。

04 独立性：随机事件的相互关系

1.如果一个随机事件发生的结果，不会影响另一个随机事件的概率，那它们就是互相独立的事件，反之就是非独立事件。

2.只有明白了随机事件之间的关系，判断它们是否具有独立性，才能正确分析和度量它的概率

3.很多看似独立的事件，其实都是互有联系、互相影响的。评估随机事件的概率时，对独立事件的设定需要格外谨慎。

05 概率计算：定义问题比计算更重要

1.排列组合法则、加法法则和乘法法则，是概率计算最基础的三个法则，可以解决大部分的概率计算问题

2.大部分人不会做概率题，不是因为不会计算，而是因为没有看明白题目

3.概率计算之所以复杂，是因为很难将现实问题准确的抽象成“对”的概率问题。准确的翻译现实问题，就是概率思维的核心。

06 概率度量：建立整体确定性的三种方式

1.定义法是一种等概率的设定，来源于自然界对称性的假设，是一种宏观尺度下的合理简化

2.频率法是通过随机事件发生的频率来估算概率，要求试验或数据尽可能的多

3迭代法强调不断迭代，可以在小规模数据下，针对事件的变化和个体的差异度量概率。

4.三种方法并不是泾渭分明，而是常常融合使用，一起更清晰和全面地认识这个世界

07丨频率法：概率是对发生频率的计算

1.频率法认为，概率就是对发生频率的计算。只要试验数量或者观测数据足够多，随机事件发生的频率就会接近它的概率

2.大数定律不是基于试验的归纳而是经过了严格的数学证明

3.现实中使用频率法，往往无法获得无限多的数据，所以需要增加一些限定条件，来降低需要的数据量。

08丨大数定律：局部频率不是整体概率

1.局部频率不等于整体概率。现实中遇到的都是局部频率，和真实的整体概率之间会存在差值。

2.大数定律不需要靠补偿来实现而是通过均值回归，用大量的正常数据淡化、削弱不正常数据的影响。

09 数学期望：对随机事件长期价值的衡量

1.数学期望是对随机结果长期价值的数字化衡量，是判断一件事值不值得做的整体定量化指标。

2.计算数学期望要把所有的随机结果数值化。只有赋予每个结果一个具体的值，才能进行数学期望的计算。

3.对于同一个结果，个体的数学期望也可能是不一样的。具体计算时，需要加入自己对价值的主观考量

10 方差：围绕数学期望波动程度的度量

1.判断两个随机事件是否相似，除了比较数学期望之外，还需要比较方差。两者共同构成了对随机事件最基本的描述

2.方差是描述随机结果围绕期望波动范围的指标。方差越大，波动越大，也意味着风险越大

3.现实生活里，我们可以通过减小方差对抗波动性，也可以通过增大方差利用波动性

11 概率分布：认识现实世界的数学模型

1.随机变量所有的结果和每个结果出现的概率一一对应，就构成了概率分布。概率分布让我们拥有上帝之眼，获得对一个随机事件的整体认知。

2.概率分布模型是我们对现实规律的抽象。正态分布、幂律分布都是这样的模型，分别代表一种概率分布规律。

3.如果概率分布是一个解决问题的工具箱，概率分布模型就是工具箱里的一个个工具。数学家不断丰富工具箱里的工具，帮助我们逼近真理

12 正态分布：最简单却最重要的概率分布

正态分布的数学性质主要有三个:

1.均值就是期望，所以正态分布的平均值才有意义;

2.数据集中在均值附近，极端值很少，且对均值影响很小;

3.标准差决定胖瘦，从曲线的弯曲程度能看出随机变量的波动。

13 中心极限定理：正态分布是概率分布的神

在数学家看来，正态分布是高于其他一切分布的分布，是概率分布的神。

1.合法性:中心极限定理通过严格的数学推导，证明了正态分布的正确性。

2.正统性:在所有分布中，正态分布是统计学家的首选。它建立了一套稳定的秩序，像参照系一样对所有事情施加影响。

3.主宰性:正态分布不仅在现实世界普遍存在，所有的分布不断叠加最后也都会变成正态分布。换句话说，正态分布是世界的宿命

14丨冥律分布：给人带来希望的魔鬼

1.幂律分布唯一的数学性质就是三个字--无标度。任何尺度下截取任何一部分数据，都仍然呈现幂律分布的特征

2.之所以说幂律分布是魔鬼，是因为它有三个特征:极不稳定，平均值失去意义;长尾明显，各种极端事件经常发生;无法预测，让人完全束手无策

3.幂律分布是减的必经状态，是我们对抗熵增，对抗死寂，对抗死亡的希望之光。

15丨泊松分布：打开统计推断的大门

1.泊松分布是用来描述随机事件发生次数和概率的一种分布。具有两个重要的特性:第一，基础是正态分布;第二，随机事件的间隔是无记忆的。

2.泊松分布和正态分布相互验证的关系，不仅能帮助我们在数据有限的时候进行精准计算，更打开了推断统计的大门，推动了统计学的发展。

16丨假设检验{上}：基于概率反证法的统计推断

1.假设检验是一种基于概率的反证法。如果能证明一个假说发生的概率特别小，那就推翻这个假说，接受和它相反的那个假说。这就是假设检验的基本逻辑。

2.概率分布是假设检验的基础，是进行假设检验时必须要用到的工具。

3.假设检验让我们能依靠有限的数据发现很多靠谱的结论，所以一诞生就席卷各个领域，成为很多学科研究的底层方法之一

17丨假设检验{下}：为什么会导致错误结论？

1.假设检验要从个别推导全部，就一定会忽视极端的小概率情况。这是它从娘胎里就带的基因缺陷，没法改变。

2.由于P值的大小直接由样本决定，所以假设检验很容易产生系统性偏差，让人们愿意相信一些错误结论。

3.使用假设检验时，还要注意显著性水平的设置要和问题联动，以及根据问题选择正确的分布。

18丨条件概率：贝叶斯公式的基础

1.如果一个随机事件的概率会因为某个条件的发生而改变，那么在这个条件发生的情况下，随机事件发生的概率就是条件概率。

2.很多条件概率是很隐蔽的。现实中，所有的概率本质上都是条件概率。

3.条件概率量化了条件对随时事件的影响，但它只表示统计意义上的相关性，并不代表因果关系。

19丨贝叶斯推理：概率是对信心的度量

1.根据新信息不断调整对一个随机事件发生概率的判断，这就是贝叶斯推理。

2.贝叶斯推理拓宽了概率这个概念的边界。在贝叶斯推理中，概率是对信心的度量，是我们对某个结果相信程度的定量化表达。

3.贝叶斯推理有两大优势:第一起点不重要，迭代很重要;第二，信息越充分，结果越可靠。

20丨贝叶斯计算：定量解决逆概率问题

1.现象B出现的情况下事件A发生的概率，等于事件A发生时现象B出现的概率，乘以事件A发生的概率，再除以现象B出现的概率。这就是贝叶斯公式。

2.贝叶斯公式里，P(A) 是先验概率，可以任性设置;而P (BIA) 和P(B)是客观的，必须查询真实的数据。

3如果找不到P(BA) 和P(B)的数据，就不能使用贝叶斯计算，否则很容易越算越错

21丨主观与客观：不同的概率学派在争什么？

1.在正确性上，频率法和贝叶斯并不是势同水火，而都是完全正确、完全有效的。

2.频率法和贝叶斯对信息是否全知的预设不同，它们解决的不是一类问题。

3.频率法和贝叶斯两种方法本身都是客观的，但是在使用的过程中都会或多或少的产生主观性。

4.应用数学家现在不太讨论频率法和贝叶斯的主客观问题，而是哪个好用用哪个，利用两个方法更好地解决现实问题。

22 原则：怎样提高自己的概率思维？

提高概率思维要遵循的三个黄金原则

1.对抗直觉，能算就算;

2.寻找条件，增大概率;

3.相信系统，长期主义。

【本文地址】

公司简介

联系我们