刘嘉概率论通识讲义笔记 您所在的位置:网站首页 八卦预测法讲义 刘嘉概率论通识讲义笔记

刘嘉概率论通识讲义笔记

2023-07-05 03:52| 来源: 网络整理| 查看: 265

概率论解决随机问题的本质,就是把局部的随机性转变为整体上的确定性。概率论的产生让我们能对未来发生的随机的事情,做出数学上确定性的判断。这不仅是概率论的思想基石,也是概率论作为一种数学工具的基本思路。

00 发刊词 _ 学一门让你抓住未来的学问01 全局:从局部随机性到整体确定性

1.把局部的随机性转变为整体的确定性,是概率论解决问题的本质。

2.概率论不是用来预测未来,也不是对一次偶然的结果进行计算,它是更高层次的、确定性的认知。

3.概率论的大厦像什么? 我更愿意说概率论不是一栋建筑,而是一个城市。我可以不知道城市里每一栋建筑的样子,但我确定地知道这个城市的建筑模式

02 随机:随机性不等于不确定性

1.随机性不等于不确定性。概率论研究的是随机性,而不是不确定性。

2.随机分真伪。真随机是数学上的理想概念,是绝对不可预测。而我们最常遇到的,是在效果上类似于真随机的效果随机。

3.随机是这个世界的决定性力量。

03 概率:对世界可能性的度量

1.概率是随机事件发生可能性大小的定量描述。

2.概率是随机事件在样本空间的比率。

3.样本空间的完备性是一个幽灵。从某种角度来说,我们对世界的认识,就是对样本空间完备性的认识。

04 独立性:随机事件的相互关系

1.如果一个随机事件发生的结果,不会影响另一个随机事件的概率,那它们就是互相独立的事件,反之就是非独立事件。

2.只有明白了随机事件之间的关系,判断它们是否具有独立性,才能正确分析和度量它的概率

3.很多看似独立的事件,其实都是互有联系、互相影响的。评估随机事件的概率时,对独立事件的设定需要格外谨慎。

05 概率计算:定义问题比计算更重要

1.排列组合法则、加法法则和乘法法则,是概率计算最基础的三个法则,可以解决大部分的概率计算问题

2.大部分人不会做概率题,不是因为不会计算,而是因为没有看明白题目

3.概率计算之所以复杂,是因为很难将现实问题准确的抽象成“对”的概率问题。准确的翻译现实问题,就是概率思维的核心。

06 概率度量:建立整体确定性的三种方式

1.定义法是一种等概率的设定,来源于自然界对称性的假设,是一种宏观尺度下的合理简化

2.频率法是通过随机事件发生的频率来估算概率,要求试验或数据尽可能的多

3迭代法强调不断迭代,可以在小规模数据下,针对事件的变化和个体的差异度量概率。

4.三种方法并不是泾渭分明,而是常常融合使用,一起更清晰和全面地认识这个世界

07丨频率法:概率是对发生频率的计算

1.频率法认为,概率就是对发生频率的计算。只要试验数量或者观测数据足够多,随机事件发生的频率就会接近它的概率

2.大数定律不是基于试验的归纳而是经过了严格的数学证明

3.现实中使用频率法,往往无法获得无限多的数据,所以需要增加一些限定条件,来降低需要的数据量。

08丨大数定律:局部频率不是整体概率

1.局部频率不等于整体概率。现实中遇到的都是局部频率,和真实的整体概率之间会存在差值。

2.大数定律不需要靠补偿来实现而是通过均值回归,用大量的正常数据淡化、削弱不正常数据的影响。

09 数学期望:对随机事件长期价值的衡量

1.数学期望是对随机结果长期价值的数字化衡量,是判断一件事值不值得做的整体定量化指标。

2.计算数学期望要把所有的随机结果数值化。只有赋予每个结果一个具体的值,才能进行数学期望的计算。

3.对于同一个结果,个体的数学期望也可能是不一样的。具体计算时,需要加入自己对价值的主观考量

10 方差:围绕数学期望波动程度的度量

1.判断两个随机事件是否相似,除了比较数学期望之外,还需要比较方差。两者共同构成了对随机事件最基本的描述

2.方差是描述随机结果围绕期望波动范围的指标。方差越大,波动越大,也意味着风险越大

3.现实生活里,我们可以通过减小方差对抗波动性,也可以通过增大方差利用波动性

11 概率分布:认识现实世界的数学模型

1.随机变量所有的结果和每个结果出现的概率一一对应,就构成了概率分布。概率分布让我们拥有上帝之眼,获得对一个随机事件的整体认知。

2.概率分布模型是我们对现实规律的抽象。正态分布、幂律分布都是这样的模型,分别代表一种概率分布规律。

3.如果概率分布是一个解决问题的工具箱,概率分布模型就是工具箱里的一个个工具。数学家不断丰富工具箱里的工具,帮助我们逼近真理

12 正态分布:最简单却最重要的概率分布

正态分布的数学性质主要有三个:

1.均值就是期望,所以正态分布的平均值才有意义;

2.数据集中在均值附近,极端值很少,且对均值影响很小;

3.标准差决定胖瘦,从曲线的弯曲程度能看出随机变量的波动。

13 中心极限定理:正态分布是概率分布的神

在数学家看来,正态分布是高于其他一切分布的分布,是概率分布的神。

1.合法性:中心极限定理通过严格的数学推导,证明了正态分布的正确性。

2.正统性:在所有分布中,正态分布是统计学家的首选。它建立了一套稳定的秩序,像参照系一样对所有事情施加影响。

3.主宰性:正态分布不仅在现实世界普遍存在,所有的分布不断叠加最后也都会变成正态分布。换句话说,正态分布是世界的宿命

14丨冥律分布:给人带来希望的魔鬼

1.幂律分布唯一的数学性质就是三个字--无标度。任何尺度下截取任何一部分数据,都仍然呈现幂律分布的特征

2.之所以说幂律分布是魔鬼,是因为它有三个特征:极不稳定,平均值失去意义;长尾明显,各种极端事件经常发生;无法预测,让人完全束手无策

3.幂律分布是减的必经状态,是我们对抗熵增,对抗死寂,对抗死亡的希望之光。

15丨泊松分布:打开统计推断的大门

1.泊松分布是用来描述随机事件发生次数和概率的一种分布。具有两个重要的特性:第一,基础是正态分布;第二,随机事件的间隔是无记忆的。

2.泊松分布和正态分布相互验证的关系,不仅能帮助我们在数据有限的时候进行精准计算,更打开了推断统计的大门,推动了统计学的发展。

16丨假设检验{上}:基于概率反证法的统计推断

1.假设检验是一种基于概率的反证法。如果能证明一个假说发生的概率特别小,那就推翻这个假说,接受和它相反的那个假说。这就是假设检验的基本逻辑。

2.概率分布是假设检验的基础,是进行假设检验时必须要用到的工具。

3.假设检验让我们能依靠有限的数据发现很多靠谱的结论,所以一诞生就席卷各个领域,成为很多学科研究的底层方法之一

17丨假设检验{下}:为什么会导致错误结论?

1.假设检验要从个别推导全部,就一定会忽视极端的小概率情况。这是它从娘胎里就带的基因缺陷,没法改变。

2.由于P值的大小直接由样本决定,所以假设检验很容易产生系统性偏差,让人们愿意相信一些错误结论。

3.使用假设检验时,还要注意显著性水平的设置要和问题联动,以及根据问题选择正确的分布。

18丨条件概率:贝叶斯公式的基础

1.如果一个随机事件的概率会因为某个条件的发生而改变,那么在这个条件发生的情况下,随机事件发生的概率就是条件概率。

2.很多条件概率是很隐蔽的。现实中,所有的概率本质上都是条件概率。

3.条件概率量化了条件对随时事件的影响,但它只表示统计意义上的相关性,并不代表因果关系。

19丨贝叶斯推理:概率是对信心的度量

1.根据新信息不断调整对一个随机事件发生概率的判断,这就是贝叶斯推理。

2.贝叶斯推理拓宽了概率这个概念的边界。在贝叶斯推理中,概率是对信心的度量,是我们对某个结果相信程度的定量化表达。

3.贝叶斯推理有两大优势:第一起点不重要,迭代很重要;第二,信息越充分,结果越可靠。

20丨贝叶斯计算:定量解决逆概率问题

1.现象B出现的情况下事件A发生的概率,等于事件A发生时现象B出现的概率,乘以事件A发生的概率,再除以现象B出现的概率。这就是贝叶斯公式。

2.贝叶斯公式里,P(A) 是先验概率,可以任性设置;而P (BIA) 和P(B)是客观的,必须查询真实的数据。

3如果找不到P(BA) 和P(B)的数据,就不能使用贝叶斯计算,否则很容易越算越错

21丨主观与客观:不同的概率学派在争什么?

1.在正确性上,频率法和贝叶斯并不是势同水火,而都是完全正确、完全有效的。

2.频率法和贝叶斯对信息是否全知的预设不同,它们解决的不是一类问题。

3.频率法和贝叶斯两种方法本身都是客观的,但是在使用的过程中都会或多或少的产生主观性。

4.应用数学家现在不太讨论频率法和贝叶斯的主客观问题,而是哪个好用用哪个,利用两个方法更好地解决现实问题。

22 原则:怎样提高自己的概率思维?

提高概率思维要遵循的三个黄金原则

1.对抗直觉,能算就算;

2.寻找条件,增大概率;

3.相信系统,长期主义。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有