应用统计学(第三版)张建同~学习笔记(大数据专业) 您所在的位置:网站首页 经济社会统计第三版课后答案 应用统计学(第三版)张建同~学习笔记(大数据专业)

应用统计学(第三版)张建同~学习笔记(大数据专业)

2023-07-10 12:25| 来源: 网络整理| 查看: 265

马上要结课了,但是才刚刚学习三周不到,感觉不知道考啥。虽然专业课很多,但是我觉得写笔记会让我更有学习的动力。充分利用资源,加油! 第一章 统计和统计数据收集

对“统计”的理解:

统计工作:对数据进行搜集、整理和分析统计资料:统计工作所取得的成果:原始资料,再生信息统计学:对统计工作实践加以总结升华而产生的理论,用以指导统计实践

统计研究对象的特点:

数量性:凡事产生数据的领域,都需要统计工作和统计学;凡是能以数量来描述的事物,都可以作为统计学的研究对象总体性:具体性:一定时间、地点等条件下具体的事物的量差异性:需要对总体中大量个体进行观察与分析:如平均值、方差、偏斜度等……

统计学分类:

描述统计学和推断统计学理论统计学和应用统计学 理论统计学·:基于概率论的原理,不包括一些传统概率论的内容:假设检验等…… 应用统计学:应用于各个领域所形成的分支,例如:参数估计、假设检验、方差分析、回归分析……

统计基本术语:

变量:所分析的对象:比如销售额、年利润、年支出……

数据:每年所不同的销售额、年利润……

总体:研究对象的全体

个体:总体中的每个元素或单元

样本:从总体中挑选出来用来分析的一部分

参数:描述总体特征的数值

统计量:表述样本特征的数值 请添加图片描述 数据收集

普遍调查:例如:人口普查

重点调查:调查钢厂公司,公司少但是占据大量市场份额 请添加图片描述

典型调查: 请添加图片描述

抽样调查:按照随机原则——以部分推断全体 (1)涵盖误差:一组有代表性的样本被排除在抽样样本之外 (2)无回应误差:发出去1000份,只得到240份,剩下的收不回来 (3)抽样误差: (4)测量误差:样本数据测量程序的设计和应用不当,比如:问题设计不明确,比较模糊……

网上调查 优点: (1)及时性和共享性:收集数据迅速、被调查者和调查者共享调查结果 (2)便捷性和低成本: (3)可靠性和客观性: (4)更好接触性: (5)穿越时空性:不受时间和空间的约束

变量 分类变量(定性变量):按类别分开,例如回答“是”或“否”;

数值变量(定量变量):

(1)离散变量:离散变量指变量值可以按一定顺序一一列举,通常以整数位取值的变量。 (2)连续变量:在一定区间内可以任意取值的变量叫连续变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值。

第二章 统计表和统计图

帕累托图:帕累托图是一种图表,作用是表示有多少结果是由已确认类型或范畴的原因所造成。

帕累托图可以用来分析质量问题,确定产生质量问题的主要因素。按等级排序的目的是指导如何采取纠正措施:项目班子应首先采取措施纠正造成最多数量缺陷的问题。

绘制帕累托图: ①打开原始数据,进行频数排序 在这里插入图片描述 ②计算出累计频率, 在这里插入图片描述③选中百分数频率和累计,画出折线图 然后改变图表类型为:组合图形 选择折线图为次坐标轴,即可得出帕累托图 在这里插入图片描述 用excel制作频数分布图 利用FREQUENCY函数 FREQUENCY(Data_array,Bins_array) 在这里插入图片描述在这里插入图片描述

6/21更新

无语了, 线上考试 ,一个月没摸应统了,上次写笔记是在一个月前,马上考试,我要完了,┭┮﹏┭┮ . . .

第二章 统计表和统计图

先不学了,后面的比较重要 好家伙,这是个图片描述,记得是alt,web考试冲!. . . . . .

第三章 统计数据的描述度量

本章我复习了一个大概,具体老师要考的就是excel名词??别的好像也没啥考的了

本章主要介绍: ★度量中心(集中)趋势的指标 ★度量离散程度(变异性)的指标 ★度量偏斜程度的指标 ★度量两种数值变量关系的指标

度量中心(集中)趋势的指标 算术平均数(AVERAGE) 加权算术平均数(SUMPRODUCT) 在这里插入图片描述 中位数(MEDIAN)记为Me (懂了!前两个字母,妈妈再也不用担心分不清m0和me了o(╥﹏╥)o) *分组数据中位数的计算:*插值法

在这里插入图片描述 具体步骤如上图所示

众数(MODE) *分组数据众数的计算:*插值法 请添加图片描述 请添加图片描述 具体步骤如上图所示

接下来我们实操一下,书上的例题【3.3】 请添加图片描述

在这里插入图片描述

鄙人手写分析,虽然书上有答案,不如自己手写一遍来得实在,对8?请添加图片描述 算术平均数、众数、中位数之间的关系 ♡完全对称 三个数完全一样 ♡左偏态 (峰值靠右) 平均数、me、m0 ♡右偏态(峰值靠左)m0、me、平均数 (反正me(中位数)都在中间(峰值))

四分位数(QUARTILE(数据集,第n位数)) Q1=(n+1)/4 Q3=3(n+1)/4 ▷结果是整数 ▷结果是半数 有2.5,即为第二个数和第三个数的平均数 ▷结果以上都不是 取最接近的整数 比如2.75取3

0最小值 1第一分位数 25% 2第二分位数 50% 3第三分位数 75% 4最大值

五数汇总和箱线图 请添加图片描述 请添加图片描述几何平均数(GEOMEAN)n个数值连续乘积的n次方根

度量离散程度的指标

极差R 四分位数极差QR=Q3-Q1 以上都不受极端值影响 平均差(AVEDEV) A`D 各数据与其均值离差的绝对值的算术平均数 越大代表数据间的差异越大

方差&标准差 总体:方差(VARP) 标准差(STDVP) 样本:方差(VAR) 标准差(STDEV)

变异系数 CV=标准方差÷算术平均值×100%

z值 定义极端值,越大,数据远离均值的距离越大 z=(数据-均值)/标准差 z<-3&z>3时,认为数据中有极端值

度量两种数值变量关系的指标 协方差(COVAR) 相关系数(CORREL)

结束、、肝不下去了,明天还要上班,唉。。。社畜。。。 请添加图片描述

第四章 概率论基础

4.2随机试验与随机事件 随机试验的结果称为随机事件。 试验中每一种可能出现的结果称为该试验的的一个基本事件,有多个基本事件构成的集合称为复合事件。 样本空间(S):所有基本事件组成的集合 不可能事件()

事件间的关系: 包含与相等:a事件的发生,必然导致b事件的发生 并:a事件与b事件至少有一个发生 交:a事件和b事件同时发生 互斥:a和b不能同时发生 差:a-b(a事件发生而b事件不发生) 互逆:a和b仅有一个发生请添加图片描述

概率:p p(a∪b)=p(a)+p(b)-p(ab)概率的广义加法定理 古典概型(等可能概率):每一个基本事件发生的概率相等

条件概率: p(b|a)=p(ab)/p(a)

随机变量及其分布函数 离散型:取值可以一一列出来 连续型:取值范围某一实数,取值无法一一列出来

分布函数: p{x1



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有