统计量有哪些(三个常见统计量)

文章目录

  • 统计的
  • 常见统计数据及其分布
  • 三样本分布
  • 摘要

机器学习是实现人工智能的重要技术之一。在学习机器学习的过程中,我们必须掌握一些基本的数学和统计知识。在小白初学者学习数理统计的过程中,很多人对统计及其分布感到困惑,感觉一头雾水。今天借此机会整理一下关于统计学的知识,希望对大家有所帮助。本文的结构如下:首先,前言介绍了统计学与概率论的关系;然后,引入统计量的概念,并与参数进行比较。然后介绍常见的统计量及其分布;最后是总结。

概率论与统计

搞清楚概率论,掌握核心点就够了——概率论研究的是不确定性(一定要牢记)。一般来说,就是利用相关信息来计算具体事件发生的概率。统计学(推断统计学)研究的是利用样本推断总体,即反映局部的总体。前面几篇和概率论相关的文章,这一篇是关于统计的,不要混淆。

概率与统计

统计的

在介绍统计学之前,我们先明确以下总体、样本、变量的含义。

举个简单的例子,以学校学生为研究对象,学校所有学生人数为整体,然后选取100名学生进行研究,那么这就是样本。变量是研究对象的特征,如学生的年龄、身高等。每个学生的身高年龄都不一样,所以叫“变异”。

那么统计数据是什么呢?统计量是通过计算样本得到的样本的描述值。不是统计总数据得到的数量。还是那句话,统计学计算的是样本,而不是总体。也就是说,统计量是由样本数据计算出来的统计指标,是样本的函数,没有参数。

同时,很自然的,我们会想,我们把计算人口得到的描述性值叫做什么?我们称之为参数。一般来说,我们认为人口是无限的,所以参数很难找出是未知的,但可以确定。但众所周知,统计数据会发生变化。

构架图解

常见统计数据及其分布

常见的统计包括样本均值、样本方差、样本标准差等。统计量的分布称为抽样分布。这里说明一下,统计学中的样本是一个随机变量,因为样本是按照一定的规则从总体中随机抽取的,它是随机的、独立的。

采样平均

样本平均值是样本的平均值。

样本平均值计算公式

样本方差、样本离差

它用来衡量随机变量和期望值之间的偏离程度。

样本方差计算公式

样品标准偏差

样本标准差是样本方差的算术平方根。

样本标准差计算公式

三样本分布

统计学中三种重要的抽样分布是卡方分布、t分布和f分布。

分布

如果随机变量X1…..Xn相互独立且服从标准正态分布N(0,1),则该分布即随机变量x2 = x12…xn2服从的是自由度为n的χ2分布,也称为卡方分布。

分布

卡方分布的结论是其均值为n,方差为2n。卡方分布可以帮助我们识别常规事件中的异常现象。

t分布

如果X1服从标准正态分布N(0,1),X2服从自由度为N的χ2分布,X1和X2相互独立,那么随机变量t=X1/(X2/n)1/2次方服从自由度为N的t分布

t分布

t分布适用于大样本和小样本。

f分布

若X1服从自由度为m的χ2分布,X2服从自由度为n的χ2分布,X1和X2相互独立,则随机变量F=(X1/m)/(X2/n)服从F分布,其中第一自由度为m,第二自由度为n

f分布

摘要

统计是关于样本的统计指标。统计量的分布称为抽样分布。三种常见的抽样分布是卡方分布、t分布和f分布。这三种分布可用于假设检验。详细过程我们稍后分享。欢迎大家继续作者。

欢迎在评论区交流!#科技新星创造营# #科技新星创造营# #机器学习# #人工智能# #概率统计#

(0)
上一篇 2022年4月25日
下一篇 2022年4月25日

相关推荐