什么是统计学?
统计学是应用数学的一个分支,涉及定量数据的收集、描述、分析和结论的推断。统计学背后的数学理论在很大程度上依赖于微分和积分计算、线性代数和概率论。
统计学家,做统计的人,特别关注如何从小样本的行为和其他可观察的特征中得出关于大群体和一般事件的可靠结论。这些小样本代表了大群体的一部分或一般现象的有限数量的实例。
·统计学是对数据的研究和处理,包括收集、审查、分析和从数据中得出结论的方法
·统计学的两个主要领域是描述性统计和推断性统计
·统计学可以在不同的层面进行交流,从非数字描述(名义层面)到参考零点的数字(比率层面)
·一些抽样技术可用于编制统计数据,包括简单的随机、系统、分层或集群抽样
·统计学几乎存在于每个公司的每个部门,也是投资的一个组成部分
了解统计学:
统计学几乎被用于所有科学学科,如物理和社会科学,以及商业、人文、政府和制造业。统计学从根本上说是应用数学的一个分支,它是从包括微积分和线性代数在内的数学工具在概率理论中的应用发展而来的。
在实践中,统计学认为我们可以通过研究较少数量的类似对象或事件(样本)的特征来了解大组对象或事件(群体)的属性。因为在许多情况下,收集整个人口的全面数据成本太高、太困难,或者完全不可能,所以统计学从可以方便地或负担得起地观察的样本开始。
在分析数据时,有两种类型的统计方法:描述性统计和推断性统计。统计学家测量和收集关于样本中的个人或元素的数据,然后分析这些数据以产生描述性统计。然后,他们可以利用这些观察到的样本数据的特征(正确地称为"统计数据"),对更广泛的人群的未测量(或未衡量)的特征(称为参数)进行推断或有根据的猜测。
描述性统计和推断性统计
统计学的两个主要领域被称为描述性统计和推断性统计,前者描述了样本和群体数据的属性,后者则使用这些属性来检验假设并得出结论。描述性统计包括平均值(平均)、方差、偏度和峰度。推断性统计包括线性回归分析、方差分析(ANOVA)、Logit/Probit模型,以及无效假设检验。
·描述性统计
描述性统计主要集中在样本数据的中心倾向性、变异性和分布上。中心倾向是指对特征的估计,是样本或人群的典型元素,包括描述性统计,如平均数、中位数和模式。变异性指的是一组统计数据,它显示了样本或人群中的元素沿着所测量的特征有多大差异,包括范围、方差和标准差等指标。
分布指的是数据的整体"形状",可以用直方图或点阵图等图表来描述,包括概率分布函数、偏度和峰度等属性。描述性统计还可以描述数据集中各元素的观察特征之间的差异。描述性统计帮助我们理解数据样本中各元素的集体属性,并为使用推理统计检验假设和进行预测奠定基础。
·推断性统计
推断性统计是统计学家用来从样本的特征中得出关于人群特征的结论,并决定他们对这些结论的可靠性有多大把握的工具。基于样本的大小和分布,统计学家可以计算出统计学的概率,即衡量数据样本内的中心趋势、变异性、分布和特征之间的关系,为样本所来自的整个人口的相应参数提供准确的描述。
推断统计学被用来对大群体进行概括,如通过调查消费者购买习惯的样本来估计对产品的平均需求,或试图预测未来事件,如根据样本期的回报率来预测证券或资产类别的未来回报率。
回归分析是一种广泛使用的统计推理技术,用于确定因变量和一个或多个解释(独立)变量之间关系的强度和性质(即相关性)。回归模型的输出常常被分析为具有统计学意义,统计学意义是指通过测试或实验产生的结果不可能是随机或偶然发生的,而可能是由数据所阐明的特定原因造成的。具有统计学意义对于严重依赖分析数据和研究的学术学科或从业人员来说非常重要。