添加链接
link管理
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接
相关文章推荐
绅士的凉面  ·  SQLCipher - Full ...·  6 月前    · 
帅气的鼠标  ·  Custom Database(db2) ...·  1 年前    · 
飘逸的企鹅  ·  (Ⅱ)072 残酷的过往 - ...·  1 年前    · 
老实的红豆  ·  Link Kit C-SDK: ...·  1 年前    · 

\(H\le G\le M\le RMS\)

算术平均数(M)

算术平均数, Arithmetic Mean ,是最常见也是最好理解的平均数,又称均值,是统计学中最基本,最常用的一种平均指标,分为 简单算术平均数 加权算术平均数

简单算术平均数公式:

\(M=\cfrac{\sum\limits_{i=1}^n X_i}{n}\)

加权算术平均数公式:

\(M=\sum\limits_{i=1}^n X_i\cdot f_i,\ \sum\limits_{i=1}^n f_i=1\)

简单算术平均数可看做各数值权重全部相同的一种特殊情况的加权平均数。加权算数平均数常用于计算离散随机变量的期望值。

算术平均数的特点:

  • 简单性:算术平均数计算简单,只需将所有数值相加并除以个数。
  • 反映总体趋势:算术平均数可以用来表示一组数据的中心趋势,它能够反映出数据集的总体水平。
  • 可加性:算术平均数具有可加性,即若将数据集分为若干子集,每个子集的平均数的平均数,等于整个数据集的平均数。
  • 算术平均数虽然是一种常用的统计量,但也存在一些缺点:

  • 易受极端值(outlier)的影响:算术平均数对极端值非常敏感。若数据集中存在极大或极小的数值,这些值会对算术平均数产生较大的影响,从而使平均数不够准确地反映数据的整体特征。
  • 不适用于非对称分布:当数据集具有非对称分布(如偏态分布)时,算术平均数可能无法有效地代表数据的中心趋势。在这种情况下,使用其他类型的平均数(如中位数或众数)可能更合适。
  • 不适用于分类变量:算术平均数通常用于处理数值型变量,而对于分类变量(如性别、颜色等)则无法使用算术平均数进行分析。
  • 忽略了数据分布的形状:算术平均数只考虑了数据的总和和数量,而没有考虑数据的分布形状。因此,在需要考虑数据分布特征的情况下,其他描述性统计量(如标准差、偏度和峰度)可能更有用。
  • 算术平均数是使MSE(Mean Square Error)最小的值

    假设有一组测量值,只需做一次简单的求导,就可以证明,它们的算术平均数,就是能够让MSE最小的值。

    几何平均数(G)

    几何平均数, Geometric Mean ,是一组数值的连乘积的n次根,其中n是数值的个数。换句话说,几何平均数是将一组数值相乘,然后取乘积的n次根作为结果。

    几何平均数的计算公式:

    \(G=\sqrt[n]{\prod\limits_{i=1}^n X_i}\)

    算术平均数是加起来除以数量,几何平均数是乘起来按开数量的根号...

    由此计算公式可以看出,几何平均数具有 非负性 !如果数据中存在负数或零,也不适合应用几何平均数。

    Logarithmic property: One important characteristic of the geometric mean is its relationship to logarithms. Taking the logarithm of each data point and then calculating the arithmetic mean of the logarithms is equivalent to calculating the geometric mean of the original data, and then take logarithm. This property can be useful when dealing with multiplicative relationships, as taking the logarithm can transform them into additive relationships.

    这段话可以用下面的表达式来说明,

    \(\cfrac{\log{a}+\log{b}}{2}=\cfrac{1}{2}\log{ab}=\log{\sqrt[2]{ab}}\)

    Stability under scaling: The geometric mean is scale-invariant, meaning that multiplying all the data points by a constant will result in the same geometric mean. This property makes the geometric mean useful for comparing data sets with different scales or units of measurement.

    我们也可以用一个数学表达式来说明stability under scaling这个性质:

    \(\sqrt[2]{2a\cdot 2b}=2\cdot\sqrt[2]{ab}\)

    The geometric mean is commonly used in various fields to calculate average ratios or proportions. It is employed in areas such as demographic analysis, index numbers, production efficiency ratios, and price-earnings ratios in finance.

    几何平均数常用来计算平均比例,例如在金融投资领域,用来表达CAGR。

    SPEC benchmark最后给出的结果,就是一个几何平均数,因为这个值不会因为更换reference而改变。(更换reference,只是简单的多出来一个系数需要按需求调整,这就是用到了stability under scaling这个性质)

    另一个几何平均数有关的绝对不等式如下:

    \(\cfrac{x+y}{2}\ge\sqrt{xy},\ x\ge0,\ y\ge0\)

    这个绝对不等式的推导,就是从绝对不等式\((a-b)^2\ge0\)开始。

    调和平均数(H)

    调和平均数, Harmonic Mean ,是一组数值的倒数的算术平均数的倒数。

    调和平均数的计算公式如下:

    \(H=\cfrac{n}{\sum\limits_{i=1}^n \cfrac{1}{X_i}}\)

    调和平均数受极端值影响较小,因为极大的倒数较接近于零,对调和平均数的影响减弱。调和平均数要求参与计算的数字不能为0。

    调和平均数的应用场景:

  • 平均速度:调和平均数常用于计算速度的平均值,特别是当速度在不同时间段保持稳定时。
  • 比例和比率:调和平均数可用于计算比例和比率的平均值,如平均市盈率、平均比重等。
  • 平方平均数(RMS)

    平方平均数, Root Mean Square,缩写为RMS ,是一组数值的平方和的平均数的平方根。

    RMS的计算公式:

    \(RMS=\sqrt[2]{\cfrac{\sum\limits_{i=1}^n X_i^2}{n}}\)

    从计算公式可以看出,平方平均数不可能是负数,即使参与计算的数字有负数,并且允许0的存在。

    平方平均数常用于处理与振幅、能量、方差相关的数据,它具有以下特点和应用场景:

  • 平方性质:平方平均数是对原始数值进行平方后再取平均的结果,因此它可以用来描述数值的振幅、能量等特征。(振动有正有负,平方后就没有负数了)
  • 非负性:平方平均数始终为非负数,即使数值中存在负数。
  •