标准差计算

数字（每行一个或逗号/空格分隔）

快速示例：

什么是标准差？

标准差（Standard Deviation）是衡量数据集中数据点相对于均值的分散程度的统计量。它给出了数据点到均值的"平均距离"，单位与原始数据相同。

为什么需要标准差而非方差？方差是偏差的平方和的平均值，其单位是原始数据单位的平方（例如数据单位是"米"，方差单位就是"米²"）。标准差通过取方差的平方根，将度量还原到原始单位，使其可以直接与数据进行比较和解释。例如，如果一组身高数据的标准差是 5 cm，我们可以直观理解：大多数人的身高与平均身高相差大约 5 cm 左右。

标准差的概念最早可追溯到卡尔·弗里德里希·高斯（Carl Friedrich Gauss, 1777–1855）关于误差理论的工作，但"标准差"这一术语是由英国统计学家卡尔·皮尔逊（Karl Pearson）在 1894 年正式引入的。

直觉理解

想象你在射靶：均值是靶心，标准差衡量的是你的射击点离靶心有多"散"。标准差越小，射击越集中（精度越高）；标准差越大，射击越分散。

总体标准差 vs 样本标准差

这是统计学中最常被混淆的区别之一。两种标准差的计算方式几乎相同，唯一的区别在于分母：

	总体标准差 (σ)	样本标准差 (s)
适用场景	你拥有全部数据	你只有总体的一个子集
除以	N（数据总量）	n - 1（样本大小减 1）
符号	σ（sigma）	s
举例	全班 30 人的考试成绩	从全市随机抽取 200 人的收入

为什么样本标准差要除以 n-1 而非 n？这就是所谓的 Bessel 校正（Bessel's correction），以德国天文学家弗里德里希·贝塞尔（Friedrich Bessel, 1784–1846）命名。他在 1820 年代研究天文观测误差时发现了这一校正的必要性。

核心原因是：当我们用样本均值 x̄ 代替未知的总体均值 μ 来计算偏差时，我们系统性地低估了真实方差。因为 x̄ 是使 Σ(x_i-x̄)² 最小化的值——它被数据"拉向"了中间——所以计算出的偏差平方和总是偏小。除以 n-1 而非 n 可以精确补偿这一偏差，使得样本方差成为总体方差的无偏估计量。

公式详解

总体标准差：

σ = √1N Σ_i=1^N (x_i - μ)²

样本标准差：

s = √1n-1 Σ_i=1ⁿ (x_i - x̄)²

其中：

x_i — 第 i 个数据点
μ — 总体均值（所有数据的平均值）
x̄ — 样本均值
N — 总体大小（全部数据量）
n — 样本大小
Σ — 求和符号（对所有数据点求和）

手工计算步骤：

计算均值 x̄ = Σx_i / n
计算每个数据点与均值的偏差：x_i - x̄
将偏差平方：(x_i - x̄)²
对所有偏差平方求和：SS = Σ(x_i - x̄)²
除以 N（总体）或 n-1（样本）得到方差
取方差的平方根得到标准差

Bessel 校正：为什么除以 n-1？

Bessel 校正是概率论中最优美的结果之一。以下是其数学推导的简化版本。

核心定理：如果 x₁, x₂, ..., x_n 是从均值为 μ、方差为 σ² 的总体中抽取的独立随机样本，那么：

期望值

E[Σ(x_i - x̄)²] = (n - 1)σ²，而不是 nσ²

推导思路：

第 1 步 — 恒等式

Σ(x_i - x̄)² = Σ(x_i - μ)² - n(x̄ - μ)²
将 x_i - x̄ 写成 (x_i - μ) - (x̄ - μ) 后展开平方求和可得。

第 2 步 — 取期望

E[Σ(x_i - μ)²] = nσ²（每项的期望是 σ²）
E[n(x̄ - μ)²] = n · Var(x̄) = n · σ²/n = σ²

第 3 步 — 结合

E[Σ(x_i - x̄)²] = nσ² - σ² = (n - 1)σ²

因此，要想让估计量的期望值等于真实方差 σ²（即无偏），我们必须除以 (n-1) 而非 n：

E[Σ(x_i - x̄)²n - 1] = σ² ✓

自由度的直觉：n 个数据点在知道均值 x̄ 之后，只有 n-1 个值可以自由变化（最后一个值被均值约束确定了）。这就是"自由度"(degrees of freedom) 的概念——n 个观测值减去 1 个已估计的参数。

68-95-99.7 规则（经验法则）

对于正态分布（也称钟形曲线或高斯分布），数据在标准差范围内的分布遵循一个精确的模式：

0.15%

13.6%

68.2% — 在 μ ± 1σ 之间

13.6%

0.15%

68.27% 的数据落在均值 ± 1 个标准差之内（μ ± 1σ）
95.45% 的数据落在均值 ± 2 个标准差之内（μ ± 2σ）
99.73% 的数据落在均值 ± 3 个标准差之内（μ ± 3σ）

历史背景：正态曲线最早由法国数学家亚伯拉罕·棣莫弗（Abraham de Moivre）在 1733 年描述。他将其作为二项分布在大样本下的近似。后来高斯（Gauss）将其应用于天文观测误差分析，因此正态分布又称"高斯分布"。

实际意义

如果一组考试成绩的均值是 75 分、标准差是 10 分，且近似正态分布，那么大约 68% 的学生成绩在 65–85 分之间，约 95% 在 55–95 分之间，低于 45 分或高于 105 分的学生极为罕见（不到 0.3%）。

注意：经验法则仅适用于正态分布或近似正态的数据。对于偏态或重尾分布，可使用切比雪夫不等式（Chebyshev's inequality）：无论分布形态如何，至少 1 - 1/k² 的数据落在均值 ± k 个标准差之内。例如，k=2 时至少 75%，k=3 时至少 88.9%。

变异系数 (CV)

CV = sx̄ × 100%

变异系数由英国统计学家卡尔·皮尔逊（Karl Pearson）在 1896 年提出，它是标准差与均值的比率，通常以百分比表示。

为什么需要变异系数？标准差是绝对度量，受数据量级的影响。如果一组数据的均值是 1000、标准差是 50，和另一组均值是 10、标准差是 5 的数据相比，哪组"更离散"？单看标准差（50 vs 5），前者似乎波动更大；但计算 CV（5% vs 50%），后者的相对离散度实际上高出 10 倍！

CV 的典型应用包括：

跨领域比较：比较不同量纲数据的波动程度（如股价 vs 温度）
实验室质量控制：CV < 5% 通常被认为是良好的重复性
金融分析：用于比较不同资产的风险调整后收益（夏普比率与 CV 密切相关）

局限性

CV 仅在均值有意义且不接近零时才可靠。对于温度（摄氏度）等可以为负或接近零的数据，CV 可能产生误导甚至无意义。此时应使用标准差本身进行比较。

应用场景

质量控制 — 六西格玛

六西格玛（Six Sigma）方法论由摩托罗拉工程师 Bill Smith 在 1986 年提出。其核心思想是将过程变异控制在均值 ± 6σ 以内，对应百万分之 3.4 的缺陷率（99.99966% 合格率）。标准差是衡量过程能力的核心指标。

金融 — 波动率

在金融领域，资产收益率的标准差被称为"波动率"（volatility），是风险的核心度量。年化波动率 = 日收益率标准差 × √252（252 为一年交易日数）。Black-Scholes 期权定价模型中的 σ 正是这个标准差。

科学研究 — 测量误差

实验科学中，重复测量的标准差量化了测量的精密度（precision）。结果通常报告为"均值 ± 标准差"（如 9.81 ± 0.02 m/s²）。标准误差（SEM = s/√n）衡量对均值估计的不确定性。

教育 — 标准分 (Z-score)

Z 分数 = (x - x̄) / s，将原始分数转化为"与均值相差几个标准差"。SAT、GRE 等标准化考试使用 Z 分数使不同年份的成绩可比。Z = 1.0 意味着高于均值一个标准差，大约胜过 84% 的考生。

气象学 — 异常检测

气象学家用标准差来定义"异常"天气。例如，某地某月的平均温度为 25°C、标准差为 3°C，当实际温度超过 31°C（> 2σ）时，可以定义为"显著偏热"事件。

体育分析

运动员的成绩标准差反映其稳定性。一个平均 100m 跑 10.2s、标准差 0.1s 的运动员比平均 10.1s 但标准差 0.5s 的运动员更可靠——虽然后者的最佳成绩可能更好。

方差计算器 — 方差是标准差的平方，深入了解方差的性质和推导
均值/中位数/众数计算器 — 集中趋势度量，与标准差（离散趋势）互为补充
正态分布计算器 — 利用均值和标准差计算正态分布的概率和分位数
百分位数计算器 — 与标准差结合理解数据的分布位置
Z 分数计算器 — 将数据标准化为标准差单位

常见问题

标准差为 0 意味着什么？

标准差为 0 意味着数据集中的所有值都完全相同——没有任何变异。每个数据点都等于均值，所有偏差都为零。例如，数据集 {5, 5, 5, 5} 的标准差为 0。

标准差可以大于均值吗？

完全可以。这通常出现在高度偏态的数据中（例如收入分布）。当 CV > 100% 时，标准差就大于均值。这表明数据具有极高的相对变异性。例如：{1, 1, 1, 1, 100} 的均值约为 20.8，但标准差约为 44.3。

什么时候用总体标准差，什么时候用样本标准差？

如果你的数据包含了你关心的全部个体，使用总体标准差 (σ)。例如：一个班级全部 30 名学生的成绩。如果你的数据只是更大总体的一个样本，而你想用它来推断总体特征，使用样本标准差 (s)。例如：调查 500 名消费者来推断全国消费者行为。在实际中，绝大多数情况下都应使用样本标准差，因为我们几乎总是在处理样本数据。

标准差受异常值的影响大吗？

是的，非常大。因为标准差基于偏差的平方，异常值的影响被放大了。例如，{10, 12, 11, 13, 11} 的样本标准差约为 1.14；加入一个异常值变为 {10, 12, 11, 13, 11, 100}，标准差跳升到约 35.8——增加了 30 多倍。如果数据中存在异常值，可以考虑使用更稳健的离散度度量，如中位数绝对偏差（MAD）或四分位距（IQR）。

标准差和标准误差 (SEM) 有什么区别？

标准差衡量个体数据点的离散程度；标准误差（SEM = s/√n）衡量样本均值的不确定性。SEM 总是小于标准差（只要 n > 1），并且随着样本量增大而减小。直觉上：即使个体差异很大（大的标准差），只要样本足够大，我们对均值的估计仍然可以很精确（小的 SEM）。科学论文中的误差线应注明使用的是 SD 还是 SEM，两者含义截然不同。