如果$\ln X \sim \mathcal{N}(\mu, \sigma^2)$,那么$X$服从对数正态分布,它的PDF是:$\frac{1}{x \sigma \sqrt{2\pi}} \exp \left( -\frac{(\ln x - \mu)^2}{2\sigma^2} \right)$
图例
1 | import numpy as np |
公式推导
关键在于理解概率密度变换(Probability Density Transformation)的数学原理。重点解释为什么分母是$x$而不是$\ln x$。
核心问题
已知$\ln X \sim \mathcal{N}(\mu, \sigma^2)$,即$Y = \ln X$服从正态分布,其概率密度函数(PDF)为:
但我们需要的是$X = e^Y$的分布,即$X$的PDF$f_X(x)$。
概率密度变换的推导
从$Y$到$X$的变换是一个非线性变换( $X = e^Y$ ),因此需要用到 变量替换定理(Change of Variables Theorem)。具体步骤如下:
- 变换关系
$Y = \ln X$ ,即$X = e^Y$。变换的雅可比行列式(Jacobian)为:
- PDF变换公式
对于单调变换$X = g(Y)$,概率密度满足:
将$y = \ln x$和雅可比行列式代入:
- 代入正态分布PDF
将 $f_Y(y)$ 的表达式代入:
合并后即得到对数正态分布的PDF:
为什么分母是$x$而不是$\ln x$?
关键原因:分母的$x$来自 雅可比行列式$\frac{dy}{dx} = \frac{1}{x}$,它是对数变换$Y = \ln X$的导数。
如果强行改为$\ln x$,会破坏概率密度的积分性质(即 $\int f_X(x) dx = 1$),导致分布不合法。
物理意义:$x$是原始变量,而$\ln x$是变换后的变量。PDF必须反映原始变量的概率密度,因此需要乘以$\frac{1}{x}$来修正缩放比例。
验证积分是否为1
可以验证$f_X(x)$的积分:
通过变量替换$u = \ln x , du = \frac{1}{x} dx$ ,积分变为:
这正是标准正态分布的积分性质。
总结
分母的$x$是数学推导的必然结果,源于概率密度变换的雅可比行列式。它保证了$f_X(x)$是一个合法的概率密度函数(积分为1)。若替换为$\ln x$,会破坏分布的正确性。