1-7.𝑢倍か 𝑑倍の確率分布の連続化-1 対数正規分布

対数正規分布

ここで、対数正規分布について説明する。
通常の正規分布は定義域が(−∞,∞)であ り、 平均値の 周りに対称な 性質を持つ多くの自然現象が正規分布に従う。

対数正規分布は、イメージとしては 正規分布の独立変数 𝑋𝑒^𝑋(指数関数) に 変数変換した分布で、 𝑒の肩に正規分布を載せたような分布である。対数正規分布の横軸の対数をとれば正規分布になる。株価のように値が 0 より小さくなることはなく、逆にプラ ス方向の最大値は限定されないような現象は、対数正規分布に従うこと が多い。

対数正規分布の定義域 は (0,\infty) である。 𝑥−∞に近づくと 𝑒^𝑥は 0 に近づく。 確率分布なので、 0 から∞まで 積分すれば 1 になる。
平均\mu、分散 𝜎^2正規分布 𝑁(𝜇,𝜎^2)確率密度関数 の式 は、

𝑓(𝑋)=\genfrac{}{}{}{0}{1}{\sqrt{2𝜋𝜎^2}}\exp\left[−\genfrac{}{}{}{0}{(𝑋−𝜇)^2}{2𝜎^2}\right]

であるが、この𝑋軸を 𝑌=𝑒^𝑋に変数変換した対数正規分布確率密度関数は、

𝑓(Y)=\genfrac{}{}{}{0}{1}{\sqrt{2𝜋𝜎^2}Y}\exp\left[−\genfrac{}{}{}{0}{(\log Y−𝜇)^2}{2𝜎^2}\right]

であり、
これを 𝐿𝑁(𝜇,𝜎^2) と書く。 LN は Log Normal distribution の意味である。注意すべき なのは、 この書き方をした時の 𝜇,𝜎^2は対数正規分布自体の平均、分散ではなく、「 元の正規分布の 」平均、分散である。 この式と比較すれば、「 𝑢倍か 𝑑倍の確率分布を連続化した分布」は対数正規分布であることがわかる。

対数正規分布確率密度関数は、これまでに見た変数変換の公式に従って正規分布の独立変数 𝑋𝑒^𝑋に変数変換したものになっている。 𝑌=𝑒^𝑋なので 、

𝑋=\log 𝑌

\genfrac{}{}{}{0}{𝑑𝑋}{𝑑𝑌}=\genfrac{}{}{}{0}{1}{𝑌}

となり、分数の分母にある 𝑌がこれにあたる。

下は、標準正規分布𝑁(0,1)(破線)と、それを基にした対数正規分布𝐿𝑁(0,1) (実線)を 1つの グラフに書いたものである。

 

標準正規分布𝑋の値 が 0 のとき最大値をとる。正規分布の横軸 0 は対数正規分布では𝑒^0=1に相当するが、対数正規分布はここでは最大値を取ら ず、ピークは 1 よりも 負方向にずれる。 これは正規分布の横軸の −∞から 0 までの部分が、対数正規では 0 から 1 までの間に「濃縮」されることによる効果である。標準正規分布の関数値は横軸負の部分では単調減少であるが、対数正規に変換する際、 −∞に近づくほど横軸方向の「密度」が高まるので、結果として 、 対数正規分布のピークを与える 𝑋の値は 、 元になる正規分布の最頻値 0 を 𝑒^0した値 (1)よりも 小さくなる。

元の正規分布の 平均、分散を 𝜇,𝜎^2としたときの対数正規分布 𝐿𝑁(𝜇,𝜎^2) の 主な代表値と分散は下記のようになる ことが知られている 。

  • 平 均:\exp\left[𝜇+𝜎^2/2\right]
  • 中央値:\exp\left[\mu\right]
  • 最頻値:\exp\left[𝜇−𝜎^2\right]
  • 分 散:\exp\left[2𝜇+𝜎^2\right](\exp[𝜎^2]−1)

平均(期待値)は、確率分布の重心である。𝐿𝑁(𝜇,𝜎^2) のグラフの形に板を切り出したとすると、横軸の値が \exp[𝜇+𝜎^2/2] のところ、標準正規分布の対数正規分布であれば \exp[1/2]=1.649の点で板を支えれば 左右が釣り合う。対数正規分布の平均は最頻値や中央値よりも 大きな値となる。これは、元の正規分布の左半分の部分が対数正規分布では 0 から中央値\exp[𝜇] までの範囲に「濃縮」されるのに加え、右半分の部分が横軸の \exp[𝑋] の変換に伴って\exp[𝜇] から遠いところに置かれるため、「てこの原理」で平均値を押し上げるためである。 対数正規分布では 、平均よりも損をする確率 が 、得をする確率よりも 大きい 。ただ、得をする場合は大儲けをする 可能性が高いのである。

中央値は、グラフの面積を二等分する値である。 中央値よりも右側の 確率 が 50% 、左側が50% になる。 勝率を五分五分にする値である。対数正規分布では、元の正規分布の平均値 𝜇を変数変換した \exp[𝜇](標準正規 分布では \exp[0]=1) が中央値になる。

最頻値はグラフの値(確率)を最大にする横軸の値である 。1 回 1 回の各試行では、結果が最頻値の近辺 になる確率が最も高い。すでに説明したとお り 、対数正規分布では 最頻値は \exp[𝜇]よりも小さな値になる。

 

-目次へ-