機械学習を学んでいて調和平均(harmonic mean)というワードが出てきたので、紹介します。
普通の平均は”全部足して全個数で割る”みたいな考え方ですが、
この計算方法だと辻褄が合わないケースで調和平均が登場します。
例えば、家から学校までの距離が1kmだったとして、次の速さで往復したとします。
行きの速さ:a [km/h]
帰りの速さ:b [km/h]
※”h”は単位時間(1時間)
このとき、行きと往復の平均の速さはどうなるか。
ぱっと見、平均の速さなのだから、行きと帰りの速さの合計を2で割って、
$$
\frac{a + b}{2}\hspace{4pt}[km/h]
$$
で良いと思われがちです。
ただ厳密に計算してみますと、
1kmを往復したので総距離は2kmであり、
往復に要した時間は距離÷速さで算出できるので、
行きに要した時間:1 [km] ÷ a [km/h] = 1 / a [h]
帰りに要した時間:1 [km] ÷ b[ km/h] = 1 / b [h]
よって往復に要した時間の合計は、
$$
\frac{1}{a}+\frac{1}{b}\hspace{4pt}[h]
$$
速さは距離÷時間なので、
$$
\frac{2}{\frac{1}{a} + \frac{1}{b}}\hspace{4pt}[km/h]
$$
のような式になり、2kmの距離を平均でこの速さで進んだと考えます。
これが調和平均と呼ばれている式の考え方になります。
単純に「全部足して全個数で割る」という考えの平均では合わないことがわかりました。
ちなみに、単純に「全部足して全個数で割る」という平均は厳密には算術平均と呼ばれるようです。
コメント