何らかの 2 次元的なデータ (
) があるとし、
これに対して、
の平均、
の平均を
,
と書く。
(1)
まず、 の最小値を考えるために、
,
に関する
の停留点を求める。偏微分
(4)
ここで、 となるのは、すべての
が
に等しい、
つまりすべての
が同じ値である場合であるから、
そうでなければ
となる。
よって、通常のデータでは、
と考えることができ、
以下その状況で考える。
なお、ついでに言うと、(4) の の計算も、
最初から
より
の定義式 (1) を
用いて計算している学生を見かけることがあるが、
むしろ (4) の最初にある
による表現式を用いて
計算する方が楽である。
それは、
の定義を用いると、
、
を先に求めるためにまず全部のデータを一度走査する必要があり、
その後でもう一度全部のデータを走査する必要があるが、
の値ならば、
各データに対する
,
,
,
の値の和を
計算していけばいいだけなので、データの走査は一度で済む。
つまり大量のデータに対しても、
こちらの方法を使えば逐次計算していくことができる。
竹野茂治@新潟工科大学