オンライン平均計算機を使用すると、任意のデータセットの平均を簡単に見つけることができます。データをテキストボックスに入力、コピー、貼り付けることができます。各データポイントはカンマで区切られていることを確認してください。次に、「計算」ボタンをクリックします。
平均計算機には、データセットの平均(算術平均)、計算手順、その他の関連統計が表示されます。
平均は、データセット内の値の平均として定義されます。データセット内のすべての値を使用して平均を計算します。したがって、それはデータセット全体を表します。平均は、最も重要な中心傾向または要約測度の一つと見なされます。
単純算術平均が最も一般的な平均です。しかし、幾何平均、加重平均、複合算術平均、調和平均など、いくつかの種類の平均があります。
母集団の平均はμ(ミュー)で表され、標本の平均はX̄(Xバー)で表されます。
単純平均は、データセットの値をデータ項目の総数で割ることで計算されます。単純平均は、平均、算術平均、平均値と呼ばれることもあります。
母集団の平均を計算するには、以下の式を使用できます。
μ = データセットの値の合計 / 母集団内のデータ値の総数 = ΣX / N
標本の平均を計算するには、以下の式を使用できます:
X̄ = データセットの値の合計 / 標本内のデータ値の総数 = ΣX/n
以下の例を使用して平均を学習しましょう。
例:
ジャスミンの前学期の7科目のスコアが以下の表に示されています。ジャスミンの前学期の科目スコアの平均は何ですか?
科目 | スコア |
---|---|
経営学 | 84 |
コミュニケーション | 90 |
会計学 | 75 |
経済学 | 60 |
経営統計学 | 85 |
国際研究 | 92 |
数学 | 81 |
解答:
平均スコア = ΣX / N = (84 + 90 + 75 + 60 + 85 + 92 + 81) / 7 = 567 / 7 = 81
平均は誰もが馴染みのある概念です。平均収入、平均生産コスト、平均価格、平均スコア、平均燃料消費量などが、よく聞く例です。日常生活でも、単純平均は標準的な計算です。単純平均または単純算術平均は、理想的な平均とも呼ばれます。
しかし、状況によっては他の中心傾向の測定方法を使用します。それらを見てみましょう。
時間の経過とともに値の平均成長率を決定する場合、算術平均は適切な測定ではありません。複利計算など、会計や金融でよく使用される幾何平均は、そのような計算にはるかに優れた指標です。これは、成長率が加算ではなく乗算であるためです。
データセットの幾何平均は、n個の項目の積のn乗根として定義されます。各値を乗算してから積のn乗根を計算することで求められ、ここでnはデータセット内の項目数です。幾何平均は、比率、パーセンテージ、成長率の平均を求めるのに役立ちます。
幾何平均 = n√(x₁×x₂×x₃×…×xₙ) = (x₁×x₂×x₃×…×xₙ)^(1/n)
前の例の幾何平均を求めます。
幾何平均 = ⁷√(84×90×75×60×85×92×81) = 80.31
幾何平均は常に単純平均(算術平均)以下です。
私たちの例では、
幾何平均 ≤ 平均
80.31 < 81
平均計算機を使用して算術平均だけでなく、データセットの幾何平均も求めることができます。
単純算術平均では、すべての値が同じ重みまたは重要性を持っています。しかし、場合によってはデータセット内の各値に同じ重要性レベルを適用できません。
私たちの例では、すべてのスコアを合計して科目の総数で割ることで平均を計算しました。各科目の相対的重要性は考慮していませんでした。
平均を計算する際にデータセットの各項目の相対的重要性を考慮する必要がある場合は、加重平均を使用する必要があります。加重平均は、加重値の合計を重みの合計で割ることで計算されます。加重値は、データ値に該当する重みを乗算したものです。
加重平均を求めるには、以下の式を使用できます。
加重平均 = 加重値の合計 / 重みの合計 = ΣWX / ΣW
例:
前の例の各科目が異なる重みを持っていると仮定します。そのため、ジャスミンの前学期の7科目のスコアの更新されたデータ表は以下の通りです。
ジャスミンの前学期のスコアの加重平均
科目 | スコア | 重み |
---|---|---|
経営学 | 84 | 3 |
コミュニケーション | 90 | 2 |
会計学 | 75 | 4 |
経済学 | 60 | 3 |
経営統計学 | 85 | 3 |
国際研究 | 92 | 2 |
数学 | 81 | 3 |
解答:
加重平均スコア = ΣWX / ΣW = (84×3+90×2+75×4+60×3+85×3+92×2+81×3)/(3+2+4+3+3+2+3) = (252+180+300+180+255+184+243)/20 = 1594/20 = 79.7
中央値は、データ集合が昇順(最小値から最大値へ)または降順(最大値から最小値へ)に並べられたときの中間値です。言い換えれば、中央値はデータ配列(配列は生データを値の昇順または降順に並べたもの)を2つの等しい部分に分割する点です。その結果、値の50%が中央値より下に、50%が中央値より上に位置します。
中央値を求める際には、まず以下の式を使って中央値の位置を見つけます:
中央値の位置 = ((n+1)/2)番目の項目
「n」はデータセットの項目総数を示します。
データセット内の項目総数が奇数の場合、中央位置の項目の値が中央値となります。しかし、データセット内の項目総数が偶数の場合、中央の2つの数値の平均が中央値となります。
データセットが外れ値なしの対称分布を持つ場合、または外れ値が削除された場合、平均は中心傾向の最も適した測度です。
データセットが外れ値によって歪められている場合、またはデータセットが対称的に分布していない場合、またはデータセットが偏っている場合、平均はデータセットを適切に表すものではありません。外れ値とは、データセット内の他の値と比べて著しく小さかったり大きかったりするデータポイントのことです。データセットに外れ値が存在する場合、平均または平均値はこれらの値に大きく影響されます。
外れ値を理解するために、前の例を変更してみましょう。
例:
ジャスミンの国際研究のスコアが92ではなく15だったとします。この新しいスコアでのジャスミンの前学期のスコアの平均は何ですか?
科目 | スコア |
---|---|
経営学 | 84 |
コミュニケーション | 90 |
会計学 | 75 |
経済学 | 60 |
経営統計学 | 85 |
国際研究 | 15 |
数学 | 81 |
解答:
平均スコア = ΣX / N = (84+90+75+60+85+15+81)/7 = 490/7 = 70
新しい平均は70です。これは元の平均81からの11ポイントの減少です。外れ値が平均に与える影響を見ることができます。
この場合、データの中央値は平均よりも中心傾向のより良い測度です。これを理解するために、元の例と修正例の両方の中央値を計算してみましょう。