計算方法:パーセンタイル法
処理内容:
極端な値(上位5%と下位5%)を除外した統計です
使用範囲:
第5パーセンタイル〜第95パーセンタイル
年収
データの処理
項目 |
全データ |
外れ値除外後 |
平均値 |
320万円
|
320万円
|
最小値 |
312円
|
1万円
|
最大値 |
1,000万円
|
611万円
|
対象件数 |
406件
|
365件
|
除外件数 |
- |
41件
(10.1%)
|
範囲 |
- |
1.4万円 〜 611.4万円
|
パーセンタイル分布
データの分布を把握するための統計指標
パーセンタイル |
年収
|
説明 |
第5% |
1万円
|
第5パーセンタイル
|
第25% |
255万円
|
Q1 - 下位25%の境界値
|
第50% |
324万円
|
中央値 - データの中央の値
|
第75% |
399万円
|
Q3 - 上位25%の境界値
|
第95% |
611万円
|
第95パーセンタイル
|
📊 詳細統計分析
中央値
324万円
データを大きさ順に並べた時の真ん中の値
四分位範囲
144万円
データの中央50%の範囲(給与のばらつきを示す)
実質
給与幅
610万円
全データの90%をカバーする範囲
分布分析
分布の特徴:対称的
詳細:平均値と中央値がほぼ同じで、分布は対称的です
給与分布が均等で、極端な高給・低給が少ない状況
🔬 高度な統計指標
標準偏差
178万円
値が大きいほど給与のばらつきが大きい
変動係数
55.5%
給与のばらつきは大きい(多様な給与レンジ)
信頼区間(±1標準偏差)
下限値
1万円
※標準偏差による下限が負のため、第5パーセンタイル値を使用
変動係数: 0.6%
約68%のデータがこの範囲に入る(下限は分布の第5パーセンタイル値)
なぜ外れ値を除外するのか?
求人情報の給与データには、入力ミスや特殊な条件の求人が含まれることがあります。
これらの極端な値は統計を歪める可能性があるため、
より実態に近い統計値を提供するために上位・下位各5%のデータを除外しています。