四分位数

定義:

四分位数はデータの分布を4つの等しい部分に分けるために使用される統計量である.

四分位数には以下の3つの主要な値がある.

四分位数を用いて四分位範囲[IQR;Interquartile Range]も次のように定義される.\[IQR = Q_3 - Q_1\]

四分位数は,データの分布を理解するための重要な指標であり,データのばらつきや偏りを評価するのに資する.また,四分位範囲はデータの中心部分のばらつきを示し,外れ値の影響を受けにくい特性がある.

Juliaによる実装例

# データセットの定義
data = [1, 3, 5, 7, 9, 11, 13, 15, 17, 19]

# データをソート
sort!(data)

# 四分位数を計算するためのインデックスの計算
n = length(data)
Q1_index = 0.25 * (n + 1)
Q2_index = 0.50 * (n + 1)
Q3_index = 0.75 * (n + 1)

# 補間を用いて四分位数を計算
function quantile(data, q_index)
lower = floor(Int, q_index)
upper = ceil(Int, q_index)
if lower == upper
return data[lower]
else
return data[lower] + (q_index - lower) * (data[upper] - data[lower])
end
end

Q1 = quantile(data, Q1_index)
Q2 = quantile(data, Q2_index)
Q3 = quantile(data, Q3_index)

# 四分位範囲 (IQR) の計算
IQR = Q3 - Q1

# 結果の表示
println("データセット: ", data)
println("第一四分位数 (Q1): ", Q1)
println("中央値 (Q2): ", Q2)
println("第三四分位数 (Q3): ", Q3)
println("四分位範囲 (IQR): ", IQR)

アウトプットは次のようになる.

データセット: [1, 3, 5, 7, 9, 11, 13, 15, 17, 19]
第一四分位数 (Q1): 4.5
中央値 (Q2): 10.0
第三四分位数 (Q3): 15.5
四分位範囲 (IQR): 11.0

Mathematics is the language with which God has written the universe.





















情報エントロピー 特性値 特性関数 畳み込み演算 再生性 分布族