定義:
四分位数には以下の3つの主要な値がある.
四分位数を用いて四分位範囲[IQR;Interquartile Range]も次のように定義される.\[IQR = Q_3 - Q_1\]
四分位数は,データの分布を理解するための重要な指標であり,データのばらつきや偏りを評価するのに資する.また,四分位範囲はデータの中心部分のばらつきを示し,外れ値の影響を受けにくい特性がある.
# データセットの定義
data = [1, 3, 5, 7, 9, 11, 13, 15, 17, 19]
# データをソート
sort!(data)
# 四分位数を計算するためのインデックスの計算
n = length(data)
Q1_index = 0.25 * (n + 1)
Q2_index = 0.50 * (n + 1)
Q3_index = 0.75 * (n + 1)
# 補間を用いて四分位数を計算
function quantile(data, q_index)
lower = floor(Int, q_index)
upper = ceil(Int, q_index)
if lower == upper
return data[lower]
else
return data[lower] + (q_index - lower) * (data[upper] - data[lower])
end
end
Q1 = quantile(data, Q1_index)
Q2 = quantile(data, Q2_index)
Q3 = quantile(data, Q3_index)
# 四分位範囲 (IQR) の計算
IQR = Q3 - Q1
# 結果の表示
println("データセット: ", data)
println("第一四分位数 (Q1): ", Q1)
println("中央値 (Q2): ", Q2)
println("第三四分位数 (Q3): ", Q3)
println("四分位範囲 (IQR): ", IQR)
アウトプットは次のようになる.
データセット: [1, 3, 5, 7, 9, 11, 13, 15, 17, 19]
第一四分位数 (Q1): 4.5
中央値 (Q2): 10.0
第三四分位数 (Q3): 15.5
四分位範囲 (IQR): 11.0