卡方分布是一种连续概率分布,常被用于统计学中进行假设检验。它描述了在独立抽样中,每个样本的平方偏差之和的分布。卡方分布的形状由其自由度 (df) 参数决定。自由度越大,分布越平缓。
卡方分布用两个参数来定义:df(自由度,表示卡方分布的形状,必须为正整数)和Size(输出数组的形状)。
卡方分布的概率密度函数 (PDF) 为:
f(x) = (x^(df/2 - 1) * np.exp(-x/2)) / (2^(df/2) * Gamma(df/2)) for x >= 0
NumPy 提供了
random.chisquare()
函数来生成服从卡方分布的随机数,接受参数df和size。
Seaborn 库提供了便捷的函数来可视化分布,包括卡方分布。
瑞利分布是一种连续概率分布,常用于描述信号处理和雷达系统中的幅度分布。它表示在一个随机变量的平方根服从指数分布时,该随机变量的分布。
瑞利分布用一个参数来定义:scale(尺度参数,控制分布的平坦程度。较大的尺度参数使分布更加平坦,两侧尾部更加分散。默认为 1)。
瑞利分布的概率密度函数 (PDF) 为:
f(x) = (x scale) / (scale^2 np.exp(-x^2 / (2 scale^2))) for x >= 0
Zipf分布,又称为Zeta分布,是一种离散概率分布,常用于描述自然语言、人口统计学、城市规模等领域中具有幂律特征的数据分布。它体现了“少数服从多数”的现象,即排名越靠前的元素出现的频率越高。
Zipf分布用一个参数来定义:a(分布参数,控制分布的形状。a越小,分布越偏向于少数元素,越接近幂律分布。默认为 2)。
Zipf分布的概率质量函数 (PMF) 为:
P(k) = 1 / (k ^ a) for k >= 1
NumPy提供了
random.zipf()
函数来生成服从Zipf分布的随机数,接受参数a和size。
Seaborn库提供了便捷的函数来可视化分布,包括Zipf分布。
为了方便其他设备和平台的小伙伴观看往期文章,微信公众号搜索:
Let us Coding
,关注后即可获取最新文章推送。
看完如果觉得有帮助,欢迎点赞、收藏、关注。