博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
单峰分布(unimodal distribution)、双峰分布 (bimodal distribution)以及偏态分布(skewness distribution)
阅读量:2051 次
发布时间:2019-04-28

本文共 855 字,大约阅读时间需要 2 分钟。

单峰分布(unimodal distribution)& 双峰分布 (bimodal distribution)

数据分布会有一个或者很多个峰值(peaks),数据分布中只有一个明显峰值的叫做单峰,有两个明显峰值的叫做双峰,同样,具有多个峰值的就是多峰。

偏态分布(skewness distribution)

在数据分布的图像展现形式中,偏态分布中一边的观测值要比另一边的观测值多,右边的观测值少时,称为右偏(skewed right);左边的观测值少时,称为左偏(skewed left)。相对于正态分布,右偏的分布也称为正偏态分布,以平均数(average)、中位数(median)和众数(mode)之间的关系来描述的话,若 x ˉ > M e > M o \bar{x} > M_{e} > M_{o} xˉ>Me>Mo,也即是平均数大于中位数,中位数又大于众数时,数据分布时正偏态分布。

左偏的分布也称为负偏态分布,若 x ˉ &lt; M e &lt; M o \bar{x} &lt; M_{e} &lt; M_{o} xˉ<Me<Mo,也即是平均数小于中位数,中位数又小于众数时,数据分布时负偏态分布。

均匀分布(uniform distribution)

当一组数据中的观测值在分布范围内均匀分布时,这种分布称为均匀分布。均匀分布没有明显的峰。

正态分布(normal distribution)

当数据的分布图,既具有对称性,又具有单峰时,就是正态分布,也即是单峰对称分布就是正态分布

异常特性(Unusual Features)

数据分布中的异常特性主要是两种:缺口(gaps) & 异常(outliers)

缺口主要是指数据分布中有些区域没有观测值:

异常主要是与数据分布差别很大的极端值。在正态分布中,如果极值低于第一个四分位数(Q1)至少1.5个四分位数区间,或者高于第三个四分位数(Q3)至少1.5个四分位数区间,那么极值通常被认为是一个离群值。

Ref

转载地址:http://obklf.baihongyu.com/

你可能感兴趣的文章
linux基本命令
查看>>
BlockQueue 生产消费 不需要判断阻塞唤醒条件
查看>>
ExecutorService 线程池 newFixedThreadPool newSingleThreadExecutor newCachedThreadPool
查看>>
强引用 软引用 弱引用 虚引用
查看>>
数据类型 java转换
查看>>
"NetworkError: 400 Bad Request - http://172.16.47.117:8088/rhip/**/####t/approval?date=976
查看>>
mybatis 根据 数据库表 自动生成 实体
查看>>
win10将IE11兼容ie10
查看>>
checkbox设置字体颜色
查看>>
第一篇 HelloWorld.java重新学起
查看>>
ORACLE表空间扩张
查看>>
orcal 循环执行sql
查看>>
web.xml配置监听器,加载数据库信息配置文件ServletContextListener
查看>>
结构型模式之桥接模式(Bridge)
查看>>
行为型模式之状态模式(State)
查看>>
行为型模式之策略模式(Strategy)
查看>>
行为型模式之模板方法模式(TemplateMethod)
查看>>
行为型模式之访问者模式(Visitor)
查看>>
大小端详解
查看>>
source insight使用方法简介
查看>>