离群值是指数据集中的某个或某些值明显偏离其他数据值,常常是由于数据记录错误或测量偏差导致的。
例如,一组体温数据中,某个人的体温为40℃,而其他人的体温都在36℃-37℃之间,这个40℃的数据就是离群值。
异常值是指数据集中的某个或某些值与其他数据值相差较大,但并不是数据记录错误或测量偏差导致的,可能是真实存在的极端情况。
例如,在某个城市的房价数据中,出现了一些特别高或特别低的房价,这些数据就是异常值。
由于离群值和异常值具有很大的差异性和不确定性,因此在数据分析过程中需要特别关注和处理这些值,避免对结果产生系统误差和偏差。