均值与方差的测量

描述

    我们的感知就是测量。人通过视觉、听觉、嗅觉、味觉乃至直觉感知这个世界的酸甜苦辣和世间冷暖。

    测量是一种量化的感知,也经常引申到度量,乃至测度。测量所用的方法、获得数据的数量乃至分析方法构成现代工业产品系统中感知、决策、执行三大行为中的一环。比如自动驾驶系统中车辆的行驶行为与常规车辆区别不大,但是基于毫米波雷达、光学摄像头乃至激光雷达等对于周围环境的测量及判别是ADAS系统中最困难的一环。

    从高中物理试验开始,到大学的各种科研进行的试验,有一个经常使用的隐含规则:每组数据测量三次。小编突然发现好像似乎莫非这里面有一个挺有意思的问题,隐隐约约有一种科学发现的赶脚和三顿没吃遇到猪脚饭的冲动。

    为了简化问题,首先把测量分为:待测对象和测量系统(当然我先找出了高中的概率论,毕竟算错的话得有个责任方)。方便讨论就分别假设为电热水器和温度计。

    由于电热水器和温度计由独立厂家生产,再假设为质量稳定的产品。那么什么叫质量稳定产品呢?就是对于一个预设温度(称为真值TT),比如100摄氏度,电热水器完成加热后实际的温度值为以真值为均值μ=TT,σ为方差的高斯分布。

    简单理解为如果热水器做足够多次同样预设温度的加热,则所有加热的均值为预设真值。

    同样对于热水器单次加热结果的的温度测量,如果温度计做足够多次测量,则测量均值为当时的加热真值Tr,当然此真值并非为预设真值TT。

    Tr(热水器)服从

    类似 Tw(温度计)服从

    整理一下。实际上有两个温度值:热水器加热的温度值,温度计测量的温度值。这两个温度值在热水器不同次的加热中,和同一次加热的不同次测量中都各不相同。

    为方便理解再次简化:

    Tr(热水器)只有三个离散值(Tr1=TT-σ1,Tr2=TT,Tr3=TT+σ1),

    Tw(温度计)也只有三个离散值(Tw1=Tr-σ2,Tw2=Tr,Tw=Tr+σ2),

    同时再次简化假设,Tr与Tw三个离散值出现的概率都为(20%,60%,20%)

    现在的问题是对于预设温度TT=100℃,如果进行三次试验,每次使用温度计测量三次,我们获得的温度值等于预设值TT的概率是多少?

    首先考虑Tw测量获得Tr的概率,问题简化为对于下述样本的独立抽样:

    Tw1, Tw2,Tw2,Tw2,Tw3

    A:三次均为Tw2的概率,0.6*0.6*0.6=0.216

    B:一次Tw1,一次Tw2,一次Tw3,0.2*0.6*0.2=0.24

    C:总概率=0.456

    这里面有个反直觉的情况,就是如果测量次数增加,A情况的概率是减少的,怎么理解?其实很容易理解,测量误差取决于方差。所以实际上随着测量次数增加B(以及其他更多的概率组合)情况概率增加,A情况概率减少,获得真值的概率最终接近于0.6。

    同理如果热水器只开启三次(做三次加热),则加热数值为预设真值的概率也为0.456。

    所以实际上结论有点出乎意料对于如此简易的系统来说,进行3次试验,总共9次测量,则测量均值为真实预设值TT的概率为0.456*0.456=0.2079,大概21%。

    如果试验次数继续增加到一个较多的次数比如50次,单次试验测量次数也增加到较多的次数比如20次,那么测量获得真实温度预设值TT的概率最终趋近于36%。

    这个结论是高度反直觉的。

    那么应该怎么去理解这个问题?其实结论非常简单,高品质系统需要控制的是方差的大小,就是质量体系中的西格玛概念。将单个方差(西格玛)控制到足够小,那么即便获得真值的概率永远只和分布与测量次数有关,但是总体和真值的误差是非常小的。

    概率计算给我们的建议:你以为你测量的是均值,实际上你测量的是方差。

    世界真奇妙,一测吓一跳。





审核编辑:刘清

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分