看啥推荐读物

专栏名称: 快乐自由拉菲犬

The Road Less Traveled.

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

知乎回答RSS订阅方法

知乎专栏 RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

题目：1-10

快乐自由拉菲犬 · 简书 · · 2019-04-29 13:29

1.方差的含义？

百度百科上方差是这样定义的：
（variance)是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量。概率论中方差用来度量随机变量和其数学期望（即均值）之间的偏离程度。统计中的方差（样本方差）是各个数据分别与其平均数之差的平方的和的平均数。在许多实际问题中，研究方差即偏离程度有着重要意义。

2.标准差的含义？

那么问题来了，既然有了方差来描述变量与均值的偏离程度，那又搞出来个标准差干什么呢？
发现没有，方差与我们要处理的数据的量纲是不一致的，虽然能很好的描述数据与均值的偏离程度，但是处理结果是不符合我们的直观思维的。
举个例子：一个班级里有60个学生，平均成绩是70分，标准差是9，方差是81，成绩服从正态分布，那么我们通过方差不能直观的确定班级学生与均值到底偏离了多少分，通过标准差我们就很直观的得到学生成绩分布在[61,79]范围的概率为0.6826，即约等于下图中的34.2%*2

3.均方差的含义？

标准差： Standard Deviation
标准差在中文环境中常备叫做均方差。
均方差即标准差。

4.均方误差MSE？

均方误差(mean squared error）与均方差不同。

均方误差是各数据偏离真实值的距离平方和的平均数，也即误差平方和的平均数。

总的来说，均方差是数据序列与均值的关系，而均方误差是数据序列与真实值之间的关系，所以我们只需要搞清楚真实值和均值之间的关系就行了。

5.智力题A

现在有一大一小两个桶.小桶能盛水四升.大桶能盛水十一升.怎样使两个水桶盛出5升水.写出操作过程.

答:
用小桶连续3次装满水倒进大桶,把大桶装满为止,这时小桶还剩1升,把大桶水倒掉,把小桶里的1升水倒进大桶,小桶再装满水,这时两个桶里的水加起来就正好是5升。

6.智力题B

一只大桶中盛着14升水,另有两只空桶,一只能装5升,一只能装9升,用这三只桶倒来倒去,能把14升水平均分成两份吗?如果能,至少需要倒几次?（试着列表分析）

答:
这些问题往往靠两个容器间的差量来分析现将14升注入5升,将5升全部倒入9升容器中,再从剩余9升的容器里再倒入5升,5升水将9升容器里的水加满,剩1升,9升容器里的水全倒入大桶里,5升容器里剩余1升水倒入9升容器里.接下来从头再来将14升注入5升,将5升全部倒入9升容器中,再从剩余8升的大桶里倒入5升里,5升将9升的水加满,5升容器里还剩2升,9升容器里的水全倒入大桶里,5升容器里剩余的2升水倒入9升容器里最后将大桶里的12升水将5升容器注满,5升容器里的水全倒入9升容器里,就将水分成了7 7 两份

7.分布函数是什么？

分布函数（英文Cumulative Distribution Function, 简称CDF），是概率统计中重要的函数，正是通过它，可用数学分析的方法来研究随机变量。分布函数是随机变量最重要的概率特征，分布函数可以完整地描述随机变量的统计规律，并且决定随机变量的一切其他概率特征。

8.数据分布有哪些？选择熟悉的数据分布并写出其适用的场景。

首先想到特别相关的是三个：伯努利、二项分布、0-1分布

（1）伯努利分布

伯努利分布亦称“零一分布”、“两点分布”。称随机变量X有伯努利分布, 参数为p(0<p<1),如果它分别以概率p和1-p取1和0为值。EX= p,DX=p(1-p)。伯努利试验成功的次数服从伯努利分布,参数p是试验成功的概率。伯努利分布是一个离散型机率分布，是N=1时二项分布的特殊情况，为纪念瑞士科学家詹姆斯·伯努利(Jacob Bernoulli 或James Bernoulli)而命名。

(2) 二项分布

二项分布就是重复n次独立的伯努利试验。在每次试验中只有两种可能的结果，而且两种结果发生与否互相对立，并且相互独立，与其它各次试验结果无关，事件发生与否的概率在每一次独立试验中都保持不变，则这一系列试验总称为n重伯努利实验，当试验次数为1时，二项分布服从0-1分布。

1. 二项分布的概念:
如某实验中小白鼠染毒后死亡概率P为0.8,则生存概率为=1-P=0.2，故
对一只小白鼠进行实验的结果为：死（概率为P）或生（概率为1-P）
对二只小白鼠（甲乙）进行实验的结果为：甲乙均死（概率为P2）、甲死乙生[概率为P(1-P)]、乙死甲生[概率为(1-P）P]或甲乙均生[概率为(1-P）2]，概率相加得P2+P(1-P)+(1-P）P+(1-P）2=[P+(1-P)]2
依此类推，对n只小白鼠进行实验，所有可能结果的概率相加得Pn+cn1P(1-P)n-1+...+cnxPx(1-P)n-x+...+(1-P)x=[P+(1-P)]n 其中n为样本含量,即事件发生总数，x为某事件出现次数,cnxPx(1-P)n-x为二项式通式，cnx=n!/x!(n-x)!, P为总体率。
因此，二项分布是说明结果只有两种情况的n次实验中发生某种结果为x次的概率分布。其概率密度为：
P(x)=cnxPx(1-P)n-x, x=0,1,...n。
2. 二项分布的应用条件:
医学领域有许多二分类记数资料都符合二项分布(传染病和遗传病除外)，但应用时仍应注意考察是否满足以下应用条件：(1) 每次实验只有两类对立的结果；(2) n次事件相互独立；(3) 每次实验某类结果的发生的概率是一个常数。
3. 二项分布的累计概率
二项分布下最多发生k例阳性的概率为发生0例阳性、1例阳性、...、直至k例阳性的概率之和。至少发生k例阳性的概率为发生k例阳性、k+1例阳性、...、直至n例阳性的概率之和。
4. 二项分布的图形
二项分布的图形有如下特征：(1)二项分布图形的形状取决于P 和n 的大小；(2) 当P=0.5时，无论n的大小，均为对称分布；(3) 当P<>0.5 ,n较小时为偏态分布,n较大时逼近正态分布。
5. 二项分布的均数和标准差
二项分布的均数µ=np，当用率表示时µ=p
二项分布的标准差为np(1-p)的算术平方根，当用率表示时为p(1-p)的算术平方根。

二、二项分布的应用
二项分布主要用于符合二项分布分类资料的率的区间估计和假设检验。当P=0.5或n较大，nP及n(1-P)均大于等于5时，可用(p-u0.05sp,p+u0.05sp)对总体率进行95%的区间估计。当总体率P接近0.5，阳性数x较小时，可直接计算二项分布的累计概率进行单侧的假设检验。当P=0.5或n较大，nP及n(1-P)均大于等于5时，可用正态近似法进行样本率与总体率，两个样本率比较的u检验。