统计学关我什么事

最新书摘:
  • 博学慎思ing
    2020-02-24
    1. 决定经济社会状态的,最终将会是“人类对于未知的将来的思考方式”,而如果用数理方法来解析“人类推理”的话,只能依靠决策理论来完成。
  • 博学慎思ing
    2020-02-24
    1. 这意味着,根据误差/偏差相对较小的温度计得出的结果,对于先验分布的推算影响较大,想来这也是自然的。
  • 博学慎思ing
    2020-02-24
    1. 正态分布有着十分便利的数学操作性,这一点在后面将会涉及。第二,正态分布是一种在自然界和社会中频繁出现的概率分布。2. 人们发现,在很多场合都能够观察到这样的正态分布。例如,通过观察包括人类在内的各种各样的生物种群,可以发现了同一种群的体长遵循正态分布的规律。此外,在体内的构成物(血液等)的分布,也呈正态分布趋势;在收到电波时出现的噪音中, 也观察到了正态分布的现象。3. 我们可以想象为,标准偏差表示的是“从观察值的平均值中,误差/偏差的程度”的指标。4. 只要赋予平均值和标准偏差,就能确定一个正态分布。5.即使将正态分布进行平均化,结果也依然是正态分布。
  • 博学慎思ing
    2020-02-24
    1. 在贝叶斯推理中存在一个惯例:把想需要推理的概率模型的共轭先验分布作为先验分布来运用。
  • 博学慎思ing
    2020-02-24
    1. “如果每天都对期待值进行统计,那么长期来看,结果与实际情况是基本保持一致的”。这意味着“从长期的角度来看”,期待值的合计结果与实际情况一致“。以上就是针对”期待值”含义的最直观的说明。
  • 博学慎思ing
    2020-02-24
    1. 从“结果”来推测“原因”, 听起来是一个奇妙的过程。而这个过程之所以能够实现,关键就在于条件概率的定义。
  • 博学慎思ing
    2020-02-24
    1. 从第14讲开始,直到第18讲,我将针对概率符号和连续型概率分布进行讲解;从第19讲到第21讲,则步入贝叶斯推理的精髓——贝塔分布和正态分布。2. 概率是指,用一个“大于0且小于1的数值”来对应“发生的事情”的数学概念。3. 所谓“基本事件”,也就是指为了记述需要计算的概率现象的,且不能再往下分解的最基本事件。4. 而非基本事件的概率的定义则是:构成该事件的基本事件的概率之和。5. 概率模型由基本事件、事件、概率构成。
  • 博学慎思ing
    2020-02-24
    1. 贝叶斯推理之所以显得有些“牵强”,主要是因为其中的先验概率。所谓先验概率,是指“在没有任何信息的情况下,暂且把所有可能性的概率设定为对等的(理由不充分原理)”,或者“从主观上进行设定”等,因而会令人感到“牵强”。2. 但反过来说,这是由于设定了这样的先验概率,贝叶适推理从而具备了“即使只有少量信息(数据),也能够进行推理”的优点。这一点也正是贝叶斯推理优于标准统计推理(内曼—皮尔逊式推理)的地方。3. 贝叶斯推理还具有“将已经在推理过程中使用过的信息反映到后验概率之后,即使把它丢掉也没关系”的良好特性,这一特点被称为贝叶斯推理的学习功能。4. 贝叶斯推理还具备另外一个学习技能,也就是“信息越多,推理结果就越精确”的性质。5. 在贝叶斯推理中,只要信息足够多,就能得出正确的结论。
  • 博学慎思ing
    2020-02-24
    1. 这也可以说是一种“学习功能”,贝叶斯推理中,修改过的“各个类别的后验概率”,已经使用了所有信息。也就是说我们可以将其看作“从信息中学习到的结果”。贝叶斯推理正是具备了“收集信息并自动变聪明”的功能。2.据此,我们能够得出“从某种意义上来讲,贝叶斯推理是一种具备人类特性的推理方式”的结论。
  • 博学慎思ing
    2020-02-24
    1. 事实上,贝叶斯推理的实际应用中,最广为 人知的正式这种垃圾邮件过滤器。而目前,垃圾邮件过滤器已经被引进更为广泛的网络邮件服务当中。读者们在使用该服务之后,都会为它在分类判断方面的准确性而惊叹不已,而这一切都要归功于贝叶斯推理。
  • 博学慎思ing
    2020-02-24
    1. 这两个问题的关键点都在于:由于获得了一定信息而导致概率发生变化。之前,我们也一直将“概率因获得信息而发生变化”的各种案例作为贝叶斯推理的精华来进行解说,先验概率和后验概率就是其体现。2.说到底,概率性推论依存于“主观”因素——对概率现象结构的想象,因此结论会根据模型的构建方式而不同。因此可以说,概率性推论并不存在“正确的答案”,至多是“妥当的推论罢了”。3.关于“幸运”的两条法则:第一种是“幸运定量法则”,第二种是“幸运唤起幸运”法则。
  • 博学慎思ing
    2020-02-24
    1. 尤其明显的一点是,贝叶斯统计学中需要设定先验概率,而内曼—皮尔逊统计学中则完全不涉及这一概念。2. “极大似然原理”的含义就是:世界上正在发生的事件之所以发生,是因为它发生的概率大。3.事实上,极大似然原理并不是运用于推理本身,而是运用于“为统计推理添加依据”的过程当中。4. 普通统计学与贝叶斯统计学的共同思想,便是极大似然原理。
  • 博学慎思ing
    2020-02-24
    1. 贝叶斯推理并没有像内曼—皮尔逊统计学的假设检验那样,有关于显著水平的设定。贝叶斯推理的强项是”无论在何种条件下,都能得出一个暂时的结果“。但是,这个结果并不像内曼—皮尔逊统计学那样,得出一个单方面的判断(非A即B),而是认为两种可能性都有,并赋予这两种可能性相应的比例关系,仅此而已。2.在贝叶斯推理和内曼—皮尔逊式推理中,各自”风险“的含义是完全不同的。3. 在内曼—皮尔逊式推理中,显著水平是其风险的指标。其含义是:例如,将显著水平设定为5%,那么如果用同一种方法,反复使用假设检验的话,有5%的概率会得出错的结论。4. 假设检验的风险存在于结论之外,而贝叶斯推理的风险则存在于结论的后验概率本身之中。5.贝叶斯推理之所以能在不考虑显著水平的情况下做出判定,是因为设定了先验概率这一“奇怪的”概念。6.“因此,在这种先验概率的基础上被推断出来的后验概率,通常有其任意性,而责任则归于在统计学者的判断。这也是为什么贝叶斯推理被称为”总经理的概率“的原因所在。
  • 博学慎思ing
    2020-02-24
    1. 显著水平,通常用来表示“极少被观察到的现象”的概率。当然,可以把它设定其为一个很小的数值,通常会设定为5%(0.05)或1%(0.01)。
  • 博学慎思ing
    2020-02-24
    1. 首先,特别要做的一件事是,将贝叶斯推理与标准的统计推理(称为“内曼—皮尔逊统计学”)之间的区别予以明确。2. 一般的统计学教科书中,对于内曼—皮尔逊统计学都会进行解释说明。“假说检验”“区间估计”等,都是极具代表性的方法论。3. ”推论“是指对于尚不明确的事件,通过掌握的某些证据进行推理、并且查明其事实的行为。每个领域都有该领域固有的科学推论方法。
  • 博学慎思ing
    2020-02-24
    1. 将”概率的概率“设置为”先验概率“
  • 博学慎思ing
    2020-02-24
    1.贝叶斯推理的魅力正在于:即使没有事前的客数据,也能进行推算。也就是说,可以主观设定先验概率,进行推算。2. “女性同事认为你是她的真命天子的概率”中的“概率”,应当解释为:你内心描绘的类似“信念程度”这样的“概念”。也就是说,并非“概率是多少”的问题,而应该理解为“你认为概率是多少”。3. 设定各个类别的先验概率(由于无法获得数据,采用理由不充分原理,将先验概率设定为各种情况下的可能性各占一半)。
  • 博学慎思ing
    2020-02-24
    1. 需要了解的重点是,理解“如果从客观的数据来考虑的话,反而会容易陷入误解之中”的问题。在这里,你会发现概率的不可思议。2. 至于为何概率会如此之低,原因在于,患癌症的可能性本来就极其微小,健康人群中所占的比例远高于患癌症的人,健康人被误诊为阳性的可能性也很大,这一部分的数值不能忽视。因此,即便检查结果呈阳性,也有极大的可能性是健康人被误诊。所以,千万不要过度悲观。3.通过上图我们可以看出,罹患该种癌症的概率,在尚未进行观察的情况下为0.001(先验概率);而得知检查结果呈阳性之后,数值便发生了更新,变为约0.045(后验概率)。也就是说,概率从0.1%一下子上升到4.5%,增大了45倍。4.在观察检查结果后,先验概率更新为后验概率(贝叶斯更新)。
  • 博学慎思ing
    2020-02-24
    1.表示“某一特定类别采取各种行动的概率”,这在高等数学中被称为“条件概率”。用“原因”的概念来解释,即“在原因明确的情况下,某一类别采取各项行动的结果概率”。2.从“询问”这一行动的结果追溯到“类别”这一原因。【结果➡️原因】这一过程,就是“逆概率”这一概念中“逆”的含义。
  • 博学慎思ing
    2020-02-24
    1. 本书的目的是抛开烦琐的数学概念,将贝叶斯统计学隐藏的本质“剖析呈现出来。2. 贝叶斯统计的优势在于,“在数据少的情况下也可以进行推测,数据越多,推测的结果越准确”,以及“对所获的信息可做出瞬时反应,自动升级推测”的学习功能。3.“贝叶斯统计在某种程度上是不可靠的”。究其原因,是由于贝叶斯统计中所涉及的概率是“主观的”。