将对变异的理解应用于大型数据集

理解变异作者: 托马斯 · 诺兰、罗科 · 佩拉和劳埃德 · 普罗沃斯特。自…… 发表以来,数据的使用发生了巨大的变化理解变异,托马斯 · 诺兰和劳埃德 · 普罗沃斯特著。这篇新文章讨论了如何使用对变异的理解使用大型数据集 (例如,政府数据) 时。

从当前文章:

休哈特的方法是经验性的,旨在将对数据反应过度和反应不足的风险降至最低。“一个可分配的 [特殊] 变异原因,正如这个术语在质量控制工作中使用的那样,是一个可以通过实验找到的原因,而不需要花费超过找到它的价值。”
换句话说,如果发现问题的成本高于解决问题的价值,那是不经济的。
在大多数应用中,对于超出休哈特三西格玛限制的点,寻找一个特定的原因或设计一个测试来理解它将是划算的。

这是最基本的观点之一,通常没有尽可能清楚地理解。一个特殊原因的指示是一个信号,即最有用的改进策略是寻找一个可分配的原因并解决那个特定的问题。控制图旨在帮助您确定那些特殊原因,以便使用基于寻找可分配原因的改进策略 -- 找到该结果的特殊之处。

当结果不令人满意,但没有可分配原因的迹象存在时,这并不意味着我们无事可做。这意味着我们必须集中精力改进系统,以提高系统的所有结果。寻找可分配的原因并为控制范围内的个人结果修复它们只是一个糟糕的策略。更好的策略这种情况 (没有可分配原因的迹象) 是使用解决系统性修复的工具和思维

大多数时候,我们应该关注整个系统,并想出如何改进它。不幸的是,我们经常发现自己专注于一个不好的结果,并试图将其归咎于某些特定的事情 (或人),并寻求以这种方式改进。这不是一个非常有效的改进方法。

本文讨论的另一个重要想法是使用对数据进行分层以帮助理解数据。例如,从低、中和高家庭收入来看高中辍学率。

随时间推移按家庭收入分列的辍学率图表

数据分层当不同组的数据有显著差异时是有帮助的。你可以把这些看作是不同过程的结果 -- 不同的解决方案可能是有用的。例如,来自低收入家庭的学生可能受益于某些对来自高收入家庭的学生没有影响的改善。数据分层帮助您更好地理解您的系统,并更好地衡量变化的结果。在没有对数据进行分层的情况下,非常重要的改进可能会丢失,因为当查看所有数据时,改进的信号不够强。但是如果你对数据进行分层,那么你可以清楚地看到变化(例如针对低收入家庭学生的系统) 是成功的。

相关:深奥知识的戴明系统在 “大数据” 世界中应该扮演什么角色?Yobet娱乐-我们需要了解变化来有效地管理-特殊原因信号不能证明特殊原因存在-如何为季节性或趋势数据创建控制图-吴杰夫博士关于从汽车到纳米技术的质量改进的戴明讲座

你可能也喜欢.

留下回复

您的电子邮件地址将不会公布。必填字段已标记*

该网站使用 Akismet 来减少垃圾邮件。了解如何处理您的评论数据