因为它宣布了一项打击未偿债务去年6月,福利署已发送债务恢复信件成千上万的澳大利亚福利接受者。早期的报告显示20%的人在错误,尽管真正的数字可能更高的.
这导致了上周的任命参议院委员会调查为什么那么多被错误的字母。
虽然已经有一些争议政府对大数据的依赖为了节省纳税人的钱,没有一个评论已经接近理解的复杂性隐藏在的概念出错率.
福利署使用的系统是人工智能的一个例子,和它所面临的问题是固有的所有决策系统。
处理错误
数学家,计算机科学家和工程师长期以来应对这些问题和发展量化误差的方法,以及确定一点,平衡它们的相对重要性。
相同的数学是用来描述雷达系统、疾病筛查项目,以及语音识别系统等Siri和谷歌云演讲.
但这是一个错误本身谈论一个这样的系统的出错率。假定只有一个方法,使一个错误,或所有的不同类型的错误也同样糟糕,几乎从来不是这样。
例如,至少有两个方面的福利署系统可以犯错误的发送给债务人。它可以发送一封信给某人没有债务也可以忽略发送一封信给人有债务。
前错误是假阳性,速率系统避免了这种类型的错误称为灵敏度。后者是假阴性错误,和相关的利率称为特异性。
有多少雷达光点并不是真正的飞机吗?Flickr / NATS新闻办公室, CC通过数控
雷达系统,它使用无线电波探测飞机,就是这一概念首次正式多个来源的错误。重要的是不要错过飞机的检测(假阴性),但避免错误的检测是同样重要的。
不得不经常处理不正确的报道是运营商疲劳,可能会导致他们折扣有效检测——就像现代版的那个男孩哭了狼.
检查错误
多个错误机制的重要性的另一个例子是在乳腺癌筛查项目。
虽然好赶上癌症早期,同样重要的是,要正确清楚没有乳腺癌的妇女由于压力造成的心理伤害一个不正确的诊断。
这些系统使用的一种机器学习分类。一个分类系统使用所有可用的数据决定到这类特殊情况下下降。我们已经看到,两舱问题(福利署信或不信):有两种方法可以使一个错误。
但更糟糕的是:三级问题(癌症之间决定测试清楚,良性和恶性),这个数字上升到6。决定一个系统使越多,更多的方法可以失败。
没有人是完美的
是不可能让一个完美的系统。数据输入错误,自然变异和人为错误都发挥自己的作用在债务和债务之间的界限变得模糊,恶性或良性,检测或假警报。
以下序列显示了一个数学家方法福利署的决策过程使用一个简化的模型系统,我们交叉引用某人的收入声明反对他们的实际收入。下列顺序使用模拟数据,假设只有债务人实际收入比他们宣布收入高。
上一篇:地球科学诚信必须捍卫,取决于它
下一篇:宇宙的大图片揭示了星系的家谱
责任编辑:admin