很多文章的报道都是由微观而宏观,今日小编讲给大家带来的关于一种新的AI类型评估方法可以预测是答案的正确与否 的资讯也不例外,希翼可以在一定的程度上开阔你们的视野!y有对一种新的AI类型评估方法可以预测是答案的正确与否 这篇文章感兴趣的小伙伴可以一起来看看
随着AI在社会中的作用不断扩大,医学院研究生院的JB Brown报告了一种新的AI类型评估方法,该方法可以预测是/肯定/正确或否定/否定/错误答案。
布朗发表在《分子信息学》上的论文解构了人工智能的应用,并分析了用于报告人工智能程序能力的统计数据的性质。新技术还会在给定评估数据的情况下生成性能水平的概率,回答以下问题:达到90%以上的精度的概率是多少?
关于AI新应用的报道几乎每天都浮现在新闻中,包括社会和科学,金融,制药,医学和安全领域。
“虽然报告的统计数据看起来令人印象深刻,但研究团队和评估结果的团队遇到两个问题,”布朗解释道。“首先,要了解AI是否偶然获得了其结果,其次,要从报告的性能统计数据中解释适用性。”
例如,如果建立了一个AI程序来预测某人是否会中奖,那么它可能总是会预测损失。该程序可以达到“ 99%的准确性”,但是解释是确定该程序准确的结论的准确性的关键。
但是这里存在一个问题:在典型的AI开辟中,惟独在肯定和否定结果相等的情况下,才干信任评估。如果数据偏向任一值,则当前的评估系统将夸大系统的能力。
因此,为解决此问题,Brown开辟了一种仅根据输入数据本身评估性能的新技术。
“这种技术的新颖之处在于它不依赖于任何一种AI技术,例如深度学习。” Brown说道。“它可以通过查看度量与预测数据中的余额之间的相互作用来帮助开辟新的评估度量。然后,我们可以推断结果度量是否有偏差。”
布朗希翼这种分析不仅可以提高人们对我们未来对AI的看法,而且可以为开辟更强大的AI平台做出贡献。
除了准确性度量标准外,Brown还在理论和应用场景中测试了其他六个度量标准,发现没有任何一个度量标准普遍具有优越性。他说,构建实用的AI平台的关键是从多角度评估。
“人工智能可以帮助我们理解世界上的许多现象,但是要正确地为我们提供方向,我们必须知道如何提出正确的问题。我们必须小心,不要过分关注单个数字来衡量人工智能的程度。可靠性。”
布朗的程序免费提供给公众,研究人员和开辟人员。