2005年12月7日
A级Case西部保留大学物理统计研究队最近创建创新统计技术,提高大数据集检测信号的机率新技术不仅可以搜索粒子物理中的“Hashstack中的需求”,还可以应用发现新银河系,监控欺诈和安全风险交易,识别数以百万计人中的毒理病载体或用乳房X线图检测癌症组织
案例教程成员Ramani Pilla和Catherine加载器来自统计和Cyrus Taylor从物理上报告他们的发现
信息堆积越大 针头越小 搜索信号越难使用传统方法需要复杂新统计方法, 研究者报告
研究大量数据者遇到从数据随机变异判断真信号的根本问题在许多实际问题中,疑似信号可能只是噪声实验背景小片
案例组发现技术基础是比较一组汇总特征和背景变异从这些特征中,人们试图发现小区域与后台差异大相径庭,而后台差异不能完全归结为随机机率
高能粒子物理问题之方法 历来都寻找从后台模型偏差即所有非干草堆都表示 皮拉项目头目方法高效整合信息 类型期望, 从而使我们能够 更精确地发现信号兴趣
核心突破思想提出问题 假设测试范式 检测数据统计失序方法进一步利用长期几何公式后的灵活性创建技术,大大增强识别信号能力
研究者表示挑战有双重性:定义高效测试统计和判定关键截取即帮助科学家查找随机变异检测问题需要大量比较,研究者提醒不要通过随机变换蒙骗实验家虚发现
实验者想控制实验误差率: 如果数据中什么都没有, 则必须最小概率错误发现信号并想尽最大可能发现大规模数据集中可能存在的任何真实信号 上载者说
Pilla解释道:“概率问题与此假想归结为在高维域表层发现某些区域之事之事。”
案例研究者随后利用Harold Holyling和HermannWeyl1939年率先开发的几何方法测试统计技术时使用计算机模拟粒子物理实验仿真相撞实验以证明新技术大大提高检测概率
高能粒子物理和天体物理问题中,奇平方适配测试被广泛使用,尽管它们检测信号的功率相对较低,Taylor注意到通过我与Pilla和加载器教授的合作工作,我们将能开发强大的统计测试检测信号高概率高的噪声数据,在许多科学学科中遇到基本问题
Taylor补充道,“粒子相撞器实验可能耗资数千万美元提高实验结果分析效率可节省巨资或有效发现比后台模型小得多的偏差
检测随机混乱数据中真实信号(针头)将实现科学成功
http://www.case.edu/