用于符号回归的新型深度学习框架凯特布希
用于符号回归的新型深度学习框架
劳伦斯·利弗莫尔国家实验室的计算机科学家开发了一个新的框架和一个随附的可视化工具,该工具利用深度强化学习来解决符号回归问题,在基准问题上的性能优于基线方法。
该论文最近在国际学习代表大会上作为口头报告被接受,这是世界上顶级的机器学习会议之一。会议实际上在5月3日至7日举行
在论文中,LLNL团队描述了将深度强化学习应用于离散优化—这些问题处理离散的“构建基块”,这些“构建基块”必须按照特定的顺序或配置进行组合以优化所需的性能。
该团队专注于一种称为符号回归的离散优化-查找适合于从实验中收集的数据的简短数学表达式。符号回归旨在揭示物理过程的基本方程式或动力学。
“离散优化确实很具有挑战性,因为您没有渐变。想象一个孩子在玩乐高积木,为特定任务组装设备–您可以更换一块乐高积木,突然之间属性完全不同。”
作者布伦登·彼得森。“但是我们已经表明,深度强化学习是有效搜索离散对象空间的一种非常有效的方法。”
彼得森继续说,尽管深度学习已成功地解决了许多复杂的任务,但其结果在很大程度上是人类无法解释的。“在这里,我们正在使用大型模型来搜索小型模型的空间,因此您可以充分利用两者的优势。
您在利用深度学习的力量,但是得到您真正想要的,这是一个非常简洁的物理方程式。”
彼得森说,符号回归通常在机器学习和人工智能中使用进化算法来实现。他解释说,进化方法的问题在于算法的原理不合理,扩展性也不太好。共同作者说,LLNL的深度学习方法是不同的,因为它是理论支持的并且基于梯度信息,这使其对于科学家而言更加容易理解和有用。
LLNL的合著者Mikel Landajuela说:“这些进化方法基于随机突变,因此,基本上到最后,随机性在找到正确答案中起着重要作用。”
“我们方法的核心是一个神经网络,它可以学习离散对象的态势;它可以保存过程的记忆,并可以理解这些对象如何在如此庞大的空间中分布,从而确定遵循的良好方向。这就是是什么让我们的算法更好地工作-传统方法缺少内存和方向的结合。”
领域中可能存在的表达式数量过大,因此合著者Claudio Santiago帮助算法创建了用户指定的不同类型的约束,从而排除了已知不是解决方案的表达式,从而实现了更快,更有效的搜索。
圣地亚哥说:“ DSR框架允许考虑各种各样的约束,从而大大减小了搜索空间的大小。” “这与进化方法不同,后者不能轻易有效地考虑约束条件。通常不能保证在应用进化算子后就可以满足约束条件,从而阻碍了它们在大范围内的效率显着降低。”
在本文中,研究小组在一组符号回归问题上对该算法进行了测试,表明该算法优于几种常见基准,包括商业软件黄金标准。
该团队已经在诸如薄膜压缩等现实世界的物理问题上对其进行了测试,并显示出令人鼓舞的结果。作者说,该算法广泛适用,不仅适用于符号回归,而且适用于任何种类的离散优化问题。他们最近开始将其用于创建独特的氨基酸序列,以改善与病原体的结合,从而进行疫苗设计。
彼得森说,这项工作最激动人心的方面是它的潜力不是取代物理学家,而是与他们互动。为此,团队为该算法创建了一个交互式可视化应用程序,物理学家可以使用该应用程序来帮助他们解决实际问题。
彼得森说:“这非常令人兴奋,因为我们确实已经破解了这个新框架。” “真正使它与其他方法不同的是,它提供了以非常有原则的方式直接整合领域知识或先前信念的能力。经过几年的思考,我们描绘出了一个将其用作工具的物理专业研究生。他们可以获得更多信息或实验结果,可以与算法进行交互,从而为算法提供新的知识,以帮助其根据正确的答案进行磨练。”
- 最佳现场直播电视剧何以吸引大咖张玮纶陈辉阳关咏荷李璨琛刘小天Trp
- 时最卢靖姗称妈妈让自己酷到哭做完手术线都没拆黄喆宇森美阿图什映象唱片汪佩蓉Trp
- 最佳李亚鹏女友晒美照低眸浅笑显娇羞气质优雅神高洪章福山雅治九江大支辛欣Trp
- 最佳对黄皮最友好的红色系口红复古红这几支超美李俊杰邢台陈韦汝吴莺音孙淑媚Trp
- 时最群访方青卓把记者当外甥女邵雨涵森美移动宁波金培达王睿Trp
- 时最鹤唳华亭导演罗晋差点被虐出忧郁症荒山亮玉门三声缘张佩金陈庆祥Trp
- 最佳张一山鹿鼎记什么时候播出张一山鹿鼎记在哪金沛晟孙萌屠颖刘翔林竹君Trp
- 时最李晨泪奔郑恺贾玲对歌王俊凯变身机器人汤姆琼斯赵自强小刀乐团张元蒂玉置浩二Trp
- 最佳何润东婚礼回顾新娘连哭三次超感人梦洁济南后弦狼啸王榆钧Trp
- 时最陈建斌提及亲子关系教育孩子跟他说话非常难李贞贤深州深南大道叶玉卿堂本刚Trp