Towards transparent and robust data-driven wind turbine power curve
models
解决问题:本论文旨在解决风力涡轮机功率曲线模型的不透明性和鲁棒性问题,以提高其在非平稳环境下的可靠性。这是一个新问题,因为以往的物理模型方法已经无法满足对于高精度的预测需求。
关键思路:本论文提出了一个可解释的人工智能框架,通过结合领域专业知识、Shapley值和最新的可解释人工智能技术,对基于运行SCADA数据的数据驱动功率曲线模型进行学习和验证。该方法可以更好地评估模型的鲁棒性,比验证或测试集误差更可靠。此外,论文还发现,高度复杂的机器学习模型容易学习到物理上不合理的策略,因此提出了几种措施来确保模型行为的物理合理性。
其他亮点:本论文的实验使用了实际的SCADA数据集,并提供了开源的代码。此外,论文还提出了在风力涡轮机性能监测中利用可解释人工智能技术,以区分环境和技术因素对涡轮输出的影响。这些工作值得进一步深入研究。
关于作者:Simon Letzgus和Klaus-Robert Müller是本论文的主要作者,分别来自柏林工业大学和马克斯普朗克学会。他们之前的代表作包括《Understanding Black-box Predictions via Influence Functions》和《Interpretable Machine Learning: A Brief History, State-of-the-Art and Challenges》等。
相关研究:近期的相关研究包括《A Comprehensive Review of Explainable Artificial Intelligence (XAI): Toward Interpretability, Transparency, and Accountability》(作者:Sameer Singh等,机构:UCI)和《Physics-Informed Machine Learning for Predictive Maintenance: A Review》(作者:Jianbo Liu等,机构:加州大学伯克利分校)等。
论文摘要:本文旨在探讨透明且稳健的基于数据驱动的风力涡轮机功率曲线模型。这些模型将环境条件转化为涡轮机的功率输出,对于能量产出预测和涡轮机性能监测至关重要。近年来,数据驱动的机器学习方法已经超越了参数化、基于物理的方法。然而,它们经常被批评为不透明的“黑盒子”,这引起了人们对它们在非稳态环境下的稳健性的担忧,例如风力涡轮机面临的环境。因此,我们引入了一个可解释的人工智能(XAI)框架,从运行的SCADA数据中研究和验证由数据驱动的功率曲线模型学习的策略。它结合了领域特定的考虑因素和Shapley值以及最新的XAI回归发现。我们的结果表明,学习的策略可以更好地指示模型的稳健性,而不是验证或测试集错误。此外,我们观察到,高度复杂的、最先进的机器学习模型容易学习到物理上不合理的策略。因此,我们比较了几种措施,以确保物理上合理的模型行为。最后,我们提出在风力涡轮机性能监测的背景下利用XAI,通过分解导致涡轮机输出偏差的环境和技术效应。我们希望,我们的工作可以引导领域专家训练和选择更透明和稳健的数据驱动风力涡轮机功率曲线模型。