imodels：揭开模型黑盒，使复杂模型易于理解和应用

论文 | Meta contrastive label correction for financial time series

近期的机器学习进展使得预测模型变得越来越复杂，但这也导致了模型的可解释性下降。然而，在一些重要的应用领域，如医学、生物学和政治科学，我们需要能够解释模型的结果。可解释性的模型有助于我们发现错误、利用领域知识，并且能够提高推理速度。

尽管有许多新的可解释模型方法，但实际应用起来往往具有挑战性，因为我们难以找到、使用和比较这些方法。为了解决这个问题，imodels提供了一个简单的统一接口和实现，包括许多最先进的可解释建模技术，特别是基于规则的方法。imodels的目标是填补这个空白，使得使用可解释模型变得更加容易。

可解释模型是是什么？

模型的可解释性指的是我们能够理解和解释模型的决策过程和结果的程度。它涉及到我们能够解释模型如何得出特定的预测或决策，并理解模型对不同输入和特征的重要性和影响。可解释性对于许多领域和应用非常重要。在一些关键领域，如医学诊断、生物学研究和政治科学分析中，可解释性是至关重要的。如果一个模型不能提供解释或理由来支持其预测或决策，它很难在这些领域中被接受和应用。此外，可解释性还有助于发现模型中的错误、验证模型的准确性，并使领域专家能够参与到模型的开发和应用中。

可解释性模型是指在机器学习中，具有一定程度的可解释性和可理解性的模型。这些模型的设计和结构使得人们能够更容易地理解和解释模型的决策过程、预测结果以及对输入特征的影响。与可解释性模型相对应的是”黑盒”模型，如深度神经网络，它们具有复杂的结构和大量的参数，决策过程难以直观理解和解释。这种模型的预测结果往往缺乏可解释性，即使它们在准确性上表现出色。

事后可解释性是一种不同的方法，它不依赖于模型本身的结构，而是在模型训练之后使用附加的解释技术来解释模型的预测结果。这些技术可以通过特征重要性分析、可视化等方式来解释模型的决策过程。事后可解释性方法可以应用于任何模型，包括黑盒模型。与事后可解释性方法不同，可解释性模型本身就具有可解释性。这些模型的结构和参数设计使得其决策过程更加透明和可理解。可解释性模型的优点在于能够直接提供可解释的决策规则、特征权重等信息，而不需要额外的解释技术。

imodels包的功能特点

imodels是一个开源的Python包，旨在提供简单统一的接口和实现，用于许多最先进的可解释建模技术，尤其是基于规则的方法。它填补了在可解释模型方面的缺失，使得找到、使用和比较这些模型变得更加容易。imodels具有以下特点：

提供简单统一的接口：imodels包提供了一个简单统一的接口，使得使用不同的可解释模型变得更加方便。这种接口设计的目的是使用户能够快速开始使用各种可解释模型，并进行比较和评估。
多种可解释模型的实现：imodels包包含了多种可解释模型的实现，包括RuleFit、贝叶斯规则列表、FIGS、最优规则列表等等。这些模型具有不同的特点和适用范围，可以根据具体需求进行选择和使用。
不同拟合方法的考虑：imodels包提供了不同的拟合方法，以满足不同的优先考虑因素。例如，贪婪方法（如CART）注重效率，而全局优化方法注重寻找尽可能小的模型。这样的灵活性使得用户可以根据自己的需求选择适合的拟合方法。

安装使用imodels

安装

pip install imodels

使用
imodels的使用非常简单，可以以与标准scikit-learn模型相同的方式使用：只需导入分类器或回归器，并使用拟合和预测方法即可。

from imodels import BoostedRulesClassifier, BayesianRuleListClassifier, GreedyRuleListClassifier, SkopeRulesClassifier # etc
from imodels import SLIMRegressor, RuleFitRegressor

# 初始化一个模型
model = BoostedRulesClassifier()

# 对模型进行拟合
model.fit(X_train, y_train)

# 进行预测
preds = model.predict(X_test)  # 离散预测结果：形状为 (n_test, 1)
preds_proba = model.predict_proba(X_test)  # 预测的概率：形状为 (n_test, n_classes)

# 打印基于规则的模型
print(model)
-----------------------------
# 模型由以下三条规则组成
# 若 X1 > 5，则风险为80.5%
# 若 X2 > 5，则风险为40%
# 否则风险为10%

示例
下面我们研究一份糖尿病分类数据集，其中收集了八个风险因素，并用于预测在未来五年内是否发生糖尿病。通过拟合多个模型，我们发现即使只用很少的规则，模型也能够取得出色的测试性能。

上图展示了使用FIGS算法拟合的一个模型，尽管它非常简单，但测试AUC达到了0.820。在这个模型中，每个特征都独立地对结果产生影响，而三个关键特征的最终风险被相加，得到一个表示糖尿病发生风险的值（值越高表示风险越大）。与黑盒模型相比，这个模型易于理解，计算速度快，并且可以非常清晰的审查用于模型决策的特征。