PythonScikitLearn用法一览

Scikit-learn 是一个python的开源库,其提供了统一的接口,用于实现机器学习、数据预处理、交叉检验和可视化算法。本文汇集了该工具库的常用方法,方便查阅和参考。

PythonScikitLearn用法一览

导入数据

所需数据为数值类型,可用Numpy数组或Scipy稀疏矩阵保存;如果数据为其他类型,需要转换为数值类型的数组,如Pandas Dataframe数据就需要转换为数值型数组。

PythonScikitLearn用法一览

训练数据和测试数据

PythonScikitLearn用法一览

模型拟合

监管学习:

PythonScikitLearn用法一览

非监管学习:

PythonScikitLearn用法一览

预测

监管预测:

PythonScikitLearn用法一览

非监管预测:

PythonScikitLearn用法一览

数据预处理

数据标准化:

PythonScikitLearn用法一览

范式化:

PythonScikitLearn用法一览

二进制化:

PythonScikitLearn用法一览

分类特征编码:

PythonScikitLearn用法一览

处理缺失的数据:

PythonScikitLearn用法一览

生成多个特征:

PythonScikitLearn用法一览

创建模型

创建监管学习预测模型

(1)线性回归模型

PythonScikitLearn用法一览

(2)支持向量机模型(SVM)

PythonScikitLearn用法一览

(3)朴素贝叶斯模型

PythonScikitLearn用法一览

(4)KNN模型

PythonScikitLearn用法一览

非监管学习预测模型

(1)主成分分析(PCA)

PythonScikitLearn用法一览

(2)K means模型

PythonScikitLearn用法一览

模型评估

分类评价指标

(1)准确度评分

PythonScikitLearn用法一览

(2)生成分类报告

PythonScikitLearn用法一览

(3)混淆矩阵

PythonScikitLearn用法一览

回归评价指标

(1)均值绝对误差

PythonScikitLearn用法一览

(2)均值平方根误差

PythonScikitLearn用法一览

(3)R平方评分

PythonScikitLearn用法一览

聚类评价指标

(1)调整兰德系数

PythonScikitLearn用法一览

(2)同质化评价

PythonScikitLearn用法一览

(3)V-measure评分

PythonScikitLearn用法一览

模型调优

网格搜索:

PythonScikitLearn用法一览

随机参数优化:

PythonScikitLearn用法一览

PythonScikitLearn用法一览

发布者:股市刺客,转载请注明出处:https://www.95sca.cn/archives/76285
站内所有文章皆来自网络转载或读者投稿,请勿用于商业用途。如有侵权、不妥之处,请联系站长并出示版权证明以便删除。敬请谅解!

(0)
股市刺客的头像股市刺客
上一篇 2024 年 7 月 11 日
下一篇 2024 年 7 月 11 日

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注