sklearn参考资料
sklearn是机器学习中较为常用的一个python库,其中有大量可用的机器学习方法可以直接使用,具体参考其文档sklearn英文文档,同时社区也有人提供了中文文档scikit-learn机器学习库中文文档翻译项目,scikit-learn中文文档
sklearn中的数据预处理
机器学习中大部分数据在训练前都需要进行数据预处理,比如原图像像素值为0-255,需要将像素转换为-1-1便于分类器训练等等。
StandardScaler
关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化
使用joblib持久化sklearn模型
from sklearn.externals import joblib
# 序列化操作
joblib.dump(model,'model.pkl')
# 反序列化操作
model = joblib.load('model.pkl')
可视化
yellowbrick sklearn可视化。