保存训练好的机器学习模型

当我们训练好一个model后,下次如果还想用这个model,我们就需要把这个model保存下来,下次直接导入就好了,不然每次都跑一遍,训练时间短还好,要是一次跑好几天的那怕是要天荒地老了。。sklearn官网提供了两种保存model的方法:官网地址

1.使用python自带的pickle

from sklearn.ensemble import RandomForestClassifier

from sklearn import datasets

import pickle

#方法一:python自带的pickle

(X,y) = datasets.load_iris(return_X_y=True)

rfc = RandomForestClassifier(n_estimators=100,max_depth=100)

rfc.fit(X,y)

print(rfc.predict(X[0:1,:]))

#save model

f = open('saved_model/rfc.pickle','wb')

pickle.dump(rfc,f)

f.close()

#load model

f = open('saved_model/rfc.pickle','rb')

rfc1 = pickle.load(f)

f.close()

print(rfc1.predict(X[0:1,:]))

2.使用sklearn中的模块joblib

使用joblib模块更加的简单了,核心代码就两行

from sklearn.ensemble import RandomForestClassifier

from sklearn import datasets

from sklearn.externals import joblib

#方法二:使用sklearn中的模块joblib

(X,y) = datasets.load_iris(return_X_y=True)

rfc = RandomForestClassifier(n_estimators=100,max_depth=100)

rfc.fit(X,y)

print(rfc.predict(X[0:1,:]))

#save model

joblib.dump(rfc, 'saved_model/rfc.pkl')

#load model

rfc2 = joblib.load('saved_model/rfc.pkl')

print(rfc2.predict(X[0:1,:]))

这两个方法都可以,但是更推荐用第二种,即joblib,因为根据官网介绍,速度更快。

---------------------

原文:https://blog.csdn.net/u012328159/article/details/79255805

Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐