目录

  • 细分构建机器学习应用程序的流程-模型优化
  • 一、1.1 网格搜索法
  • 二、1.2 随机搜索法
  • 2.1 1.2.1 随机采样
  • 2.2 1.2.2 随机搜索法


细分构建机器学习应用程序的流程-模型优化

通过数据收集、数据预处理、训练模型、测试模型上述四个步骤,一般可以得到一个不错的模型,但是一般得到的都是一个参数收敛的模型,然而我们模型还有超参数或不同的核函数等,如r的非线性支持向量机的bf核或linear核;rbf核的非线性支持向量机超参数\(C、\gamma\),正则化中的\(\alpha\)。我们模型优化一块主要是对模型超参数的优化,简而言之就是输入一组超参数,对每个超参数对应的模型进行测试,选择这一组超参数中最优的模型。

一、1.1 网格搜索法

网格搜索法相当于对你输入的每一个参数都进行验证,并且可以设置多个超参数。

from sklearn import datasets
from sklearn.svm import SVC
from sklearn.model_selection import ShuffleSplit
from sklearn.model_selection import GridSearchCV

iris = datasets.load_iris()
X = iris.data
y = iris.target

# 总共有2*4=8种选择
parameters = {'kernel': ('linear', 'rbf'), 'C': [0.1, 1, 10, 100]}

svc = SVC(gamma="scale")

cv = ShuffleSplit(n_splits=10, test_size=0.3, random_state=1)

scoring = 'accuracy'

clf = GridSearchCV(svc, parameters, cv=cv, scoring=scoring)
clf.fit(X, y)

更多文章请关注《万象专栏》