我有多个类标签,想要计算模型的准确性。
我有点困惑我需要使用哪个 sklearn 函数。
据我了解,以下代码仅用于二元分类。
# dividing X, y into train and test data
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25,random_state = 0)
# training a linear SVM classifier
from sklearn.svm import SVC
svm_model_linear = SVC(kernel = 'linear', C = 1).fit(X_train, y_train)
svm_predictions = svm_model_linear.predict(X_test)
# model accuracy for X_test
accuracy = svm_model_linear.score(X_test, y_test)
print accuracy
正如我从链接中了解到的:使用 OneVsRestClassifier 时 sklearn.svm.SVC 的 Decision_function_shape 是什么? https://stackoverflow.com/questions/43505451/which-decision-function-shape-for-sklearn-svm-svc-when-using-onevsrestclassifier
对于多类分类我应该使用OneVsRestClassifier
与决策函数形状(与ovr
or ovo
并检查哪一个效果更好)
svm_model_linear = OneVsRestClassifier(SVC(kernel = 'linear',C = 1, decision_function_shape = 'ovr')).fit(X_train, y_train)
主要问题是预测标签的时间对我来说确实很重要,但运行分类器和预测数据大约需要 1 分钟(而且这个时间还添加到诸如 PCA 之类的特征减少中,这也需要一些时间)?有什么建议可以减少支持向量机多重分类器的时间吗?