Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
特征工程(一)countvectororizer
将原始数据的word特征数字化为countvector特征 并将结果保存到本地 article特征可做类似处理 import pandas as pd from sklearn feature extraction text import
达观杯nlp算法比赛总结
特征工程(二)TfidfVectorizer
将原始数据的word特征数字化为tfidf特征 并将结果保存到本地 article特征可做类似处理 import pandas as pd from sklearn feature extraction text import TfidfV
达观杯nlp算法比赛总结
组合特征(五)countvector(w)+doc(w)+hash(w)
将countvector word hash word 和doc2vec word 拼接成新特征 import pickle from scipy import sparse from scipy sparse import hstack
达观杯nlp算法比赛总结
达观杯_构建模型(一)linearSVM
特征 tfidf word tfidf article 1 特征 tfidf word tfidf article 2 模型 linearsvm 3 参数 C 5 from sklearn svm import LinearSVC 支持向量
达观杯nlp算法比赛总结
特征工程(四)HashingVectorizer
将原始数据的word特征数字化为hash特征 并将结果保存到本地 article特征可做类似处理 import pandas as pd from sklearn feature extraction text import Hashing
达观杯nlp算法比赛总结
组合特征(四)linearsvm-tfidf(word)+lr-tfidf(article)
将linearsvm挑选的tfidf word 特征和lr挑选的tfidf article import pickle from scipy import sparse from scipy sparse import hstack wit
达观杯nlp算法比赛总结
组合特征(三)tfidf(word+article+length)
特征拼接 拼接文章长度 1 载入特征 2 读文章长度 3 特征缩放 拼接特征 import pickle 载入特征 with open tfidf word article pkl rb as f x train y train y tes
达观杯nlp算法比赛总结
达观杯_构建模型(三)lightGBM
countvector a doc a hash a 1 特征 countvector a doc a hash a 2 模型 lgb import numpy as np import pandas as pd from sklearn
达观杯nlp算法比赛总结