1.
加载库,读取数据并进行处理;
import pandas as pd
import os
from sklearn.model_selection import train_test_split
from sklearn.model_selection import cross_val_score
import numpy as np
from collections import defaultdict
from sklearn.tree import DecisionTreeClassifier
from sklearn.preprocessing import LabelEncoder
from sklearn.preprocessing import OneHotEncoder
#
添加文件路径
,
路径最好不要出现中文
dataFolder = "’G:
\Python36\
leagues_NBA_2014_games_games.csv’";
data_filename = os.path.join(dataFolder, "basketball", "leagues_NBA_2014_games_games.csv");
with open(data_filename) as data_filename:
#
读取数据的同时,将第一二列合并为一列
dataset = pd.read_csv(data_filename, parse_dates=[[0,1]]
#
我们可以通过下面这个方法对数据进行查看
#dataset.iloc[:5]
#
对数据重新命名头部
dataset.columns
=
[“Date”,
“Visitor
Team”,
“VisitorPts”,
“Home
Team”,
“HomePts”,
“OT?”,
“Notes”]
#
对数据进行排序并重新建立索引。当然也可以不进行排序,这个影响并不大。
#sort()
排
序
函
数
已
经
在
pandas0.20
以
后
被
弃
用
,
一
旦
使
用
将
报
错
,
只
能
使
用
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)