如何用整数值对数据表中字符串类型的列值进行编码。例如,我有两个特征变量:颜色(可能的字符串值 R、G 和 B)和技能(可能的字符串值 C++、Java、SQL 和 Python)。给定数据表有两列 -
Color' -> R G B B G R B G G R G ;
Skills' -> Java , C++, SQL, Java, Python, Python, SQL, C++, Java, SQL, Java.
我想知道哪个 sklearn 函数/方法将转换以上两列,如 R=0、G=1 和 B=2 以及 C++ =0、Java=1、SQL=2 和 Python=3 :
Color: 0, 1, 2, 2, 1, 0, 2, 1, 1, 0, 1
Skills: 1, 0, 2, 1, 3, 3, 2, 0, 1, 2, 1
请让我知道该怎么做?