在《机器学习实战》第四章中 使用朴素贝叶斯过滤垃圾邮件出现了 ‘gbk’ codec can’t decode byte 0xae in position 199: illegal multibyte sequen 错误
原因在于 email->ham->23.txt 文本中出现了“�”字符 删掉这个字符就好啦