Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
KMeans 对不平衡数据进行聚类
我有一组包含 50 个特征 c1 c2 c3 的数据 行数超过 80k 每行包含标准化数值 范围 0 1 它实际上是一个标准化的虚拟变量 其中一些行只有很少的特征 3 4 即如果没有值则分配 0 大多数行大约有 10 20 个特征 我使用
python
clusteranalysis
kmeans
datascience
featureengineering
在python中将字典转换为二进制
我有一本字典 其中键作为我的客户 ID 值作为我的电影 ID 尽管客户已经多次观看同一部电影 但我希望将其制作为一部电影 这里我需要将我的字典转换为二进制数据 在所有行中 我需要客户 ID 和列作为电影 ID 如果客户看过电影 则给出 1
python
pandas
featureengineering
通过 TensorFlow 中 CSV 的分类特征数组列创建多热 SparseTensor
这是推荐系统中处理稀疏特征 例如一些ID特征 的典型方式 我正在寻找一种方便的方法来为 TensorFlow 管道准备数据 我做了很多搜索 但尚未找到好的解决方案 下面是似乎接近我需要的 但尚未工作 See 下面的部分 数据文件如下 csv
tensorflow
machinelearning
recommendationengine
featureengineering