Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
通过删除连续的重复项来减少字符串长度
我有一个包含 2 个字段的 R 数据框 ID WORD 1 AAAAABBBBB 2 ABCAAABBBDDD 3 我想通过仅保留字母而不是重复中的重复项来简化具有重复字母的单词 e g AAAAABBBBB应该给我AB and ABCAA
string
r
DataFrame
dimensionalityreduction
选择给定点集中最远点的子集
想象一下 你有一个 3 维 n 个点的集合 S 任意两点之间的距离是简单的欧几里得距离 您想要从该集合中选择 k 个点的子集 Q 以使它们彼此相距最远 换句话说 不存在 k 个点的其他子集 Q 使得 Q 中所有成对距离的最小值小于 Q 中的
多维缩放后如何获取特征值?
我有兴趣查看执行多维缩放后的特征值 什么函数可以做到这一点 我看了看文档 http scikit learn org stable modules generated sklearn manifold MDS html sklearn ma
使用 tSNE 可视化距离矩阵 - Python
我已经计算了一个距离矩阵 并且正在尝试两种方法来可视化它 这是我的距离矩阵 delta 0 0 71370845 0 80903791 0 82955157 0 56964983 0 0 0 71370845 0 0 99583115 1
python
matrix
networkx
dimensionalityreduction
使用自组织映射进行降维
过去几个月我一直在研究自组织映射 SOM 但是我在理解降维部分仍然有些困惑 你能建议任何简单的方法来理解 SOM 在任何现实世界数据集上的实际工作吗 就像来自 UCI 存储库的数据集 好的 首先参考一些之前的相关问题 这将使您更好地理解 S
som
dimensionalityreduction
uci
t-SNE 在不同的机器上产生不同的结果
我有大约 3000 个 100D 数据点 我用 t SNE 将它们投影到 2D 每个数据点属于三个类别之一 但是 当我在两台不同的计算机上运行脚本时 我不断得到不一致的结果 当我使用随机种子时 预计会出现一些不一致 但是其中一台计算机不断获
python
MacOS
Ubuntu
scikitlearn
dimensionalityreduction
降低数据集的维数后,我得到了负特征值
我使用了降维方法 此处讨论 随机投影算法伪代码 在大型数据集上 将维度从 1000 减少到 50 后 我得到了新数据集 其中每个样本如下所示 1751 360 2069 2694 3295 1764 现在我有点困惑 因为我不知道负特征值意味
machinelearning
Probability
multidimensionalarray
dimensionalityreduction
LDA 忽略 n_components?
当我尝试使用 Scikit Learn 的 LDA 时 它只给我一个组件 尽管我要求更多 gt gt gt from sklearn lda import LDA gt gt gt x np random randn 5 5 gt gt g
python
scikitlearn
dimensionalityreduction