使用 tsfresh 仅选择一定数量的顶级特征

2024-03-25

如何使用 tsfresh 选择时间序列的前 n 个特征?我可以决定要提取的主要特征的数量吗?


基于@Chaitra 的上述评论和这个答案 https://stackoverflow.com/questions/62991201/tsfresh-get-n-most-relevant-features我给出答案。

您可以通过使用来决定顶级功能的数量tsfresh相关表中描述文档 https://tsfresh.readthedocs.io/en/latest/api/tsfresh.feature_selection.html#module-tsfresh.feature_selection.relevance。然后,您可以按 p 值和顶部对表进行排序n特征。

示例代码打印前 11 个功能:

from tsfresh import extract_features
from tsfresh.feature_selection.relevance import calculate_relevance_table

extracted_features = extract_features(
    X,
    column_id="id",
    column_kind="kind",
    column_value="value",
)
relevance_table = calculate_relevance_table(extracted_features, y)
relevance_table = relevance_table[relevance_table.relevant]
relevance_table.sort_values("p_value", inplace=True)
print(relevance_table["feature"][:11])
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用 tsfresh 仅选择一定数量的顶级特征 的相关文章

随机推荐