如何使用 tsfresh 选择时间序列的前 n 个特征?我可以决定要提取的主要特征的数量吗?
基于@Chaitra 的上述评论和这个答案 https://stackoverflow.com/questions/62991201/tsfresh-get-n-most-relevant-features我给出答案。
您可以通过使用来决定顶级功能的数量tsfresh
相关表中描述文档 https://tsfresh.readthedocs.io/en/latest/api/tsfresh.feature_selection.html#module-tsfresh.feature_selection.relevance。然后,您可以按 p 值和顶部对表进行排序n
特征。
示例代码打印前 11 个功能:
from tsfresh import extract_features
from tsfresh.feature_selection.relevance import calculate_relevance_table
extracted_features = extract_features(
X,
column_id="id",
column_kind="kind",
column_value="value",
)
relevance_table = calculate_relevance_table(extracted_features, y)
relevance_table = relevance_table[relevance_table.relevant]
relevance_table.sort_values("p_value", inplace=True)
print(relevance_table["feature"][:11])
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)