将 NLTK Rake 应用于 Dataframe 中的每一行

2023-12-21

我想应用 Rake 函数(https://pypi.org/project/rake-nltk/ https://pypi.org/project/rake-nltk/)到我的数据框中的每一行。

我可以将该函数单独应用于特定行,但不能将其附加到数据帧。

这是我到目前为止所拥有的:

r = Rake(ranking_metric= Metric.DEGREE_TO_FREQUENCY_RATIO, language= 'english', min_length=1, max_length=4)
r.extract_keywords_from_text(test.document[177])
r.get_ranked_phrases() #prints a list of keywords
test['keywords'] = test.applymap(lambda x: r.extract_keywords_from_text(x)) #trying to apply it to each row.

它只是无限期地运行。我只想在我的数据框“测试”中附加一个名为“关键字”的新列,其中包含来自 r.get_ranked_phrases() 的关键字列表。


r.extract_keywords_from_text(x) 将返回 None

import pandas as pd
from  rake_nltk import Rake  

r = Rake()    

df=pd.DataFrame(data = ['machine learning and fraud detection are a must learn',
                  'monte carlo method is great and so is hmm,pca, svm and neural net',
                  'clustering and cloud',
                  'logistical regression and data management and fraud detection'] ,columns = ['Comments'])


 def rake_implement(x,r):
     r.extract_keywords_from_text(x)
     return r.get_ranked_phrases()

df['new_col'] =df['Comments'].apply(lambda x: rake_implement(x,r))
print(df['new_col'])
#o/p
0      [must learn, machine learning, fraud detection]
1    [monte carlo method, neural net, svm, pca, hmm...
2                                  [clustering, cloud]
3    [logistical regression, fraud detection, data ...
Name: new_col, dtype: object  
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

将 NLTK Rake 应用于 Dataframe 中的每一行 的相关文章

随机推荐

  • PHP:找不到“Phar”类

    我尝试使用 Silex 框架作为我的 Web 应用程序的基础 但是 如果我尝试包含 phar 存档 PHP 会抛出以下错误 Fatal error Class Phar not found in var www framework sile
  • 将两个 mysql 查询合并为一个

    组合这两个查询的正确语法是什么 SELECT clicks FROM clicksTable WHERE clicks gt 199 ORDER BY clicks ASC LIMIT 1 and SELECT clicks FROM cl
  • 如果无法修改 JSONP 中的标头。 Chrome 中的 Twitter 扩展程序如何工作?

    现在我正在用 Javascript 做 Twitter 客户端 读完这个话题后 我有一个疑问 修改 JSONP 请求的 HTTP 标头 https stackoverflow com questions 3350778 modify htt
  • 获取地址时模板类型(类/函数)实例化的规则是什么?

    在回答中this https stackoverflow com questions 6734492 c callback to function template explicitly instantiate template问题 我发现
  • 核心数据:继承、STI 还是其他?

    我似乎无法在文档中或通过谷歌找到任何关于此的信息 但如果有的话 指向它的指针会很棒 在我的应用程序中 我有一个Thing作为核心数据类 我打算拥有那个Thing包含许多Items 里面有很多字段 比如order and created da
  • 在 macOS 中找不到 mysql 命令

    我已经安装了 MySQL dmg根据官方页面安装文件 但它返回command not found mysql当我执行时mysql命令 如何解决这个问题 MySQL 的文档说 使用软件包安装程序进行安装时 文件将安装到 usr local 中
  • setuid 与 seteuid 函数

    setuid 和 seteuid 函数有什么区别 在手册页中 这两个函数都有相似的描述 setuid DESCRIPTION setuid sets the effective user ID of the calling process
  • 如何在运行时更改 WinForms 应用程序的区域性

    我用 C 创建了 Windows 窗体程序 我在本地化方面遇到一些问题 我有两种语言的资源文件 一种是英语 另一种是法语 我想单击每个语言按钮并在运行时更改语言 但是当我点击按钮时 它不起作用 我正在使用这个代码 private void
  • 如何为 Azure AD B2C 设置用户旅程查看器

    根据Azure Active Directory B2C 收集日志 https learn microsoft com en us azure active directory b2c active directory b2c troubl
  • 您认为 Java 中最好的 CMS 是什么 [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi
  • Rails 3:如何在 application.rb 中声明 Rack 中间件

    很多例子 比如这两个 如何在 Rails3 中使用机架中间件 https stackoverflow com questions 4224900 how to use rack middleware with rails3 http asc
  • VueJS 将 HTML 打印到页面

    我有一个属性 其中包含 HTML 字符串作为其属性之一 当我尝试将其打印到模板中的页面时 它实际上打印了 HTML 因此文本包含 HTML 标签 并且它本身不会被浏览器解释为 HTML 我怎样才能解决这个问题 模板 div class de
  • 无法在 Android 8 中禁用通知振动

    我试着禁用振动显示通知时 Func public static Notification buildNotifForUploaderService Context ctx String title String message Notifi
  • Pandas 数据框按日期移动列

    我有一个按日期和 ID 索引的面板数据集 看起来像这样 df pd DataFrame Date 2005 12 31 2006 03 31 2006 09 30 2005 12 31 2006 03 31 2006 06 30 2006
  • 绕过错误并继续代码

    这是我之前遇到的一个简单问题 本质上 像这样的解决方案 https stackoverflow com questions 574730 python how to ignore an exception and proceed and t
  • 在 Android 上替换 ViewPager 中的当前 Fragment

    我有一个ViewPager我必须更换第一个Fragment如果某个动作发生 public static class PagerAdapter extends FragmentStatePagerAdapter private TempCha
  • 如何添加可拖动的“文本字段”以在颤振中的图像上添加文本?

    我正在 flutter 中创建一个 Meme 生成器应用程序 我只需要知道是否有一种方法 用户本身可以在图像上添加文本并将该文本拖动到图像区域中的任何位置 这样图片看起来很有趣 我尝试过拖动框小部件 但不知道如何将其用于文本字段 这样我也可
  • SQL 2008+ NOLOCK 与 READPAST 对于报告准确性的注意事项

    了解最终的决策是业务决策 在 SQL 2008 R2 中运行的 NOLOCK 和 READPAST 之间的准确性考虑因素是什么 在与业务领域讨论变更之前 我希望能有更好的理解 我继承了许多查询 用于创建管理报告的数据视图 WITH NOLO
  • iPhone:获取 Google 地图的选定缩放级别

    当用户使用以下任一方式时 我们需要获取 MKMapView 当前选择的缩放级别 使用 Mapkit 放大或缩小 Google 地图 我们尝试过的解决方案在模拟器上运行良好 但在真实环境中运行不佳 设备 具有 iOS 3 0 1 的 iPho
  • 将 NLTK Rake 应用于 Dataframe 中的每一行

    我想应用 Rake 函数 https pypi org project rake nltk https pypi org project rake nltk 到我的数据框中的每一行 我可以将该函数单独应用于特定行 但不能将其附加到数据帧 这