Hashmap 单键保存一个类。计算密钥并检索计数器

2024-04-18

我正在开发一个数据库自我项目。我有一个来自以下位置的输入文件：http://ir.dcs.gla.ac.uk/resources/test_collections/cran/ http://ir.dcs.gla.ac.uk/resources/test_collections/cran/

处理成1400个单独的文件后，每个文件命名为00001.txt,... 01400.txt...）以及申请后Stemming在它们上，我将它们单独存储在一个特定的文件夹中，我们称之为茎文件夹格式如下：

in 茎文件夹：00001.txt 包括：

investig
aerodynam
wing
slipstream
brenckman
experiment
investig
aerodynam
wing

in 茎文件夹：00756.txt 包括：

remark
eddi
viscos
compress
mix
flow
lu
ting

等等....

我编写的代码执行以下操作：

get the 茎文件夹, 计算唯一单词
按字母顺序排序
添加文档的ID
将每个文件保存到新文件 00001.txt 到 01400.txt，如下所述

{I can 提供我的代码对于这 4 个部分，以防有人需要查看实施、更改或任何编辑情况}

每个文件的输出将结果到一个单独的文件中。（1400，每个命名00001.txt, 00002.txt...）在特定文件夹中我们可以称之为频率文件夹格式如下：

in 频率文件夹：00001.txt 包括：

00001,aerodynam,2
00001,agre,3
00001,angl,1
00001,attack,7
00001,basi,4
....

in 频率文件夹：00999.txt 包括：

00999,aerodynam,5
00999,evalu,1
00999,lift,3
00999,ratio,2
00999,result,9
....

in 频率文件夹：01400.txt 包括：

01400,subtract,1
01400,support,1
01400,theoret,1
01400,theori,1
01400,.....

______________

现在我的问题:

我需要再次组合这 1400 个文件，通过一些计算输出一个看起来像这样格式的 txt 文件：

'aerodynam' totalFrequency=3docs: [[Doc_00001,5],[Doc_01344,4],[Doc_00123,3]]
'book' totalFrequncy=2docs: [[Doc_00562,6],[Doc_01111,1]
....
....
'result' totalFrequency=1doc: [[Doc_00010,5]]
....
....

'zzzz' totalFrequency=1doc: [[Doc_01235,1]]

感谢您花时间阅读这篇长文章

您可以使用Map of List.

Map<String,List<FileInformation>> statistics = new HashMap<>()

在上面的映射中，键将是单词，值将是List<FileInformation>描述包含该单词的各个文件的统计信息的对象。这FileInformation类可以声明如下：

class FileInformation {
    int occurrenceCount;
    String fileName;

    //getters and setters
}

要填充上面的地图，请使用以下步骤：

读取其中的每个文件FrequencyFolder
当你第一次遇到一个单词时，把它作为关键Map.
创建一个FileInformation对象并设置occurrenceCount找到的出现次数并设置fileName到它所在的文件的名称。将此对象添加到List<FileInformation>对应于步骤 2 中创建的密钥。
下次您在另一个文件中遇到相同的单词时，创建一个新的FileInfomation对象并将其添加到List<FileInformation>对应于该词在地图中的条目。

一旦你拥有了Map填充后，打印统计数据应该是小菜一碟。

for(String word : statistics.keySet()) {
  List<FileInformation> fileInfos = statistics.get(word);
  for(FileInformation fileInfo : fileInfos) {
      //sum up the occureneceCount for the word to get the total frequency
  }
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

class

HashMap

filemanipulation

Hashmap 单键保存一个类。计算密钥并检索计数器的相关文章

使用 global-method-security，访问被拒绝错误将作为 HTTP 500 错误返回

我尝试使用 Spring Security Annotations 来确保安全而不是在 XML 中定义规则它似乎有效但是当我遇到访问被拒绝错误时我收到返回的 HTTP 状态代码 500 我在 tomcat 日志文件中没有看到任何异常
SpringBoot @SqsListener - 不工作 - 有异常 - TaskRejectedException

我有一个 AWS SQS 队列中已有 5000 条消息示例消息类似于 Hello 1 我创建了一个 SpringBoot 应用程序并在其中一个组件类中创建了一个从 SQS 读取消息的方法 package com example aws
从 Map 中找出给定值的键的更快方法？

我想从 HashMap 中找出给定值的键目前我必须遍历所有键并检查其在映射中的值有没有更快的方法用于执行此操作的替代数据结构是BiMap来自谷歌集合 API API 文档是here http google collections go
Hibernate中通过ID获取对象

我注意到我们的高级开发人员使用以下代码通过 ID 检索实体 Override public Source get Long id Session session getSession if session null session sess
Java-Android 上的 MulticastSocket 问题

我开始使用 MulticastSocket 进行编码尝试制作一个带有客户端和服务器的简单应用程序来发送消息我的服务器代码 import java io IOException import java net DatagramPacket
在基于 RESTful 的应用程序中管理状态

我们正在评估用于基于 Web 的应用程序的技术一些建议是采用基于 RESTful 的服务方法技术堆栈 1 春天 2 Apache CXF JAX RS 我的问题是 1 如何在请求之间管理状态例如用户已经过身份验证现在他正在发出一系
如何在 Java 中将 hashmap 转换为 JSON 对象 [关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案如何在 Java 中将 hashmap 转换或转换为 JSON 对象然后再次将 JSON 对象转换为 JSON 字符串您可以使用 new
通过 jclouds 使用 AWS (S3) - 如何承担角色

使用普通身份验证凭据时我可以执行以下操作 ContextBuilder newBuilder aws s3 credentials keyId key buildView BlobStoreContext class 访问 S3 的 Bl
CXFServlet 抛出 java.lang.NoSuchMethodError：

java lang NoSuchMethodError org codehaus stax2 ri EmptyIterator getInstance Lorg codehaus stax2 ri EmptyIterator at com
如何使用 RestTemplate 禁用编码

我正在使用 REST 模板有意在请求 uri 中发送例如 items a b String responseEntity restTemplate exchange items a b requestObj getHttpMethod r
Spring - 捕获bean创建异常

我想在我的代码中捕获 bean 实例化异常我有什么选择一种方法是使用基于 Java 的容器配置 Configuration public class AppConfig Bean public SomeBean someBean try
从已排序的 ArrayList 中删除重复项，同时保留重复项中的某些元素

好吧一开始我以为这会很简单但我想不出有效的方法来解决这个问题我想出了一种蛮力的方法来解决这个问题但这不是很优雅我有一个数组列表 Contacts 是一个 VO 类有多个成员名称区域 id ArrayList中存在重复项因为
Keycloak - 自定义表单操作在流程中不可见

我正在尝试为用户注册实现自定义表单操作我在表单上添加了一些自定义字段我希望验证这些字段在浏览了 keycloak 文档后我意识到我需要扩展 FormAction FormActionFactory 将actionfactory打包
如何使用 Spring 状态机在状态转换期间引发异常

我试图了解状态转换期间操作如何抛出异常我配置了这个简单的状态机 transitions withExternal source State A1 target State A2 event Event E1 action executeA
Java Marine API - 寻找 NMEA 数据

我的最终目标是从 Adafruit Ultimate GPS NMEA 0183 标准接收纬度和经度 GPS 信息到我的 Java 应用程序我正在使用 Java Marine API 来执行此操作然后当前位置将与时间戳一起写入数据库
在java中读取文本文件[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案当每行都包含整数字符串和双精度数时如何在 Java 中读取 txt 文件并将每一行放入数组中每行都有不同数量的单词数字 Try
关于 Executors.newSingleThreadExecutor() 的问题

这是一个关于以下代码的程序流程的问题 import java util concurrent ExecutorService import java util concurrent Executors public class Test p
无法查找 Websphere 8.5 中是否启用了 SSL

我编写了一个简单的 ejb 瘦客户端来查找 IBM WebSphere 8 5 中部署的 bean 当服务器上未启用 SSL 时我能够成功查找 bean 但是一旦启用 SSL 我就开始收到下面提到的异常 This is how I ena
使用 Android API 发布推文

我一直在寻找一种使用 Android 应用程序发布推文的方法但我发现的所有方法都不起作用我不得不承认 Twitter 的 API 并不是那么容易理解但是我的代码并不长而且我看不出我的错误在哪里这是我的代码 public class
通过 awselb 使用 ssl 时的 neo4j java 驱动程序问题

I am using neo4j community version 3 1 1 and enterprise edition version 3 0 1 with ssl configured through awselb To conn

随机推荐

CSS 中的鼠标按下选择器是什么？

我注意到按钮和其他元素具有默认样式并按 3 个步骤运行普通视图悬停焦点视图和鼠标按下单击视图在 CSS 中我可以更改普通视图和悬停视图的样式如下所示 button background 333 color FFF button
ngResource 将 POST 参数附加到 url

我有一个看起来像这样的角度服务我在这里发出 POST 请求 factory Apples function resource HOST return resource HOST apples create method POST para
使用 XPath 排序 - 不是 XSL

XPath DOM 编程中有什么方法可以使用System Xml to run selectNodes XPATH 带有排序参数例如对于以下 XML 程序按照与文档相同的顺序降序写入值有没有办法使用 XPath 来按升序获取值笔
是否可以使用计时器为 JButton 创建淡入效果？

我想在我的程序按钮上添加一些效果当我按下button the button应该淡入 Using a timer改变的值Opaque in new Color 是一种方式但是可以应用于JButton还有因为JButton有边界所以我想
分配后列表被意外清除[重复]

这个问题在这里已经有答案了 class ListHolder public List
应用程序中所有国家/地区的城市和邮政编码

有没有一种方法可以将所有国家州城市的邮政编码存储在一个数据库中我一直在到处寻找我发现地名网 http www geonames org 我猜其中包含了所有内容但无法直接获取该数据我正在使用导轨如果有任何助手或插件就太好了如果
更改 iOS 中的应用程序语言设置而不是整个设备

我希望在我的应用程序中可以选择更改我的应用程序语言只是应用程序语言而不是整个系统请给我一些提示好吗提前致谢我知道本地化您可以使用从 Xcode 设置的自定义构建标志来完成此操作这样您就可以在本地化下运行应用程序而无需更改设备的
当我单击数据表中的下一页时，我的 jquery 选择器不再工作

我在用着数据表 http www datatables net jquery 插件在页面上显示我的数据当有人单击一行时我有这个选择器 myTable tr class tableHeader click function alert c
多线程程序中的 std::string

鉴于 1 C 03标准没有以任何方式解决线程的存在 2 C 03 标准将其留给实现来决定是否std string应该在其复制构造函数中使用 Copy on Write 语义 3 写时复制语义通常会导致多线程程序中不可预测的行为我得出以下看
为什么要使用Promise.resolve().then()？

在阅读 Angular 指令的代码时路由器链路激活 https github com angular angular blob master packages router src directives router link active
释放 GCD 调度队列属性的正确方法是什么？

我正在使用一个dispatch queue 它是通过其所有者的属性访问的如下所示 property nonatomic assign dispatch queue t queue 请注意assign关键词队列在对象的整个生命周期中使用
嵌套属性未以简单形式显示

鉴于以下情况 Models class Location lt ActiveRecord Base has many games end class Game lt ActiveRecord Base validates presence
如何获取 BTreeSet 中元素的下界和上限？

正在阅读BTreeSet文档我似乎无法弄清楚如何从 a 中获取大于元素的最小值或小于元素的最大值BTreeSet在对数时间内我看到有一个range https doc rust lang org std collections stru
将 Elmah 与 WebApi 结合使用时，错误会记录两次

我正在尝试使用 elmah 记录我的 asp net web api 项目中的异常我遇到的问题是每个错误都会记录两次我正在使用 Elmah Contrib Web Api 我的应用程序类如下 public class WebApiApp
用 R 计算年龄

我在 R 中有两个数据帧其中一个数据帧包含一个人的出生年份 YEAR 1931 1924 然后另一列显示最近的时间 RECENT 09 08 2005 11 08 2005 我想做的是减去年份以便我可以计算他们的年龄但我不知道如何处理
Rails respond_with：它是如何工作的？

我到处读到关于它有多酷的内容respond with方法在 Rails 3 中但我什至无法在 Rails API 中或通过搜索源代码找到对它的引用任何人都可以向我解释它是如何工作的您可以使用哪些选项等或者向我指出它实际实现的位置以
在事务结束时发送事件

我有一个服务对象的接口如下所示为简洁起见进行了简化 public interface ItemService public Item getItemById String itemId int version public void c
部署到 Docker 时外部化 Spring Boot 属性

在我的 Spring Boot 应用程序中我想将属性外部化以在 Docker 容器中运行首次部署时当前的属性my server src main resources application yml由应用程序按预期加载和使用一切正常
如何修复这个已有 8 年历史的 VBA 64 位编译器错误？

所以这就是错误 64 BitVBA主机例如Access 365 64位或Excel 2016 64位创建类模块SomeClass this needs to be here to trigger the bug Private Sub
Hashmap 单键保存一个类。计算密钥并检索计数器

我正在开发一个数据库自我项目我有一个来自以下位置的输入文件 http ir dcs gla ac uk resources test collections cran http ir dcs gla ac uk resources tes

Hashmap 单键保存一个类。计算密钥并检索计数器

Hashmap 单键保存一个类。计算密钥并检索计数器 的相关文章

随机推荐

热门标签

Hashmap 单键保存一个类。计算密钥并检索计数器的相关文章