mongo-删除重复数据

2023-10-31

mongo-删除重复数据


//使用aggregate聚合查询重复数据
//$group中是查询条件,根据你的字段来聚合相同的数据;
//$count用来统计重复出现的次数, $match来过滤没有重复的数据;
db.getCollection("你的集合名")
.aggregate([{
		$group: {
			_id: {
				你的字段1: '$你的字段1',
				你的字段2: "$你的字段2"
			},
			count: {
				$sum: 1
			},
			dups: {
				$addToSet: '$_id'
			}
		}
	},
	{
		$match: {
			count: {
				$gt: 1
			}
		}
	}

])
.forEach(function(it){
         //保留第一个数据,防止所以重复数据全部被删除
         it.dups.shift();
         //执行删除   
         db.getCollection("wallhaven.cc").remove({_id: {$in: it.dups}});
 
    });
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

mongo-删除重复数据 的相关文章

随机推荐

  • SpringBoot+Vue 的家政服务管理平台(附源码,数据库)

    文章目录 1 背景 2 主要技术 3 可行性分析 4 系统设计 5系统的详细设计与实现 5 1前台模块设计 5 2后台功能模块 源码下载地址 1 背景 本系统主要是设计出家政服务管理平台 基于B S构架 后台数据库采用了Mysql 可以使数
  • 做爬虫会有前途吗?

    阅读文本大概需要 5 分钟 这几年随着人工智能领域的大火 Python 这门语言逐渐出现在主流视野中 Python 语法易懂 编写简洁 并且还拥有非常丰富的库 很多人工智能项目首选的语言就是用 Python 可以说是人工智能把 Python
  • 2021年氯化工艺实操考试视频及氯化工艺考试试题

    题库来源 安全生产模拟考试一点通公众号小程序 安全生产模拟考试一点通 氯化工艺实操考试视频是安全生产模拟考试一点通生成的 氯化工艺证模拟考试题库是根据氯化工艺最新版教材汇编出氯化工艺仿真模拟考试 2021年氯化工艺实操考试视频及氯化工艺考试
  • Solidity 从入门到实战(一)

    solidity 从入门到实战 一 注意 本专栏主要来自于https www bilibili com video BV1St411a7Pk p 11 spm id from pageDriver的学习笔记 编写第一个案例 声明版本号 pr
  • 计算机下方如何添加启动项,开机设置启动项,如何添加开机启动项

    开机启动项指的是当计算机在开机的时候会随着系统同时启动的程序组件或者软件 开机启动项虽然是不可避免的 但是开机启动项越多就会导致开机的时候需要启动的程序过多 这样会延长计算机的开机时间 甚至还会延缓计算机的运行速度 为此 设置好计算机的开机
  • stata怎么判断是否存在异常值_基于Stata软件异常值识别与处理的全流程(原创)...

    来源 参考Stata帮助文件 由Taotao Tu原创 1 程序包的安装 首先 我们一起安装一下winsor2命令 方法一 ssc install winsor2 这是安装程序最简单的方法 从下图可以看到 我们已经安装好程序了 如果上面的方
  • 输入经纬度查询位置

    一 百度Web地图 1 进入百度地图 https map baidu com 2 点击下方的 地图开放平台 3 进入平台下拉 找到 工具支持 gt 坐标拾取器 4 勾选 坐标反查 输入经纬度 以英文逗号隔开 备注 百度地图手机端App 暂不
  • SQL注入篇--基础注入

    SQL注入篇 基础注入 1 SQL注入原理 sql注入的原理就是在服务器后端对数据库进行操作请求之前 人为地对sql语句做一些恶意注入 从而达到人为预期效果 造成数据泄露甚至数据破坏 注入漏洞在OWASP2021年的总结中位列TOP10的第
  • java学习笔记------接口

    接口 就是一种规则 是对行为的抽象 接口的定义和使用 接口用关键字interface来定义 public interface 接口名 接口不能实例化 接口和类之间是实现关系 通过implements关键字表示 public class 类名
  • 成为一名Java架构师的必修课

    一 热门框架源码学习 设计模式篇 Spring5源码解读篇 Mybatis篇 SpringBoot2篇 二 微服务架构 架构设计篇 BAT互联网架构这些年的演进分析 国内外常见分布式系统架构状况介绍 微服务架构指南 领域驱动设计DDD模型
  • ESG评级能否促进企业绿色转型(2009-2021年)

    参照胡洁 2023 的做法 对来自数量经济技术经济研究 ESG评级能否促进企业绿色转型 基于多时点双重差分法的验证 一文中的基准回归部分进行复刻 本文从非正式环境规制视角出发 基于商道融绿首次公布上市公司 ESG 评级的外生冲击 以2009
  • URL编码与解码

    通常如果一样东西需要编码 说明这样东西并不适合传输 原因多种多样 如Size过大 包含隐私数据 对于Url来说 之所以要进行编码 是因为Url中有些字符会引起歧义 例如Url参数字符串中使用key value键值对这样的形式来传参 键值对之
  • vue在线预览word,pdf, xls,ppt 文档

    首先先踩坑 也不算坑 只是跟我的需求不匹配 一 官方渠道 使用微软提供的Office Online平台只需要一个网址即可在线查看Xls doc PPT等文档 http view officeapps live com op view asp
  • 第二个项目(第6210小时时进行)

    给老师演示过物理效果后 老师甚为满意 于是把我推荐给了他兼职的公司的老总 但是老总模棱两可的态度效果不佳 老师怕我不开心 告诉我 他这里项目多的做不完 于是进入了下一个项目 用到的工具是qt osg 老师写框架 我做模块
  • AOP切入同类调用方法-AopContext.currentProxy()

    本文链接 https blog csdn net u014788227 article details 90111662 常规使用spring的AOP功能 就是对一个service的B方法进行切入记录日志 AOP能起作用 但是假如B方法被s
  • Anaconda/pip常见命令

    目录 一 Conda使用 1 1 conda基础命令 1 2 添加第三方源 二 pip常见命令 一 Conda使用 1 1 conda基础命令 打开anaconda Prompt 输入conda list 就会显示已经安装好的库 如果这些库
  • 尿沉渣图像处理——有形成分边缘检测

    有形成分边缘检测 处理思路 1 将彩色图像灰度化 以去除图像冗余信息 2 使用中值滤波 以去除椒盐噪声 3 邻域滤波 使图像模糊 以便于去除刻度框阴影 4 Canny算法与Sobel算法边缘检测后叠加平均 使细胞可形成连通域 5 孔洞填充
  • html sql连接mysql数据库_HTML连接sql数据库

    怎样从HTML网页中获取SQL数据库里的数据 我现在是一名学生 第一学期快结束了 老师要CSS布局HTML小编今天和大家分享我们每个学习小组用C 做HTML是无法读取数据库的 HTML是页面前端脚本语言 要想从HTML网页中获取SQL数据库
  • GitLab在项目的环境搭建和基本的使用

    目录 gitlab 使用入门 1 导读 本教程主要讲解了GitLab在项目的环境搭建和基本的使用 可以帮助大家在企业中能够自主搭建GitLab服务 并且可以GitLab中的组 权限 项目自主操作 GitLab简介 GitLab环境搭建 Gi
  • mongo-删除重复数据

    mongo 删除重复数据 使用aggregate聚合查询重复数据 group中是查询条件 根据你的字段来聚合相同的数据 count用来统计重复出现的次数 match来过滤没有重复的数据 db getCollection 你的集合名 aggr