人工智能——数据挖掘1

2023-11-06

1.概述

从技术角度,数据挖掘(data mining)是从大量的不完全的、有噪南的(模糊的随机的实际应用数据中提取隐含在其中的、人们事先不知道的,但又是潜化有用的信身和知识的过程。与数据挖掘相近的同义词包括数据融合、数据分析和决策持第。预处理过程这一定义包括好几层含义:数据源必须是真实的、海量的、含噪声的:发现的是用户感兴趣的知识;发现的知识要可接受、可理解、可运用;并不要求发现放之四海皆准的知识,仅支持特定的发现问题。

从商业角度,数据挖掘是一.种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性信息。

简言之,数据挖掘其实是一类深层次的数据分析方法。因此,数据挖掘可以描述为:按企业既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律性,并进一步将其模型化的有效方法。

数据挖掘作为一一门新兴的交叉学科,涉及数据库系统、数据仓库、统计学、机器学习、可视化、信息检索和高性能计算等诸多领域。

此外数据挖掘还与神经网络、模式识别、空间数据分析图像处理、信号处理、概率论、图论和归纳逻辑等领域关系密切。

数据挖掘与统计学有密切关系.近几年.人们逐渐发现数据挖掘中有许多工作是由统计方法来完成的。甚至有些人(尤其是统计学家)认为数据挖掘是统计学的一个分支, 当然大多数人(包括绝大多数数据挖掘研究人员)并不这么认为。

但是,统计学和数据挖掘的目标非常相似,而且数据挖掘中的许多算法也源于数理统计,统计学对数据挖掘发展的贡献功不可没。

数据挖掘与传统数据分析方法主要有以下两点区别:

首先,数据挖掘的数据源与以前相比有了显著的改变,包括数据是海量的,数据有噪声,数据可能是非结构化的。

其次,传统的数据分析方法一般都是先给出一个假设,然后通过数据验证,在一定意义上是假设驱动的;与之相反,数据挖掘在一定意义上是发现驱动的,模式都是通过大量的搜索工作从数据中自动提取出来的。即数据挖掘是要发现那些不能靠直觉发现的信息或知识,甚至是违背直觉的信息或知识,挖掘出的信息越是出乎意料,就可能越有价值。

在缺乏强有力的数据分析工具而不能分析这些资源的情况下,历史数据库也就变成了“数据坟墓”里面的数据几乎不再被访问。也就是说,极有价值的信息被“淹没”在海量数据堆中,领导者决策时只能凭自己的经验和直觉。因此改进原有的数据分析方法,使之能够智能地处理海量数据,也就演化为数据挖掘。

研究数据挖掘的目的,不再是单纯为了研究,更主要的是为商业决策提供真正有价值的信息进而获得利润。目前所有企业北面临的一个共同问题是,企业数据量非常大.而其中真正有价值的信息却很少,因此需要经过深层分析,从大量的数据中获得有利于商业运作,提高竞争力的信息,就像从矿石中石中淘金一样.数据挖掘也由此而得名。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

人工智能——数据挖掘1 的相关文章

随机推荐

  • 【PostgreSQL 数据库技术峰会(成都站)】云原生虚拟数仓 PieCloudDB Database 的架构和关键模块实现...

    2023年6月17日 中国开源软件推进联盟 PostgreSQL 分会在成都举办了数据库技术峰会 此次峰会以 新机遇 新态势 新发展 为主题 结合当下信创热潮 人工智能等产业变革背景 探讨 PostgreSQL 数据库在这些新机遇下的发展前
  • 浏览器播放rtsp视频流:1、开源方案

    浏览器播放rtsp视频流 1 开源方案 文章目录 浏览器播放rtsp视频流 1 开源方案 1 方案一 html5 websocket rtsp proxy 实现视频流直播 1 1 实现原理 1 2 实现步骤 1 3 优缺点 1 4 参考链接
  • LeetCode # 452 投飞镖刺破气球

    在二维空间中有许多球形的气球 对于每个气球 提供的输入是水平方向上 气球直径的开始和结束坐标 由于它是水平的 所以y坐标并不重要 因此只要知道开始和结束的x坐标就足够了 开始坐标总是小于结束坐标 平面内最多存在104个气球 一支弓箭可以沿着
  • 鸿蒙pc系统镜像,鸿蒙系统有pc版么_鸿蒙系统有pc版安装方法

    鸿蒙系统作为华为推出的一款操作系统 它跟其他安卓ios系统还是有很大区别的接 但是华为除了有手机还有电视使用鸿蒙系统之外电脑也是华为手机不可缺少的一款 那鸿蒙系统pc版怎么下载呢 1 鸿蒙系统pc版安装方法 首先在电脑上插入U盘 然后打开制
  • 钉钉内网测试-超简单

    环境 win10 python3 钉钉内网穿透官网 两步实现内网穿透 一 下载穿透工具 穿透工具 11 8M 然后启动 进入命令行 cd windows 64 ding config ding cfg subdomain abcde 808
  • expdp数据泵导出oracle某表带时间查询的写法

    expdp scott tiger orcl directory dump dir dumpfile expdp dmp tables emp query where tjsj to date 2020 03 yyyy mm
  • yolop源码train.py学习

    因为要做一个可行驶区域和车道线的任务 所以选了yolop 看他的刷榜还可以 yolop的算法解读后边找了链接再贴出来 花花花大神的博客 我们先从 tools train py 开始debug train py 结构 import xxx d
  • linux入门之awk和shell变量传递

    一 awk使用shell中的普通变量 方法1 使用引号法 aa hello awk BEGIN print aa 输出 aa awk BEGIN print aa 输出hello awk BEGIN print aa 输出空 aa hell
  • metasploit(MSF)渗透超细解说 -- 小黑渗透工具

    metasploit Framework msf 里带数千个已知的软件漏洞 并保持持续更新 Metasploit可以用来信息收集 漏洞探测 漏洞利用等渗透测试的全流程 采用Ruby语言编写 黑掉整个宇宙的称号 初心 记录msfconsole
  • 比尔·盖茨的传奇

    比尔 盖茨的传奇 传奇人生始自少年 比尔盖茨的编程人生在他十三岁就开始了 他进入了湖畔中学 LakesideSchool 湖畔中学是当时为数不多的拥有计算机 PDP 10 的学校 但是机器使用时间严重受限 因而比尔盖茨和计算机公司达成了协议
  • 黑马程序员Spring视频教程,全面深度讲解spring5底层原理 学习笔记

    介绍 代码仓库地址 https gitee com CandyWall spring source study 跟着黑马满一航老师的spring高级49讲做的学习笔记 本笔记跟视频内容的项目名称和代码略有不同 我将49讲的代码每一讲的代码都
  • (三)获取linux内核的系统信息

    这一章 使用qt来获取linux内核的系统信息并显示到界面上 这里的系统信息包括CPU的使用率 CPU的温度 内存信息以及硬盘信息 CPU温度 NanoPI Fire3的开发团队为系统提供了读取CPU温度的接口 一个设备文件 使用命令查看C
  • Web开发语言简介

    JSP了解的不多EJB JSP开发企业级应用轻量级的有StructAsp net日渐成熟随着Vs2005的发行微软开始大力推行VS开发应用VS2005集成了一整套的应用也达到了微软的一般标准会用鼠标的都能操作数据库制作一个网站 aspVBS
  • 掌上和平精英服务器维护要多久,和平精英身份识别卡时间多久 拾取时间限制介绍...

    和平精英上线队友召回模式之后 相信有大批的玩家涌入新模式 那么大家肯定也都知道识别卡是有时间限制的 如果对手死蹲队友的盒子 我们是很难接近的 快来看看和平精英身份识别卡时间多久吧 队友被筛选之后变成了盒子 在他的盒子里面会有一张身份辨认卡
  • CSS水平垂直居中常见方法总结

    说明 本篇文章只是总结一些方法 例子用到的各个元素属性不做解释 详情请看MDN文档 非常的详尽 例子在chrome浏览器下完全好使 IE这个渣渣 附上链接 https developer mozilla org zh CN 本文出现的错误
  • 中国支付清算体系-CNAPS

    中国的支付清算有两套体系 中国现代化支付清算系统和第三方支付清算系统 当你去ATM取钱时 用的是央行的CNAPS 中国现代化支付清算系统 当你用支付宝买买买时 用的是第三方支付的清算系统 这里先介绍第一部分 CNAPS 1 当你在ATM取钱
  • esxi管理端口_ESXI虚拟机创建LACP动态链路汇聚网络负载均衡教程

    大家好 我是村里的萝卜头 今天给大家分享的是ESXI虚拟机添加LACP动态链路汇聚负载均衡教程 动态LACP汇聚是一种系统自动创建 删除的汇聚 不允许用户增加或删除动态LACP汇聚中的成员端口 只有速率和双工属性相同 连接到同一个设备 有相
  • python2定点找色,Python-找到相似的颜色,最好的方法

    我已经创建了一个函数来查找图像中的颜色 并返回x y 现在我需要添加一个新函数 在这里我可以找到具有给定公差的颜色 应该很容易吗 在图像中查找颜色并返回x y的代码 def FindColorIn r g b xmin xmax ymin
  • oCPC和CPC之间的区别

    oCPC官方给出的概念是 智能出价 注重转化 CPC是指按点击付费的结算方式 广告主给每次点击的价钱 从这两点就可以看出来 oCPC比CPC更加符合企业主需求的转化效果 但其实两者的结算方式是一样的 都是按点击计费 不同的是oCPC的智能化
  • 人工智能——数据挖掘1

    1 概述 从技术角度 数据挖掘 data mining 是从大量的不完全的 有噪南的 模糊的随机的实际应用数据中提取隐含在其中的 人们事先不知道的 但又是潜化有用的信身和知识的过程 与数据挖掘相近的同义词包括数据融合 数据分析和决策持第 预