空间数据处理智能化的重要性
- 提高地理信息处理的效率;
- 减轻人在地理信息处理中的劳动量;
- 使一般的地理信息用户也能让专家一样解决问题;
- 大型的空间决策服务需要归纳、分析多种方案。
智能化处理方法的来源
- 常常来自于人工智能学科的研究成果,如:知识工程,模式识别,人工神经网络,搜索方法,知识发现,机器行为学,最优化理论等;
- 在实际地理信息问题的处理过程中,涉及的多限制条件问题,多方案选择问题,空间搜索问题,与专家的经验密切相关的问题等。
GIS中常用的智能化方法
-
模式识别:形状的结构识别、地图符号的统计识别;
-
专家系统:地图设计、制图综合、地图注记自动配置;
-
知识获取:人工神经网络、遗传算法、空间数据挖掘算法;
-
空间搜索:模拟退火算法、遗传算法、一般搜索方法;
-
最优化理论:线性规划、动态规划;
空间数据获取、分析、可视化中的智能化方法
人工智能概述
- 人工智能研究如何使用人工的方法和技术,即用各种自动机器或智能机器模仿、延伸和扩展人的智能,以期实现某些“脑力劳动”的自动化,它是一门综合性的交叉学科,涉及到脑科学、神经生物学、心理学、语言学、逻辑学、认知科学、行为科学和数学等诸多的学科领域;
- 人工智能又被称为“机器智能”,即MI(Machine Intelligence),研究各种智能机器的设计原理和实现方法,以期提高机器的智能水平,使机器具有感知、推理、决策等功能,使其具有知识获取、知识表达和知识利用的能力;
- 在人工智能的发展过程中,科学家对人工智能的本质的理解并不相同,形成了很多不同的研究方法,主要是符号主义、联结主义、行为主义三种方法;
- 总而言之,人工智能是研究机器智能的技术科学,是关于智能机器或智能系统分析与综合的方法、设计和实现的技术。
专家系统与知识工程
专家系统的概念和特点
-
概念
- 所谓的“专家系统”,实际上是具有相当多的专家知识和经验水平,以及解决专门问题能力的计算机系统。结合课本,相对于传统的程序算法的两个组成部分:数据+算法,专家系统具有不同的两个组成部分:知识+推理,这也是专家系统是智能程序的原因,它使用储存的大量的专家知识,对问题进行分析和推理,从而得到结论。
-
特点
- 专家系统采用三级结构,数据集--知识库集--控制级(推理机)。其中数据是某特定问题所独有的;
- 专家系统具有启发性,模拟专家在问题求解中的思维过程,而不是刻板的使用已有的数据;
- 专家系统的符号推理;
- 专家系统的灵活性;
- 专家系统的透明性;
专家系统的结构和功能
专家系统的主要组成成分如下:
-
用户界面:担当信息媒介;
-
知识库:知识库
知识获取与机器学习
KDD
- 大量宝贵的资源在没有得到利用就已经过时了,KDD(Knowledge Discovery in databases)技术就是在这样一个背景下产生了,它的宗旨是在数据库中分析处理大量的数据,发现有用的知识。
- KDD就是从数据库中精确抽取大量琐碎数据中隐含的、预先未知的和潜在有用的信息的方法和工具。
- KDD的主要实施对象是关系数据库,因为关系数据库具有归一化的组织结构形式、一体化的查询语言、方便的用户接口、集合运算等;
- 近些年随着数据库技术的发展,以及从事该领域研究工作人员的增加,出现了许多新的与KDD相关或相似的术语,例如:数据挖掘、知识抽取、信息发现、信息收集、数据模式处理、数据仓库等;
- 与数据挖掘不同的是,KDD是指从数据库中抽取有用的知识的全过程,而数据挖掘是这个过程中的一个特定的步骤,KDD的全过程除了数据挖掘之外,还包括数据准备、数据选择、数据清理、调入预备知识、解释发现结果等。
数据挖掘
- KDD的步骤之一,从广义的观点看,数据挖掘是从存放在数据库、数据仓库、电子表格或其他信息库中的大量数据中挖掘有趣知识的过程;
- 数据挖掘的任务可以分为两类:描述和预测,描述性挖掘任务是描述数据库中数据的一般特征,预测性挖掘任务是在当前数据上进行推断,以便进行预测。
地图模式识别的基本技术
地图模式识别的概念与发展现状
- 模式识别是指利用计算机自动模拟人类对外部世界某一特定客体、过程及现象的识别功能;
- 地图模式识别技术是一种智能技术,研究如何使计算机实现人类对地图的阅读和理解,因为地图是地图符号的有机集合,所以地图模式识别的核心内容是地图符号的自动识别。
- 在地图模式识别方面,国内外已有一些研究成果,如:栅格-矢量转换软件,地图图纸读取系统,扫描彩色地图的分色处理,地图符号的识别,地图注记的识别等。
点状地图符号的识别
统计法
原理:通过经验,确定足以将要分类的点状地图符号区分开来的特征向量,并对这些特征进行分组,形成一个由粗分类到细分类的多级决策过程,点状地图符号识别过程是:
常用的三组特征有:
- 组合性特征:面积、周长、密集度、体态比、欧拉数
- 矩特征:T1 T2 T3 T4 T5 T6 T7
- 傅里叶系数特征:圆形度、细长度、密集度
结构法
原理:地图符号的结构识别方法是基于符号的结构特征进行符号的识别,把一个复杂的地图符号分解为若干较简单的组成部分(基元)的组合,通过对基元的识别,进而识别复杂的地图符号。点状地图符号识别过程为:
常用的基元是:直线段、曲线段、闭合线段、闭合填充域、孤立点。
在基元选择和提取之后,就需要考虑如何把这些基元组合成有意义的关系结构(地图符号),基元之间关系描述的方法包括:模式文法描述法和相关位置描述法。
统计-结构法
原理:统计方法和结构方法的结合,兼顾了地图符号的统计特征和结构特征,比较全面的考虑了地图符号的特征,点状地图符号的统计-结构法识别过程如下:
基于地学知识的空间数据处理
地学知识的概念
地学知识是地学领域中反应地学现象和过程及其属性的形式化信息,它同样具有一般知识的特征。
地学知识的表达
为了在数据处理中有效的利用地学知识,常常使用过程式编程语言来解决地学知识的表达和管理问题,可将地学知识分为三级:
- 因子级知识:该级知识反映了解决某类问题所需要的地学基本概念,常常是单要素的因子;
- 运算级知识:该级知识是地学基本原理和专家经验,利用该级知识可得出地学中的专题信息;
- 决策级知识:该级知识是进行规划、决策的经验性知识,是地学专家在某一领域内长期实践经验的总结,是经验性知识。
地学知识的存储和管理
因子级的知识可以用表的形式进行描述和管理,这些基本因子可以进一步使用地学编码的方式进行组合,用于表达地理目标的属性。
运算级和决策级知识的管理如下图:
地学知识的推理
在地理专家系统中,推理机的作用是控制、协调系统的推理,并利用知识库中的规则对综合数据库中的数据进行逻辑操作,推理机担负两项任务:一是检查自己已有的事实和规则,并在可能的情况下增加新的事实,二是决定推理的方式和顺序。
推理的基本过程如下:
-
装入数据库;
-
由用户确定用于推理的地理区域的数据和知识范围;
-
因子级知识中基本因子的匹配,结果是获取推理对象的各因子的分级值;
-
用运算级知识规则去匹配地理数据库中的数据,若规则要求的数据不足,则启动相应的地学模型求出,记录使用的规则号和匹配结果于动态缓冲区中;
-
用决策级知识对属性数据库中的数据和计算结果作匹配,得到最终结论。
地图设计的智能化方法
地图制图知识就是地图设计与编绘过程中专家经验和各种地图制图规范的总称,从广义上讲,在数字(电子)地图的设计中还包括各种描述地图制图对象的事实。
地图制图知识具有专家系统或知识工程系统中知识的一般特性,同时还具有空间知识的特征,空间知识是指对地图要素图形特征和空间关系的描述。
地图制图知识的分类方案