本文首先论述了地理信息系统中空间数据挖掘的分类和方法。并以湘江河流水环境监测与评价GIS系统为例,介绍大型分布式网络GIS系统中空间数据挖掘工具的设计思想及其实现。依次对空间数据的基本特征,湘江河流水环境监测与评价GIS系统空间数据挖掘的过程及其关键技术进行了说明。 数据挖掘(data mining)起源于从数据库中发现知识(knowledge discovery in database, KDD)[1][2]。KDD是从数据中辨识有效的、新颖的、潜在和有用的、最终可理解的模式过程。数据挖掘是KDD中通过特定算法,在可接受的计算效率下生成特定模式的一个步骤。人们也趋于将两者一起使用,称为数据挖掘与知识发现(Data mining and knowledge Discovery, DMKD)。将KDD技术应用于空间分析,即产生了KDSD(Knowledge Discovery from Spatial Database),它是从空间数据库中提取用户感兴趣的空间模型与特征、空间与非空间数据的普遍关系及其它一些隐含在空间数据库中的普遍的数据特征。 地理信息系统(Geographic information system, GIS)是以采集、存储、描述、分析和应用与空间地理分布有关的数据的计算机系统。作为数据库管理技术、计算机图形学以及空间分析方法的共同产物,它已在社会、军事、经济和管理部门得到了长足的发展和广泛的应用[3]。目前,它正逐步与遥感(RS)和全球定位系统(GPS)技术相结合,向集成化、自动化及智能化迈进。专家系统技术在遥感影像解释、地形数据的表达及语义和非语义信息的提取等方面的应用,正是为了提高这种高集成度的地理信息系统的自动化和可靠性。然而,尽管专家系统中的知识表达和知识应用的研究取得了不少的进展和成果,其知识获取仍然主要依赖于专家和知识工程师,离知识自动生成还有相当大的差距。