智能WEB信息提取系统的研究和设计

消耗积分:2 | 格式:rar | 大小:154 | 2009-07-30

英雄孤寂

分享资料个

XML 业已成为WEB 数据发布与交换的标准，包装器技术为数据挖掘提供了重要实
现步骤，智能代理技术以其智能、代理特性在控制协调挖掘上起着重要作用。本文将这三项标准和技术进行有机结合，应用于WEB 数据挖掘上，借助J2EE 三层体系结构思想，给出了智能WEB 信息提取实现方案，并简要阐述了该系统处理用户挖掘请求的流程，体现了该系统较强的智能理解和概括能力。
随着Internet 技术的迅速发展，网上各种信息呈指数式增长，形成了这样的难堪局面：
一方面，信息量大得惊人；另一方面，人们为找到所需的信息得花上大量的时间和精力。由此看来，对于海量信息的挖掘提取工作具有重大的意义。
本文提出了一个能够从超大数据密集型WEB站点自动提取数据的系统。流行电子商务、
金融、某些科学组织协会或者新闻娱乐等站点不仅信息量大，而且数据更新也特快，。这些站点大都由很多包含复杂超链接的HTML 页面构成，实现了完全左键操作、所点即所得（这也是当前“网络桌面环境”的出发点），获取信息相当简易快捷。但由于WEB 页面自身的表示逻辑和网页之间复杂链接的缘故，使构建基于以上信息源的大型应用程序或系统存在很大的技术难点，那么考虑换种页面表示形式能否解决这个难题呢？
就此问题，最近人们提出了一些解决方案，主要从数据挖掘角度取得突破性的进展。
经过长期细致的观察，发现当前许多WEB 站点包含大量结构非常相似的WEB 页面，而且预测在将来一段时间内上述站点还会保持这种结构不变。针对这种事实，一些研究人员验证了相关的技术，并提出能够从HTML 页面提取数据的WEB 包装器[1,2,3]以及包装器库[4]，即输入有公共模板的一组WEB 页面后，可得到能从前述有公共模板的WEB 页面集提取核心数据的包装器。
以上研究成果给本文提供一个局部解决方案。文章将XML[5,6,8]、包装器、智能代理
（Agent）[7]三项技术或标准有机结合，并应用于数据挖掘上，改进文[7]的多Agent 联合协作理论，给出了智能提取数据实现方案。

下载并关注上传者 低至0.43元/天 开通VIP 免费下载

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

发评论

相关下载
相关文章

下载排行榜

AU6815P 内置 DSP 的 2×32W 立体声 I2S数字输入D类功放芯片中文资料
2026-04-27 3次下载

下载
A-29回音消除模块
2026-05-07 2次下载

下载
PC4139 32V低噪音大电流白光LED恒流驱动器数据手册
2026-04-27 2次下载

下载
双麦阵列回音消除及降噪模块 A-47 说明书
2026-05-07 2次下载

下载
人形机器人执行、感知系统技术及市场解析
2026-05-20 2次下载

下载
WD8002D产品规格书
2026-04-27 1次下载

下载

智能WEB信息提取系统的研究和设计

基于ARM的WEB远程监控系统研究与应用

《监测系统中智能信息处理技术》pdf

硕士学位论文《家庭智能网关的研究与实现》

嵌入式web服务器系统,嵌入式Web服务器的设计与实现

什么是智能工厂-物联网系统

2021年智能家居行业研究报告

基于Web云端应用服务构建等的齿轮云测量终端系统

基于主题模型的Web服务聚类方法综述

基于深度学习的遥感影像典型要素提取方法

智能网联汽车信息物理系统参考架构报告

图像显著性检测算法及关键技术综述

基于关联规则的Web应用统计测试生成方法

一种自适应网页结构化信息提取方法

智能Mesh Web Web工具指南

虚假在线评论信息识别研究综述

一种面向物联网服务的Web攻击向量检测方法

一种基于信息熵与综合函数特征提取

基于最小乐观概念的决策信息规则提取算法

根据短视频特征信息提高人物行为识别准确率

在生成中兴概念过程中进行规则提取的算法

基于模糊选项关系的关键属性提取方法

基于卷积循环神经网络的自动代码特征提取模型

结合通配符模式与随机游走算法的关键词提取方法

针对web系统的LoadRunner业务背景流量生成系统

WSN医疗监护系统的设计方案

机器视觉的简介和研究现状与应用及检测等资料说明

如何使用Python和Web设计一个水资源的监测系统

如何使用无人机遥感影像地块边界提取应用在农业方面详细资料概述

使用MC9S12DG128单片机和CCD传感器实现智能小车的研究论文

WEB的技术综合应用和设计研究资料实验说明

使用无人机进行农业边界提取的遥感影像说明

高光谱成像技术在指纹提取的研究和应用

基于算力魔方的智能文档信息提取方案

探秘地下变电站：智能辅助控制系统业务智能处理与系统集成

多光谱无人机的林木火灾受损信息提取研究2.0

多光谱无人机及机器学习的林木火灾受损信息提取研究2.0

基于多光谱无人机及机器学习的林木火灾受损信息提取研究1.0

边缘Web智能网关是什么？边缘Web智能网关的功能

高光谱图像混合像元分解

人工智能包含哪些领域

C# Socket程序结构分析及应用

高光谱遥感蚀变矿物信息提取研究

Web开播系统的技术演进

StrucTexTv2：端到端文档图像理解预训练框架

ApkAnalyser一键提取安卓应用APK敏感信息

基于统一语义匹配的通用信息抽取框架-USM

Web的应用基础

基于统一语义匹配的通用信息抽取框架USM

基于eBPF技术实现TLS加密的明文捕获

基于完整文件系统提取和密钥链解密

百度地图基于时空数据一张图打造室内外一体化的智能空间解决方案

智芯传感ZXP2绝压压力传感器解决功耗高稳定性差的难题

下秒数据CEO蔡致暖：云原生时代数据管道的迭代之路

浅析智能化指挥信息系统发展

无人机遥感数据处理与滑坡信息提取

无人机遥感数据的处理与滑坡信息提取

Acrel-3000WEB电能管理系统的应用案例

介绍一种新颖的三元组对比学习训练框架

基于嵌入式操作系统与Internet网络实现智能终端控制系统的设计

海康威视超脑系列智能NVR具有哪些特点

区块链用于物流行业智能供应链管理的好处有哪些

下载排行榜

AU6815P 内置 DSP 的 2×32W 立体声 I2S数字输入D类功放芯片中文资料

A-29回音消除模块

PC4139 32V低噪音大电流白光LED恒流驱动器数据手册

双麦阵列回音消除及降噪模块 A-47 说明书

人形机器人执行、感知系统技术及市场解析

WD8002D产品规格书