We 使用模式挖掘的研究 b
谷秀岩
山东轻工业学院金融职业学院, 济南,510 200
摘 要 We 挖掘是传统数据挖捆技术在 We 环境下的应用, b b b We 挖掘分为 We b内容挖掘, b We 结构挖掘和 We 使用模式挖掘.We 使用模式挖掘是从用户浏览网站的数据中抽取感兴趣的模 b b 式, 理解用户的浏览兴趣行为, 以便进一步改善网站结构或为用户提供个性化的服务. 本文主要论 述了We 使用模式挖掘. b
关链词 We b挖掘, b使用模式挖掘, We 浏览兴趣 , 个性化服务
现代社会的竞争趋势要求对信息进行实时和深层次的分析 , 但由于 We b页面的复杂, 而 且是无结构的, 动态的, 导致人们难以迅速, 方便地在 We 上找到所需要的数据和信息.搜索 b 引擎在一定程度上解决了人们对信息需求, 但远没有达到令人满意的程度. 解决这些问题的一
个 径,是 传 的 据 描 术 e结 起 进 e数 挖 途 就 将 统 数 挖 技 和Wb 合 来,行Wb 据 掘.
1 b We 数据挖掘
We 挖掘研究的内容和分类 b We 挖掘研究的内容是: b () 1 个性化特征及推荐系统.解决如何挖掘顾客的个性规律, 如对于在线电子商店, 了解 顾客的个性经验是吸引长期顾客的关键因素. 通过 We b日志文件中的浏览数据来挖掘顾客的 浏览个性 , 并用这些有价值的数据来提高顾客对网站的浏览效率. () 2 挖掘框架体系及案例研究.集中了来自实际应用数据挖掘技术的厂商在构建系统体 系时所要解决的问题 , 并给出了各自的原型. () 3 用户浏览分析. 如何对用户的浏览数据进行挖掘. 如得到有价值的电子商务信息, 从 而了解用户在决定是否购买产品时的细节行为. We 数据挖掘的分类是: b 一般地, 挖掘可以分为 We 内容挖掘( b t t i )We 结构挖掘( b b We b We Cn n Min , oe ng b We
S ut e i ) e 使用模式挖掘( e U i s e a i ) t c rMn g和W b r u in W b g c m M n g三类. se h in
() b 1 We 内容挖掘是从文档内容或其描述中抽取知识的过程.We b内容挖掘有两种策 略: 直接挖掘文档的内容和在其他工具搜索的基础上进行改进.根据挖掘处理的数据可以将 We b内容挖掘分为文本挖掘和多媒体挖掘两个部分. () b 2 We 结构挖掘是从 We 组织结构和链接关系中推导知识.挖掘页面的结构和 We b b 结构, 可以用来指导对页面进行分类和聚类, 找到权威页面, 中心页面, 从而提高检索的性能. 同时还可以用来指导网页采集工作, 提高采集效率.We 结构挖掘分为 We 文档内部结构挖 b b
2 1 0
掘和文档间的超链结构挖掘.
() b 3 We 使用模式挖掘是从服务器端记录的用户访问日志或从用户的浏览信息中抽取感
兴趣的模式 , 通过分析这些数据可以帮助理解用户的行为, 从而改进站点的结构或为用户提供 个性化的服务 .
2 b We 使用模式挖掘
We 使用模式挖掘是从用户浏览网站的数据中抽取感兴趣的模式, b 理解用户的浏览兴趣 行为 , 以便进一步改善网站结构或为用户提供个性化的服务. We 使用模式挖掘必须解决以下两个基本问题: b
() 1 如何准确收集用户身份, 访问行为, 访问频度, 访问内容等浏览信息. () 2 如何正确度量和表达用户的浏览兴趣.
以下仅对第一个间题进行讨论.
2 1 .
基于用户浏览行为的挖掘步骤
() 1 数据准备: 采集用户的浏览信息, 并将用户信息记录到用户浏览行为库, 数据进行清 洗, 滤掉脏数据, 识别用户, 提取关键字. ()用户兴趣度计算: 2 计算用户浏览过的网页的兴趣度, 并生成网页兴趣味度矩队, 以便 于为进一步的计算做准备. 根据已经计算出的网页兴趣度矩阵计算主题兴趣度, 根据已经计算 出的网页兴趣度矩阵计算关键词兴趣度, 并将计算结果按兴趣度大小依次排列. () 根据挖掘结果实施推荐, 3 推荐: 将用户感兴趣的内容的链接添加到用户正在浏览的网
页.
() 4 结果修正: 根据用户浏览行为的反馈对推荐进行修正, 如果用户接受推荐, 则进行巩
固; 否则, 根据用户的反馈进行重新推荐.
22 采集用户浏览数据 .
如何采集用户浏览信息, 特别是用户浏览页面的时间信息是基于用户浏览行为的We 挖 b 掘的一个重要工作.由于 H T T P协议的无状态连接特性, 很难单纯从服务器端或单纯从客户 端得到准确的用户浏览数据.本文讨论了综合服务器日志文件和客户端浏览信息采集用户浏
- web挖掘 > 使用模式挖掘的研究
-
使用模式挖掘的研究
下载该文档 文档格式:PDF 更新时间:2010-05-01 下载次数:0 点击次数:1文档基本属性 文档语言: 文档格式: pdf 文档作者: 微软用户 关键词: 主题: 备注: 点击这里显示更多文档属性 经理: 单位: 微软中国 分类: 创建时间: 上次保存者: 修订次数: 编辑时间: 文档创建者: 修订: 加密标识: 幻灯片: 段落数: 字节数: 备注: 演示格式: 上次保存时间:
- 下载地址 (推荐使用迅雷下载地址,速度快,支持断点续传)
- PDF格式下载
- 更多文档...
-
上一篇:2011年高考考试大纲(课程标准实验版)——物理
下一篇:四川省各地市2011年高考数学最新联考试题分类大汇编第9部分:...
点击查看更多关于web挖掘的相关文档
- 您可能感兴趣的
- web数据挖掘 web数据挖掘技术 web数据挖掘的算法 web数据挖掘pdf 数据挖掘的web应用 web数据挖掘实例 web web.qq.com q+web
- 大家在找
-
- · 福建交通八闽网
- · 多连杆悬挂图片
- · 2011环评工程师通过率
- · 财经应用文
- · 异能之绝代中医
- · 护理综合试题及答案
- · 可编程控制器系统设计师
- · 模拟集成电路设计答案
- · 铁碳合金体
- · 苏州缝纫活外发加工
- · 东南大学学报英文版
- · 奇瑞开瑞优优价格
- · 初中思想政治论文
- · 电脑显卡升级
- · wwe2011年12月28日
- · 员工素质培训资料ppt
- · meimei微博
- · 三星s5830导航打不开
- · 易语言入门教程
- · 北京房屋出租网
- · 叙事文章范文
- · amd推土机
- · 别克英朗gt1.6
- · 技术学院钳工教案
- · 缝纫工求职
- · 人教版8和9的认识ppt
- · 2011科幻片电影大全
- · tl494中文资料
- · 两人三足张家辉朱茵
- · 2010上海世博会开幕式
- 赞助商链接