• 决策树案例 > 自整个资料库中运用一种或多种电脑技术以自动分析或撷...
  • 自整个资料库中运用一种或多种电脑技术以自动分析或撷...

    免费下载 下载该文档 文档格式:PPT   更新时间:2006-10-09   下载次数:0   点击次数:1
    文档基本属性
    文档语言:
    文档格式:ppt
    文档作者:Richard J. Roiger
    关键词:Addison-Wesley Publishing
    主题:
    备注:
    点击这里显示更多文档属性
    Data Mining - 951
    Figure 1.4 Intrinsic vs. actual customer value
    PART I
    Data Mining: 初探
    Chapter 1
    1.1 Data Mining: 定义
    Data Mining
    自整个资料库中运用一种或多种电脑技术以自动分析或撷取知识的过程
    The process of employing one or more computer learning techniques to automatically analyze and extract knowledge from data.
    归纳法学习(Induction-based Learning)
    自资料探勘所获得知识通常是资料的模型或是归纳.
    归纳法学习乃自概念明确,具体可知的例子中构造出通用的概念定义.
    See example on page 4.
    高尔夫球电视转播赞助
    饶舌音乐购买习惯
    信用卡是使用模式
    Knowledge Discovery in Databases (KDD)
    知识挖掘(KDD) 是一种通常用以与资料探勘互相使用的术语.技术上,KDD是一种运用科学方法来作资料探勘的应用.
    See flow chart in next slide
    The application of the scientific method to data mining. Data mining is one step of the KDD process.
    知识挖掘流程
    知识挖掘流程
    选择欲KDD的目标资料集合(Data Selection)
    探勘前的资料处理(Pre-processing)(如资料过滤Data Cleaning)
    资料转换(Transformation)(含资料减量Data Reduction)
    进行资料探勘(Data Mining)(依欲KDD的目标及资料属性形式选择适合的资料探勘演算法,以寻找出资料关系的类型Pattern)
    探勘结果的释意及所得关系类型的评估(Interpretation/Evaluation)(含知识的呈现Knowledge Presentation)等五阶段
    1.2 为甚麼电脑可以学习
    资料探勘是一种学习
    电脑学习的四个等级
    事实(Facts) :事实即是真相的简单叙述
    概念(Concepts) :由一个或一群物件,特徵,或是事件的集合.
    程序(Procedures) :为达成目的所采行之步骤.
    原则(Principles) :其表现为最高次的学习,以真相为基础所形成的通则与定律.
    电脑擅长於概念学习,故DM产出概念结构.一般概念结构包括:树状,规则,网路图,及数学方程式.
    知识为黑箱概念,推理法则,经验资料
    三个概念观
    概念可自不同明显关系中被观察出,吾辈可自三种概念观加以应用至DM.
    标准概观(classical view) :表示所有具有确定定义属性的概念.标准概念观对於概念的定义为明确且无令人误解的空间.范例规则如下:
    若 年收入 30,000
    且 目前职务的年资 5

    下一页

  • 下载地址 (推荐使用迅雷下载地址,速度快,支持断点续传)
  • 免费下载 PPT格式下载
  • 您可能感兴趣的
  • 决策树  决策树例题  决策树分类算法  决策树分类  决策树法的计算  决策树计算题  决策树挖掘技术  决策树学习  决策树房价