• 显著性分析 > 第8章 基因表达数据分析
  • 第8章 基因表达数据分析

    免费下载 下载该文档 文档格式:DOC   更新时间:2014-04-01   下载次数:0   点击次数:1
    cDNA微阵列实验得到的值反映了基因的相对表达水平,即测量样本与对照样本之间荧光信号强度的比率或者比率取对数,这是一个无量纲的值,可用于比较一组实验中的基因相对表达水平。如果对照样本的信号非常低, 这个比率就可能很大,因为可能主要是噪声信号,因此它很可能是无意义的,对于这些数据往往看作是不确定的,在后续分析时要注意这些数据,根据需要 是否保留以及如何赋值。(是否是自己的语言???,或用我们的文章,陆老师)
    Patrick Brown实验室使用cDNA微阵列测量了酵母基因组在diauxic shift(糖代谢切换到发酵)、孢子形成和完整的细胞周期过程中的基因表达水平(约6400个不同的cDNA序列)。这些数据均可以通过Internet网免费获取,也是在研究表达数据分析方法时用的较多的数据。
    8.1.2 寡核苷酸芯片
    又称为基因芯片、DNA芯片。它是在玻璃片上按阵列固定寡核苷酸探针,这些探针是在片原位合成的。现有产品中应用最广泛的是Affymetrix公司制造的GENECHIP??芯片,它使用一种光掩模技术和传统的DNA合成化学的组合以非常高的密度制造寡核苷酸阵列。例如,Affymetrix公司的Human Genome U133芯片包含了100万个不同的寡核苷酸探针, 了33000个人类基因。寡核苷酸芯片主要用于DNA多态性检测和基因表达分析,还可以用于微生物基因组的再测序。
    寡核苷酸探针的长度通常为20-25bp,在检测mRNA表达水平时可能存在寡核苷酸之间的非特异性交叉杂交的冗余信息,可能会掩盖杂交信号;此外,对于特定的寡核苷酸,信号强度对于寡核苷酸的碱基组成是敏感的。对于第一个问题,通常是采用匹配/失配(PM/MM)探针对的方法,即在设计一个特异的寡核苷酸(匹配)时,同时设计一个非特异的寡核苷酸探针,仅仅在中间位置有一个碱基替换(失配),这样可以用PM与MM之间的差值作为信号强度。为了解决第二个问题,在设计探针时,对于每一个待检测的mRNA包含多个寡核苷酸探针,例如为每一个转录本设计11-20个探针对来检测。
    与cDNA微阵列不同的是,与寡核苷酸芯片杂交的是测量样本,而不是cDNA微阵列实验中的测量样本与对照样本的混合物。对于基因芯片的检测结果有两种,一种是P/A/M,表示有/无/不 ,另一种是信号强度。前者的结果主要是用来判断样本中有无特定基因的表达,这个结果对于部分实验,特别是一些定性实验是有意义的,例如判断肿瘤与 情况下的细胞基因表达差异。当需要对几个不同条件下的基因表达情况进行分析时,对基因表达的相对变化更感兴趣,所以多采用第二种方式。有时基因表达数据的信号强度是负值,这是由于测量的信号小于背景信号或者背景/阴性控制样本的定义不正确造成的,对于前者,一般把负值做为0考虑,现在的Affymetrix的芯片分析系统已不产生负值。(??)
    在考虑基因表达谱时,所采用的数据与cDNA微阵列数据一样,也是一系列测量样本与对照样本之间的信号强度比率或比率的对数值。实验得到的信号强度也是经过规格化的数值,规格化的方法很多,但归一化过程一般都包含在芯片扫描系统的图像处理软件中。
    cDNA微阵列或基因芯片(以下统称微阵列)在用于基因表达分析时的一个最大优点是高通量性,在一次芯片实验中可以对成千上万个基因的表达进行并行测量。由于实验环节较多,虽然在设计芯片时可以通过添加阴性和阳性探针等手段来保证数据的可靠,但是需要提醒的是,数据的可靠性仍然是对数据进行后续分析时必须考虑的一个问题。
    8.1.3 基因表达数据的网络资源
    大量基于微阵列实验的基因表达数据是公开在Internet网上的,尤其是学术机构在发表论文时所用的实验数据都能免费提供给全世界的研究人员下载使用。作为学术论文的补充资料在网上发布的数据主要是文本文件或Excel格式的文件,这些数据往往都是经过归一化处理后的Ratio值或log2(Ratio),对于寡核苷酸芯片数据有的是P/A/M(Present/Absent/Don’t Know)的表示或基因绝对表达值。因为这些数据文件没有包含原始的实验方案、实验材料、原始扫描图像、图像处理方法和数据归一化方法等信息,对于要比较、集成和整合分析来自不同研究小组的基因表达数据是非常困难的。主要原因是微阵列并不是在任何客观的个体上测量基因表达水平,大多数测量值仅仅是基因表达的相对变化,而且使用的并不是一个标准化的对照样本。同时,基因表达数据比基因组序列数据要复杂的多,这些数据仅仅在有具体的关于实验条件的描述时才是有意义的,对于不同的细胞类型,在不同的条件下都有一套转录本。因此,基于微阵列的基因表达数据存储量是非常大的,对于具有20000个探针的微阵列实验,以10um的分辨率扫描,产生3千万个离 数据点,如果以tiff文件贮存,将占用~60Mb的硬盘空间。

    上一页下一页

  • 下载地址 (推荐使用迅雷下载地址,速度快,支持断点续传)
  • 免费下载 DOC格式下载
  • 您可能感兴趣的
  • spss显著性分析  spss差异显著性分析  excel差异显著性分析  excel显著性分析  spss显著性分析步骤  origin显著性分析  dps显著性分析  graphpad显著性分析  显著性分析方法  spss显著性分析标星号