找回密码
 立即注册
查看: 977|回复: 20

qPCR数据处理, 一键出图

[复制链接]
发表于 2021-12-7 14:08 | 显示全部楼层 |阅读模式
今天,我们来介绍一下qPCR的数据处理。
---

在同学(zi)的(ji)强(xian)烈(de)要(mei)求(shi)下,我的qPCR数据处理小程序,不仅拥有了自动添加误差线的功能,还能自动进行T-test 假设检验,一键出图,大家感受一下,一键出图的魅力。



<hr/>qPCR是什么操作

qPCR这项技术,被广泛用于生物学的研究,只有有以下用途:

  • DNA 定量
  • RNA 定量
  • Genotyping (设计特性型基因探针,通过荧光判断基因型)




qPCR作为一种DNA定量手段,一般情况下, 还可以分为绝对定量和相对定量。

  • 绝对定量 是通过利用已知浓度的DNA样本绘制标准曲线,然后得到未知样的DNA含量
  • 相对定量 是通过与管家基因的比较得到相对的基因表达值

好的, 那么一般情况下, 我见过比较多的qPCR,都是以RNA相对定量为目的的,也是本文讨论的焦点。
<hr/>qPCR怎么个q法

qPCR和PCR一看名字就知道很像,q就是quantitative的意思,quantitative就是定量的意思。。。(为我的废话鼓掌)
那么, 怎么通过qPCR定量呢?
其实,说到底,qPCR就是通过荧光染料或者荧光探针来表征PCR产物的量,进而推断出PCR前,样本的初始核酸量。
具体原理是,对于不同的样本和基因,比较到达一定荧光强度所需要的循环数, 如果你的样本中DNA1的量大于DNA2的量,那么理论上, DNA1比DNA2需要更少次数的PCR扩增就可以达到某一个阈值.


想情况下,比如你的样本中DNA1有32条,DNA2有8条,那么我们如果设置阈值在1024条,那么DNA1需要5次循环, DNA2需要7次才能到达,也就是说相差两次循环,一次循环是翻一番,两次就是4倍,这样我们就知道了 DNA1的量为DNA2的两倍 这就是相对定量

如果对于详细原理有什么执念的同学可以自行百度,必应,谷歌。。。
<hr/>如何计算


在实际实验过程中, 我们的实验没那么简单
一个例子:
我用某一药物处理了细胞,我想知道该处理对细胞内geneA的转录水平的影响。
那么我们一般这样做,有处理和未处理的细胞,我们想比较这两种细胞内geneA表达量的差异。我们在提取细胞的RNA并定量后反转成cDNA后,进行qPCR, 获得geneA和某一个内参基因(如GAPDH)的CT值。
内参基因GAPDH在这里起到一个矫正的效果来去除不同的样品间RNA产量,RNA质量以及逆转录效率上的差别。
最最最常用的qPCR相对定量的方法是 ΔΔCT 法 (读作:delta delta CT)
公式如下

  • ΔCT = CT(target gene)  CT(reference gene).
  • ΔΔCT = ΔCT(target sample)  ΔCT(reference sample)
即先用内参基因校准,再算样品与对照组间的差异,而我们的表达量的差异就可以表征为



虽然大多数qPCR设备(Roche, ABI云云)都配有很完备的分析软件,但是。。。
这些软件的图可能不适合直接放文章,或者, 咳咳,很丑,你想自己修改之类的
而他们一般都不太提供最终计算结果,只提供CT值,那么这个就很让人头大了。




于是乎,秉承着 自己动手丰衣足食 一直折腾一直爽的传统美德,我写了一个小小的工具,方便大家计算最终的相对表达量
该工具基于微软爸爸的EXCEL和VBA,不限样本数量,基因数量及每组实验的平行个数(如果你有三个复孔,其中一个如果CT和其他两个差别很大,你可以删除该孔,有些组3个复孔,有些2个,不影响程序运行),现在,该程序不仅拥有了自动添加误差线的功能,还能自动进行T-test 假设检验,一键出图,欢迎大家体验!
成热打铁,这里介绍一下用法
软件数据格式

数据分析,就和做菜一样,巧妇难为无米之炊,不仅如此,这米烂了也不行。所有的数据分析,无论是计算还是作图,数据格式都是关键。合适的数据格式才能清楚、高效、准确的表达数据。
我相信,大家很多时候做qPCR的时候,表格格式是这样的:


但是,这样会面临非常大的问题,就是实验平行怎么放?
如果你一定要放,平行自然可以放进去,比如三个平行可以并排横着或者竖着放进 ...的位置。
但是,这样格式的数据,限制很大, 比如

你可以很方便的求出平均值吗?

如果你使用公式计算,怎么兼容不同平行个数的情况?

如果你的样本有好几个水平的处理,又要怎么表示?
结果,许多同学的表格就成了这样:
为了表示某实验用了4种质粒,分别做了三种处理,每种处理要测三个基因,每个基因三个平行(图中的一个单元格...,实际是三个单元格,一组平行,我偷个懒)


不夸张的说,我见过太多这样的表了。除了看起来好理解一些,数据处理时灵活性和表达能力上欠缺很多。
那要怎么才能清楚、高效,准确的表达数据呢?

其实很简单,我称之为标签化。
什么叫标签化,其实很简单,就是通过对每一个数值附加标签的方式来标注信息。这样数据就是一条一条的了,一条就是一个值和这个值的几个标签
比如,我有一次实验,有2个样本,3个基因,4个平行,也就是我最后的Ct值有2x3x4 = 24个值,我们给这24个值贴标签,每个值有两个标签,分别是对应的样本和所检测的基因。如图:


注意,qPCR技术相对定量计算中,因为我们不区分平行,所以这里不标。
我再举个例子:(就那用上面的例子,四种质粒,三种处理,三个平行)


我们使用一列记录Ct值,一列记录基因,一列记录处理条件,还有一列记录质粒等。
大家可以看到,这种方法下数据由宽变长,所以这种数据格式也叫长数据格式,利用这个原理,可以对每个孔添加非常多列的信息。
那么,我说了那么多,他有哪些好处呢?

  • 这样的数据格式支持无限维度或者非常复杂的的数据,而不像之前只能表示样本基因两个维度
  • 这样的数据,利用Excel的pivot table可以几秒计算每个分组的均值,方差等
  • 这样的数据在主流数据编程语言中做统计和作图都无比方便,有时这种格式是必须的(ggplot2)
  • 最最重要,绝大多数的qPCR机器,ABI或者Roche,导出的数据都是这种格式,这就意味着,在使用我的程序时,你导出数据后Ctrl C + V就完事了。
软件统计计算

来到了愉快的一键出图的环节了,不过在开始计算之前,还需要再做一件事,那就是指定内参基因和对照组。本次更新就非常人性化地自动统计了数据表中的基因和样本,无需手动输入,只需要在下拉选择框中点选就可以啦,从此避免了输错的可能。
然后,轻轻按下计算键!



本程序对基因和样本不做任何限制,你可以任意名字,任意数量,任意平行,甚至某些分组三个平行,某些两个平行(有时点样失误,删除单个孔)都不受影响,这就是标签化的数据格式带来的便利!

另外,该程序不仅可以计算相对表达量(2^-ddCt法),还自动出图,自动添加误差线,自动进行T-test计算p值。除此之外,获得相对表达量值之后呢,你也可以使用origin或者graphpad等工具作图,读者可以查看我往期关于origin的文章哦!! 文章直通车>>> origin科研作图
有了它,真正让少儿科研成为可能,小学生也可以做qPCR数据分析啦!
心动了吗?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
发表于 2021-12-7 14:13 | 显示全部楼层
这个程序哪里可以获得呢?
发表于 2021-12-7 14:21 | 显示全部楼层
同求小程序
发表于 2021-12-7 14:25 | 显示全部楼层
该文章转自wechat-official-account 小魔方 sCube,工具在那里可以找到
发表于 2021-12-7 14:35 | 显示全部楼层
这是一个公众号吗
发表于 2021-12-7 14:40 | 显示全部楼层
 楼主| 发表于 2021-12-7 14:47 | 显示全部楼层
为啥我用这个程序算到的对照组的表达均值不是1而是1.088这样的数呢?
发表于 2021-12-7 14:51 | 显示全部楼层
作者,你的表是四个复孔,我是3个复孔,把你的表修改了之后有些公式错误了[大哭]
发表于 2021-12-7 14:54 | 显示全部楼层
你好 我这个工具对复孔没要求,几个复孔都可以,填完按一下重新计算
发表于 2021-12-7 15:01 | 显示全部楼层
因为你的对照的平均值为一,对照的单个孔不是1哦
懒得打字嘛,点击右侧快捷回复 【右侧内容,后台自定义】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Unity开发者联盟 ( 粤ICP备20003399号 )

GMT+8, 2025-5-15 04:40 , Processed in 0.142245 second(s), 26 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表