专栏名称: 生信札记
记录和分享生信学习经验和数据处理技巧
分享
今天看啥  ›  专栏  ›  生信札记

热图,还还只会用方格子?@所有人,论文热图升阶的时候到了!

生信札记  · 公众号  ·  · 2020-02-06 19:59

增加你论文送审和发表机会的,至少有两个办法:
1. 富有逻辑的行文
2. 要你好看的图表
-- CJ

隐约感觉到有些事情需要去做,比如去投几个一区文章试试,以免被误认为我是做生信的。其实,我是做生物的。接下来的侧重点应该要转移到学术成果的积累和发表上。在此之前,我推出TBtools的这一个功能,并奢望,这篇推文和这个功能将会改变一些人对热图的认知和绘制技能,进而使其发表论文的档次得到提升

写在前面

硕士在华南农大何业华教授课题组下学习,毛师兄带我一起采集了菠萝不同组织的样品,并测定了其果实不同器官/组织的转录组。基于这些数据,我们构建了一个Pineapple eFP Browser。数据库在多年前就搭建完成,而相关论文在去年年底才见刊(我也蹭了一个共一,毕竟只是当时兴趣所在,做了数据库搭建的工作)。一段令人怀念的日子。年轻,总是资本。

eFP Browser,可以说是,基因表达量探索的神器。当我们观察基因表达量时,如果只是普通的矩阵热图,如

那么人类,不可避免地在大脑中需要做文字到实际样品的转换,这本身就是一个耗能的操作,尤其是....同时展示上十个样品时。
相反,卡通图片上展示基因的表达量信息,有一种straight forward的感觉。不仅可以节约我们的能量,还常常让我们快速筛选或发现一些有趣的基因表达现象。
但可惜的是,eFP Browser作为一个网页数据库,要求使用者具备良好的计算机和网站搭建基础。当初我搭建时应是花费了数天,主要在于解决环境依赖,以及修改一些网站原始脚本使其能正常运行(注意!只是正常运行)。
从某个角度来说,我觉得这个基因表达量展示方式之所以没有太多人使用,最主要的原因是,对用户的要求太高
我早已看它不顺眼。前日,在
博士课题组(华南农大夏瑞教授)讨论到实验室正在开展的课题是,又再次翻到这个图片。于是,趁着周末,我想想,也是时候结束这段nie缘!

Fancy HeatMap Browser in TBtools

我在TBtools中增加了一个功能,可以让所有人在短时间内完成图片/数据库的搭建


如图,


  1. 左下角,TBtools中Super HeatMap Browser功能主界面(下文详细介绍)

  2. 左上角,当没有输入任何基因ID时,默认的图片

  3. 中上,输入Unigene1时,图片着色为对应基因的表达量热图

  4. 右上,输入Unigene2时,图片着色为对应基因的表达量热图

  5. 中右,用于输入的表达量矩阵内容截图(其实就是普通的FPKM矩阵或者其他数值矩阵,比如你可以输入代谢物含量?糖分含量?....)

  6. 中下,浏览器所需的三个输入文件

整体上,任何物种,任何实验,任何人使用这个浏览器,只需要准备三个文件:

  • TGA图片文件(下文详细介绍制备,一次制备,永久复用,太简单)

  • ColorCode.xls 文本文件(同上,更简单)

  • 数值矩阵,文本文件(这个与Amazing Heatmap的数据矩阵类似,一般用户自己都有)....

制备TGA图片文件

文件的制备,推荐使用PhotoshopAdobe IllustratorCorel Draw等图片或者矢量图编辑器。整体上,只需要遵从一个逻辑
一个样品/组织有且仅有一个R,G,B值或者颜色。【注意,有且仅有】

一个最简单的TGA图片制备示例

打开Adobe Illustrator,并新建一个画板

我们用三个不规则图形代表地三个不同的Stages

两三分钟搞定,随后,注意了,三个Stages对应三个样品,所以每一个样品必须有不同的R,G,B值(而且,必须只有一个RGB值)

搞定,我着色为三个不同的颜色,随后关键步骤(在AI中,CDR或者PS估计不需要),全选所有元件,栅格化

注意,不要消除锯齿,如果栅格化后不好看,考虑回去加粗线条,或者去除线条

最后保存图片



注意,必须是24位或者更低....


基本搞定,得到图片SampleTGA.tga。但是,具体图片是否可以使用,那么需要下一步操作验证

ColorCode文件的制备

一个TGA文件是否适合Fancy Heatmap Browser,可以在这一步检测。
首先,打开TBtools对应的功能

随后,设置输入和输出文件

点击Start可获得,两个文件,分别是.xls文件和.png图片

打开两个文件

可以注意到,左侧是ColorCode的颜色,右侧是对应的ColorCode的R,G,B值。以下,左侧为正常导出,可以看出获取到的颜色代码与实际图片的颜色代码数目接近;右侧则明显是消除了锯齿,图片无法使用。

【注:事实上,Photoshop应该也有类似的问题,注意栅格化,不要消除锯齿,最后导出即是】

基于ColorCode.png,我们就可以开始编辑Sample2ColorCode.tab.xls。操作很简单,对应原始图片的颜色,我们按照我们样品信息(即表达量矩阵或者样品名,标注上去即可)


使用Fancy HeatMap Browser

首先,需要确保....每个人都有的数值矩阵,或者说表达量矩阵。

打开TBtools对应的功能

导入三个文件

点击Start之后即可看到

随后在上方输入框,输入对应的基因ID,比如Unigene_6,随后回车即可。

于是得到上述热图,注意,这个热图存在较多参数可以调整,具体参考Amazing Heatmap...

如何快速制作一个物种或实验相关的TGA文件

正如推文最初的图片,看起来似乎是比较复杂的菠萝不同组织的图片。快速制备课题或者实验对应的图片有两种主要方式:

  1. 直接手动画(个人建议,手画然后扫描,最后识别笔记,并用PS或者AI填充颜色即可)

  2. 找已有的照片或者别人的模式图,使用钢笔工具描,最后上色

使用锚点控制工具,调整前面描的锚点位置,以符合需求

大体调整之后

上色,搞定....

全部图形按照这个操作,即可获得矢量图,最后自己导出TGA即可。

进阶

事实上,前述制备ColorCode的时候,需要用到TBtools的一个功能。如果你明白ColorCodeFile的作用,那么其实完全可以自己手动制备(比如上述苹果图片,我们并不想去除背景...),那么此时,你只需要知道三个颜色代码,直接制备ColorCodeFile,就可以用于Fancy Heatmap Browser,如下


有这些信息,那么就可以手动直接制备ColorCode文件,如下

可以试一下这个...

正常Work!

写在最后

嗯。这也算是完成一件多年前认为自己有能力完成但需要耗费很多时间的事情。以现在的状态,完成这个事情,似乎是轻而易举。

优秀,属于你们,而与我无关。
所以,
软件使用的问题,也属于你们,更与我无关。
与我有关的是,我的生活,与我的科研。
写软件并分享出来,可能我的最低诉求是别人尊重我的时间。
不少朋友建议我对软件进行收费,这不是我开发TBtools的初衷,所以我并不想这么操作;但我保留所有权益。
希望对TBtools有过多奢求或者对我个人有义务式要求的朋友,还是出门,左右随意,毕竟那是你的生活与选择。

对于确实对TBtools感兴趣的朋友,欢迎加入TBtools使用交流群-3

我是一个俗人,不介意任何人通过物质的方式(比如微信啊,支付宝啊,银行卡转账)来支持我(但所有的支持,应都是一种赠予而不是交换,所以请不要随意给我转账)。

最后呢,
我的追求是不会变的,出发点也没变过。
所以呢,
祝大家科研顺利!

我更不介意任何人,从行动上支持我

  1. 点“在看”,推荐给你身边的人

  2. 转发朋友圈,推荐给你朋友

  3. 点击广告,带公众号流量



今天看啥 -
本文地址:http://www.jintiankansha.me/t/guwTrwbnG5