Win下填坑实录

Date Tags python

虽然大部分工作都挪到了*nix下面,但是偶尔还是在win下动动手,于是问题就来了。下面是填坑实录:

回车键

众所周知,win的换行用的是回车加换行\r\n,而不是单纯的换行符\n,所以一般从win下复制到linux的文件,一般会先消灭下\r, 比如sed -i 's/\r//g ' *之类。 替换完了换成vi看一眼,有没有^M之类的刺眼字符,没有就OK。有的话vi下面还是:%s/\r//g, 全局替换下就好。

然而惨痛的就是I thought I have finished that but...。这个\r还是曾经出现在我的gff、fasta等等文件中。 而且最悲催的是对于这个东西,使用lesshead, tail之类在CLI里面是完全显示不出来的 ...

more ...

关于"全栈NGS"员工的讨论和思考

昨天吃饭时候和实验室人闲聊,扯到一个问题,就是 有没可能一个人把NGS(RNA-seq/DNA-seq/ChIP-seq)从做实验到分析数据,再到写文章一个人全干了呢?

当时是没想太多,但是越想越觉得这个问题其实是很现实的问题,牵扯的是在一个传统生物实验室中,实验和生信两拨人怎么合作,怎么判断贡献的问题。

由于我也算是实验转生信的,对两部分的认识应该是偏颇比较少的。

简单的列一下实验和生物信息需要的技能知识如下:

实验部分

按照步骤顺序应该是:

1. 核酸提取。

  • 对于RNA和DNA的测序来说,这部分实在简单不止一晒,分子生物学入门实验。当然,依然需要牢记分子生物第二常识:“Protocol几乎总是对的,但是它不会强调它在什么情况下是对的”。 这里面坑也很多,比如某些文库需要的长链DNA怎么回收比较好之类的细节,需要领域专门知识才能解决。
  • ChIP-seq会麻烦一点,它要求你至少能做ChIP(染色质免疫沉淀),并且会做像样的质控 (阳性对照阴性对照都跑好了才敢上机啊)。可以算是有一个小门槛。

2. 文库的制备

  • 首先这些东西全都得按kit来,所以其实最需要的是阅读说明书的能力。
  • DNA文库没有反转录, Illumina的Trueseq、Nextera用的很多,NEB、罗氏、kapa之类的也能用,大同小异。
  • RNA文库可能多出一步反转录, 还有一步是mRNA的富集或者是rRNA的去除 ...
more ...

R packages 新书 PDF自行编译 (ubuntu 14.04)

Date Tags R

前段日子Hadley Wickham的新书 'R packages'也算是上线了,美亚有售实体版

不过本书的所有资源包括原文和代码都可以在github以及网站上找到,所以其实是开源的。

网页版本很漂亮读起来也很不错甚至可以本地编译网站(Ruby based),但是我辈diaosi还是想看pdf。

Hadley其实写了build-book.r,只要有R和LaTeX就可以生成pdf,步骤简介如下(看了Brett Klamer的blog, 一路走下来,果断没成...稍微改了下步骤):

1. 下载

git clone https://github.com/hadley/r-pkgs/

可以看到/book/目录下的build-book.r, 里面需要载入rmarkdown和bookdown两个library.所以下载之.

2. devtool安装rmarkdown和bookdown

install.packages("devtools") # 先装devtools
devtools::install_github ...
more ...

使用pelican搭建基于git的静态博客

Date Tags python

缘由

最终还是决定把博客挪到github上, 因为还是要用win, endnote重度依赖是一方面.处理"excel达人"遗留的神奇宏绘图是另一方面. 所以不得不在win下配好pelican.

最小环境配置

  • git必装, github选装, 如果装了github, 那么win下的gitbash还算功能不错, git自带的那个bash实在是不甚好用
  • python环境,我是python2.7.10
  • pip一定要配好
  • 用不用virtualenv全看个人喜好
  • GNU make for win, 稍微有点麻烦,装好了还得记得加环境变量.
  • 写markdown的编辑器得有个,我现在拿sublime写,开着vim model(就是大家说的真-神经病模式). 但是说实话win下gvim太难用了, 不算是真正能投入使用的工具, 没有偏爱的文本编辑器的话, notepad其实也可一用.

装装装

pip install pelican
pip install markdown

建个文件夹比如d:/blog之类的,进去,开cmd

pelican-quickstart

一路回车下来, 这些问题其实是回答pelicanconf.py的一些参数 ...

more ...