Ubuntu对RNA-seq测序数据进行处理

大数据处理新手,第一次尝试进行数据处理。
之前没有用过Linux,参照Win10系统上直接使用linux子系统教程(仅需五步!超简单,快速上手)这篇文章进行了Windows terminal和Ubuntu的安装,非常方便。

简单记录一下这次遇到的一些问题和解决方法

(1)创建小环境报错,按之前的解决办法尝试修改.condarc,再次报错:CondaHTTPError
怀疑是因为小环境重名,尝试重新命名小环境为srna
等待过程中检查上次报错信息发现:HTTP errors are often intermittent, and a simple retry will get you on your way.网络连接问题是间断出现的,可以继续重新尝试创建小环境。

改用conda create -n rna python=3后成功创建小环境并安装python3

**(2)安装软件报错:**网络问题。感觉是玄学,多试几次。
删了一个报错的channel,加了一个中科大的channel。还是玄学,时行时不行的,随缘吧。
参考链接:
【1】增加中科大channel
【2】remove命令和show命令的使用(场景conda删除channel )

(3)安装完成后,检查安装是否成功–help出现command not found,尝试重新下载提示已下载成功。
再次尝试报错:samtools: error while loading shared libraries: libcrypto.so.1.0.0: cannot open shared object file: No such file or directory
再次尝试:输入sudo su后切换到root,https://blog.csdn.net/github_38336924/article/details/82692075切换回普通用户依然报错
尝试卸载重装,发现重新切回普通用户后没有显示路径只有一个~,害怕。重启后又回来了。
暂时放弃尝试,先开始处理。
备选方案:sudo ln -s /usr/lib64/libtinfo.so.6.1 /usr/lib64/libtinfo.so.5

(4)fastq-dump无法打开sra文件,怀疑是因为之前下载有误,下载得到的文件为3.46G,而官网显示为3.47G。删除后重新下载。
折腾了几个小时发现是因为文件名中不包含.sra,而我一直试图打开一个.sra文件,无语了

(5)gzip解压缩失败:
gzip: stdin: unexpected end of file
tar: Unexpected EOF in archive
tar: Unexpected EOF in archive
tar: Error is not recoverable: exiting now
网上搜索后发现原因可能是该源码包在下载过程中被破坏。
重新自查后发现是因为之前用wget命令下到一半的文件没有删掉,而且用其它下载软件下载好的文件放的目录位置不对,应该放在新建的index目录下,但是直接放在了主文件目录下。
修改路径后解压成功。

(6) 开始比对得到SAM过程中,电脑处理非常缓慢,30h+仍未完成,并出现灰屏现象。
强制重启后重新进行,希望可以快一点比对好…

(7)换了台电脑。
比对出现花屏:可能是路径问题。将生成的SAM文件存储位置设置为与两个fq文件相同的路径,顺利进行中。(18:18开始)(15分钟左右运行成功结束)

(8)使用featureCounts进行基因表达水平分析,报错:
buffer overflow detected : terminated
Aborted (core dumped)
尝试:
(1)重启Ubuntu后仍然有相同报错;
(2)网上搜索后,发现应该是缓存空间不够,重启电脑试试。
重启电脑后成功运行。

终于做完了,总结一下,做大数据处理,有一台空间够并且处理速度够的电脑真的很重要。换了一台电脑连安装包什么的都不报错了,基本上畅通无阻地做完了作业,ε=(´ο`*)))


版权声明:本文为weixin_44810165原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。