研究兴趣一:基因组测序数据压缩
基因组测序数据呈爆炸式增长,FASTQ是高通量基因组测序数据的主流格式,但文档冗余性极大,其存储、分析和传输的成本高昂。现有压缩工具可减小FASTQ数据体积,却需要解压缩整个文档才能指定read和序列位置进行测序数据查询。我们致力于研究:将测序数据转换为灰度图像、基于提出的图像区块编码模型来实现测序数据的有效压缩及二维随机访问的新型方法。
研究兴趣二:纳米抗体-抗原复合物结构预测
纳米抗体的体积为传统抗体大小的十分之一,具有比传统抗体更好的治疗特性,已成为生物医药与临床诊断试剂中的新兴力量。纳米抗体-抗原结合后复合物的结构测定,对于筛选高亲和力的纳米抗体具有重要意义。传统的通过免疫学实验测定三维结构的方式,实验成本高且步骤繁琐。我们致力于研究:收集纳米抗体-抗原复合物的序列和结构数据,进行数据清洗、存储、序列特征化及结构标注;构建准确预测纳米抗体-抗原复合物三维结构的模型和算法,应用于针对抗原靶标的高亲和力纳米抗体的虚拟筛选及理性改造。
研究兴趣三:噬菌体-宿主相互作用预测
噬菌体疗法成为最有前途替代抗生素的方法之一。而噬菌体疗法的关键是将目标细菌宿主与相应的治疗性噬菌体正确匹配。传统噬菌体筛选方法效率低且耗时长。需要预测噬菌体和目标细菌宿主之间相互作用的计算方法,快速筛选出具有针对性的噬菌体。我们致力于研究:基于PhagesDB和GenBank数据库中的噬菌体-宿主的基因组序列及相互作用数据构建预测模型;使用纳米孔测序仪MinION对噬菌体和大肠杆菌样本进行基因组测序;预测噬菌体和大肠杆菌之间的相互作用。