首页丁香园病例库全部版块

我的关注

没有关注版块，去热门逛逛吧

热门

热门

心情驿站35 条热帖，今日新增 5 条

行业动态16 条热帖已更新

危重急救15 条热帖，今日新增 1 条

修复重建和烧伤整形12 条热帖，今日新增 1 条

皮肤性病12 条热帖，今日新增 2 条

普通外科10 条热帖，今日新增 1 条

消化内科8 条热帖，今日新增 1 条

泌尿外科7 条热帖，今日新增 2 条

妇产5 条热帖已更新

心血管4 条热帖，今日新增 2 条

临床内科

临床内科

心血管4 条热帖，今日新增 2 条

呼吸胸外2 条热帖已更新

神经内外最近热帖已更新

肿瘤医学最近热帖已更新

内分泌最近热帖已更新

肾脏内科1 条热帖，今日新增 1 条

精神心理最近热帖已更新

风湿免疫最近热帖已更新

血液病最近热帖已更新

消化内科8 条热帖，今日新增 1 条

感染最近热帖已更新

临床外科

临床外科

心血管4 条热帖，今日新增 2 条

呼吸胸外2 条热帖已更新

神经内外最近热帖已更新

肿瘤医学最近热帖已更新

泌尿外科7 条热帖，今日新增 2 条

普通外科10 条热帖，今日新增 1 条

修复重建和烧伤整形12 条热帖，今日新增 1 条

耳鼻咽喉头颈外科最近热帖已更新

骨科4 条热帖，今日新增 2 条

临床妇儿

临床妇儿

妇产5 条热帖已更新

儿科最近热帖已更新

临床其他

临床其他

危重急救15 条热帖，今日新增 1 条

影像核医学2 条热帖，今日新增 1 条

中医最近热帖已更新

皮肤性病12 条热帖，今日新增 2 条

临床检验最近热帖已更新

超声医学1 条热帖已更新

麻醉疼痛1 条热帖已更新

康复医学最近热帖已更新

护理最近热帖已更新

社区全科最近热帖已更新

临床病理1 条热帖已更新

口腔1 条热帖已更新

眼科4 条热帖，今日新增 1 条

公共卫生最近热帖已更新

考试深造

考试深造

论文写作最近热帖已更新论文写作投稿统计与作图医学英语基金申报开题

本科考研1 条热帖已更新考研本科教育

考博留学1 条热帖已更新考博留学考试

执业考试最近热帖已更新

规培4 条热帖已更新

职称晋升3 条热帖，今日新增 1 条

行业讨论

行业讨论

行业动态16 条热帖已更新

求职职场2 条热帖已更新

心情驿站35 条热帖，今日新增 5 条

科研医药

科研医药

基础科研细胞生物与生物信息微生物与免疫实验动物与生化组胚细胞技术与形态遗传核酸基因技术蛋白质和糖学实验室建设与采购

医药研发与应用最近热帖已更新合理用药新药信息药理及临床试验药物化学分析技术制剂技术生物制药

其他

其他

学习交流互助专区

更多内容

常用

登录

丁香园社区细胞生物与生物信息帖子详情

求助一perl程序

最后编辑于 2022-10-09 · IP 上海上海

929 浏览

这个帖子发布于 19 年零 209 天前，其中的信息可能已发生改变或有所发展。

我现在有20组cDNA序列(每组4~20个)
每组序列想经过如下处理:
1.翻译成protein
2.align protein序列
3.删除gap
4.将protein还原为DNA
处理的目的:用PAML的codeml找正选择位点
发现 http://bioperl.org/HOWTOs/html/PAML.html 上部分模块可是实现这个功能,如下:
use Bio::Tools::Run::Alignment::Clustalw;

# for projecting alignments from protein to R/DNA space
use Bio::Align::Utilities qw(aa_to_dna_aln);

# for input of the sequence data
use Bio::SeqIO;
use Bio::AlignIO;

my $aln_factory = new Bio::Tools::Run::Alignment::Clustalw();

my $seqdata = 'cdna.fa';

my $seqio = new Bio::SeqIO(-file => $seqdata,
-format => 'fasta');
my %seqs;
my @prots;
# process each sequence
while ( my $seq = $seqio->next_seq ) {
$seqs{$seq->display_id} = $seq;
# translate them into protein
my $protein = $seq->translate();
my $pseq = $protein->seq();
if( $pseq =~ /\*/ &&
  $pseq !~ /\*$/ ) {
  warn("provided a cDNA sequence with a stop codon, PAML will choke!");
  exit(0);
}
# Tcoffee can't handle '*' even if it is trailing
$pseq =~ s/\*//g;
$protein->seq($pseq);
push @prots, $protein;
}

if( @prots < 2 ) {
warn("Need at least 2 cDNA sequences to proceed");
exit(0);
}

open(OUT, ">align_output.txt") ||
die("cannot open output $output for writing");
# Align the sequences with clustalw
my $aa_aln = $aln_factory->align(\@prots);
# project the protein alignment back to cDNA coordinates
my $dna_aln = &aa_to_dna_aln($aa_aln, \%seqs);
my @each = $dna_aln->each_seq();
......
运行到my $dna_aln = &aa_to_dna_aln($aa_aln, \%seqs);这一行老是报错(见图),请问这个问题怎么解决,而且怎么将删除gap后的DNA序列读到输出中?

2 1 点赞

默认最新

2

分享帖子

分享到微博

分享到微信

认证

医师认证达人申请

返回顶部