【送料無料 プジョー3008】 DUNLOP ダンロップ ウィンターMAXX 02 225/60R17 17インチ スタッドレスタイヤ ホイール4本セット 輸入車 EUROTECH ユーロテック ガヤ5(グロスブラック) 7J 7.00-17【DU17win】


 >  > 【送料無料 プジョー3008】 DUNLOP ダンロップ ウィンターMAXX 02 225/60R17 17インチ スタッドレスタイヤ ホイール4本セット 輸入車 EUROTECH ユーロテック ガヤ5(グロスブラック) 7J 7.00-17【DU17win】

ダンロップ 02 スタッドレスタイヤ 17インチ 7J 【送料無料 DUNLOP 7.00-17【DU17win】 プジョー3008】 ウィンターMAXX ホイール4本セット ユーロテック ガヤ5(グロスブラック) 225/60R17 DUNLOP EUROTECH 輸入車 ユーロテック

【送料無料 プジョー3008】 DUNLOP NEXTRY/SNEAKER ダンロップ ウィンターMAXX 02 225/60R17 17インチ スタッドレスタイヤ ホイール4本セット 輸入車 EUROTECH ユーロテック プロμ ガヤ5(グロスブラック) 7J 7.00-17【DU17win】

Pythonでオープンリーディングフレームを見つける方法

時間 2019-03-05 ラベル
私はPythonと正規表現を使ってORF(オープンリーディングフレーム)を見つけています。

次のようなATGC(スペースや改行なし)のみで構成されているストリングであるサブストリングを見つけます。

ATGで始まり、TAG、TAA、またはTGAで終わるので、最初の文字、次に2番目、3番目の順序でシーケンスを考慮する必要があります ダムド LAND CRUISER ZX URJ202W オーバーフェンダー 塗装済 ホワイトパールクリスタルシャイン。

Seq= "CCTCAGCGAGGACAGCAAGGGACTAGCCAGGAGGGAGAACAGAAACTCCAGAACATCTTGGAAATAGCTCCCAGAAAAGC
AAGCAGCCAACCAGGCAGGTTCTGTCCCTTTCACTCACTGGCCCAAGGCGCCACATCTCCCTCCAGAAAAGACACCATGA
GCACAGAAAGCATGATCCGCGACGTGGAACTGGCAGAAGAGGCACTCCCCCAAAAGATGGGGGGCTTCCAGAACTCCAGG
CGGTGCCTATGTCTCAGCCTCTTCTCATTCCTGCTTGTGGCAGGGGCCACCACGCTCTTCTGTCTACTGAACTTCGGGGT
GATCGGTCCCCAAAGGGATGAGAAGTTCCCAAATGGCCTCCCTCTCATCAGTTCTATGGCCCAGACCCTCACACTCAGAT
CATCTTCTCAAAATTCGAGTGACAAGCCTGTAGCCCACGTCGTAGCAAACCACCAAGTGGAGGAGCAGCTGGAGTGGCTG
AGCCAGCGCGCCAACGCCCTCCTGGCCAACGGCATGGATCTCAAAGACAACCAACTAGTGGTGCCAGCCGATGGGTTGTA
CCTTGTCTACTCCCAGGTTCTCTTCAAGGGACAAGGCTGCCCCGACTACGTGCTCCTCACCCACACCGTCAGCCGATTTG
CTATCTCATACCAGGAGAAAGTCAACCTCCTCTCTGCCGTCAAGAGCCCCTGCCCCAAGGACACCCCTGAGGGGGCTGAG
CTCAAACCCTGGTATGAGCCCATATACCTGGGAGGAGTCTTCCAGCTGGAGAAGGGGGACCAACTCAGCGCTGAGGTCAA
TCTGCCCAAGTACTTAGACTTTGCGGAGTCCGGGCAGGTCTACTTTGGAGTCATTGCTCTGTGAAGGGAATGGGTGTTCA
TCCATTCTCTACCCAGCCCCCACTCTGACCCCTTTACTCTGACCCCTTTATTGTCTACTCCTCAGAGCCCCCAGTCTGTA
TCCTTCTAACTTAGAAAGGGGATTATGGCTCAGGGTCCAACTCTGTGCTCAGAGCTTTCAACAACTACTCAGAAACACAA
GATGCTGGGACAGTGACCTGGACTGTGGGCCTCTCATGCACCACCATCAAGGACTCAAATGGGCTTTCCGAATTCACTGG
AGCCTCGAATGTCCATTCCTGAGTTCTGCAAAGGGAGAGTGGTCAGGTTGCCTCTGTCTCAGAATGAGGCTGGATAAGAT
CTCAGGCCTTCCTACCTTCAGACCTTTCCAGATTCTTCCCTGAGGTGCAATGCACAGCCTTCCTCACAGAGCCAGCCCCC
CTCTATTTATATTTGCACTTATTATTTATTATTTATTTATTATTTATTTATTTGCTTATGAATGTATTTATTTGGAAGGC
CGGGGTGTCCTGGAGGACCCAGTGTGGGAAGCTGTCTTCAGACAGACATGTTTTCTGTGAAAACGGAGCTGAGCTGTCCC
CACCTGGCCTCTCTACCTTGTTGCCTCCTCTTTTGCTTATGTTTAAAACAAAATATTTATCTAACCCAATTGTCTTAATA
ACGCTGATTTGGTGACCAGGCTGTCGCTACATCACTGAACCTCTGCTCCCCACGGGAGCCGTGACTGTAATCGCCCTACG
GGTCATTGAGAGAAATAA"

私が試したこと:

# finding the stop codon here 
def stop_codon(seq_0):
 for i in range(0,len(seq_0),3):
 if (seq_0[i:i+3]== "TAA" and i%3==0) or (seq_0[i:i+3]== "TAG" and i%3==0) or (seq_0[i:i+3]== "TGA" and i%3==0) :
 a =i+3
 break
 else:
 a = None
# finding the start codon here 
startcodon_find =[m.start() for m in re.finditer('ATG', seq_0)]

開始コドンをチェックしてから最初の終止コドンを見つける方法を見つけるにはどうすればよいですか。続いて次の開始コドンと次の終止コドンを見つける。

これを3フレーム実行したいです。前述したように、3つのフレームはシーケンスの最初、2番目、3番目の文字を開始として考慮します 。

また、シーケンスは3の小さな部分に分割する必要があります。

ATG TTT AAA ACA AAA TAT TTA TCT AAC CCA ATT GTC TTA ATA ACG CTG ATT TGA

任意の助けをいただければ幸いです。

私の最後の答え:

def orf_find(st0):
 seq_0=""
 for i in range(0,len(st0),3):
 if len(st0[i:i+3])==3:
 seq_0 = seq_0 + st0[i:i+3]+ " "
 ms_1 =[m.start() for m in re.finditer('ATG', seq_0)]
 ms_2 =[m.start() for m in re.finditer('(TAA)|(TAG)|(TGA)', seq_0)]
 def get_next(arr,value):
 for a in arr:
 if a > value:
 return a
 return -1
 codons = []
 start_codon=ms_1[0]
 while (True):
 stop_codon = get_next(ms_2,start_codon)
 if stop_codon == -1:
 break
 codons.append((start_codon,stop_codon))
 start_codon = get_next(ms_1,stop_codon)
 if start_codon==-1:
 break
 max_val = 0
 selected_tupple = ()
 for i in codons:
 k=i[1]-i[0]
 if k > max_val:
 max_val = k
 selected_tupple = i
 print "selected tupple is ", selected_tupple
 final_seq=seq_0[selected_tupple[0]:selected_tupple[1]+3]
 print final_seq
 print "The longest orf length is " + str(max_val)
output_file = open('Longorf.txt','w')
output_file.write(str(orf_find(st0)))
output_file.close()

上記の書き込み機能は、テキストファイルに内容を書き込むのに役立ちません DUNLOP ダンロップ エナセーブ RV504 ENASAVE ミニバン サマータイヤ 215/45R17 RAYS FDX-F7 デイトナ DAYTONA 17 X 7 +45 5穴 100。私がそこに入るすべてはNONEです..なぜこのエラー..誰かが助けることができますか?
ベストアンサー
あなたがそれをBiopythonとタグ付けしたように、私はあなたがBiopythonを知っていると思う。

【送料無料 プジョー3008】 DUNLOP ダンロップ ウィンターMAXX 02 225/60R17 17インチ スタッドレスタイヤ ホイール4本セット 輸入車 EUROTECH ユーロテック ガヤ5(グロスブラック) 7J 7.00-17【DU17win】
17インチ サマータイヤ セット【適応車種:ステップワゴン スパーダ(RF5~8)】WEDS レオニス グレイラ アルファ ブラック/ミラーカット 6.5Jx17ディレッツァ DZ102 215/45R17!15インチノートE12系WEDS レオニス WX ハイパーシルバーミラーカット 5.5Jx15エナセーブ RV504 185/65R15.フロントグリル【ロエン / トミーカイラ】【 ALPHARD(アルファード) S-grade AGH3#W/GGH3#W/AYH30W 2015.1~ 】 フロントグリル Face 2 [材質] FRP(塗装済),195/65R15 TOYO TIRES トーヨー タイヤ PROXES CF2 プロクセス CF2 Laffite LW-03 ラフィット LW-03 サマータイヤホイール4本セット

【送料無料 プジョー3008】 DUNLOP ダンロップ ウィンターMAXX 02 225/60R17 17インチ スタッドレスタイヤ ホイール4本セット 輸入車 EUROTECH ユーロテック ガヤ5(グロスブラック) 7J 7.00-17【DU17win】

。あなたはまだその文書をチェックアウトしましたか? http://biopython.org/DIST/docs/tutorial/Tutorial.html#htoc231が役に立つかもしれません。

上記のリンクのコードを少し調整して、あなたのシーケンスを処理します。

from Bio.Seq import Seq
seq = Seq("CCTCAGCGAGGACAGCAAGGGACTAGCCAGGAGGGAGAACAGAAACTCCAGAACATCTTGGAAATAGCTCCCAGAAAAGCAAGCAGCCAACCAGGCAGGTTCTGTCCCTTTCACTCACTGGCCCAAGGCGCCACATCTCCCTCCAGAAAAGACACCATGAGCACAGAAAGCATGATCCGCGACGTGGAACTGGCAGAAGAGGCACTCCCCCAAAAGATGGGGGGCTTCCAGAACTCCAGGCGGTGCCTATGTCTCAGCCTCTTCTCATTCCTGCTTGTGGCAGGGGCCACCACGCTCTTCTGTCTACTGAACTTCGGGGTGATCGGTCCCCAAAGGGATGAGAAGTTCCCAAATGGCCTCCCTCTCATCAGTTCTATGGCCCAGACCCTCACACTCAGATCATCTTCTCAAAATTCGAGTGACAAGCCTGTAGCCCACGTCGTAGCAAACCACCAAGTGGAGGAGCAGCTGGAGTGGCTGAGCCAGCGCGCCAACGCCCTCCTGGCCAACGGCATGGATCTCAAAGACAACCAACTAGTGGTGCCAGCCGATGGGTTGTACCTTGTCTACTCCCAGGTTCTCTTCAAGGGACAAGGCTGCCCCGACTACGTGCTCCTCACCCACACCGTCAGCCGATTTGCTATCTCATACCAGGAGAAAGTCAACCTCCTCTCTGCCGTCAAGAGCCCCTGCCCCAAGGACACCCCTGAGGGGGCTGAGCTCAAACCCTGGTATGAGCCCATATACCTGGGAGGAGTCTTCCAGCTGGAGAAGGGGGACCAACTCAGCGCTGAGGTCAATCTGCCCAAGTACTTAGACTTTGCGGAGTCCGGGCAGGTCTACTTTGGAGTCATTGCTCTGTGAAGGGAATGGGTGTTCATCCATTCTCTACCCAGCCCCCACTCTGACCCCTTTACTCTGACCCCTTTATTGTCTACTCCTCAGAGCCCCCAGTCTGTATCCTTCTAACTTAGAAAGGGGATTATGGCTCAGGGTCCAACTCTGTGCTCAGAGCTTTCAACAACTACTCAGAAACACAAGATGCTGGGACAGTGACCTGGACTGTGGGCCTCTCATGCACCACCATCAAGGACTCAAATGGGCTTTCCGAATTCACTGGAGCCTCGAATGTCCATTCCTGAGTTCTGCAAAGGGAGAGTGGTCAGGTTGCCTCTGTCTCAGAATGAGGCTGGATAAGATCTCAGGCCTTCCTACCTTCAGACCTTTCCAGATTCTTCCCTGAGGTGCAATGCACAGCCTTCCTCACAGAGCCAGCCCCCCTCTATTTATATTTGCACTTATTATTTATTATTTATTTATTATTTATTTATTTGCTTATGAATGTATTTATTTGGAAGGCCGGGGTGTCCTGGAGGACCCAGTGTGGGAAGCTGTCTTCAGACAGACATGTTTTCTGTGAAAACGGAGCTGAGCTGTCCCCACCTGGCCTCTCTACCTTGTTGCCTCCTCTTTTGCTTATGTTTAAAACAAAATATTTATCTAACCCAATTGTCTTAATAACGCTGATTTGGTGACCAGGCTGTCGCTACATCACTGAACCTCTGCTCCCCACGGGAGCCGTGACTGTAATCGCCCTACGGGTCATTGAGAGAAATAA")
table = 1
min_pro_len = 100
for strand, nuc in [(+1, seq), (-1, seq.reverse_complement())]:
 for frame in range(3):
 for pro in nuc[frame:].translate(table).split("*"):
 if len(pro) >= min_pro_len:
 print "%s...%s - length %i, strand %i, frame %i" % (pro[:30], pro[-3:], len(pro), strand, frame)

ORFも翻訳されています ノブレッセ Edix 前期 モデューロバンパー専用 楕円タイコ 片側1本出しマフラー タイプ6テール (中間タイコ無) ハーフステン/2WD/2000cc/タイコSP。別の変換テーブルを選ぶことができます。 http://biopython.org/DIST/docs/tutorial/Tutorial.html#sec:translationをチェックする

編集:コードの説明:

一番上に、あなたの文字列からシーケンスオブジェクトを作成します。 seq = Seq( “ACGT”)に注意してください。
2つのforループは6つの異なるフレームを作成します。内側のforループは、選択された変換テーブルに従って各フレームを翻訳し、各停止コドンが*としてコードされているアミノ酸鎖を返します。 split関数はこの文字列を分割してこれらのプレースホルダを削除し、その結果、可能なタンパク質配列のリストが得られます ノブレッセ Edix 前期 モデューロバンパー専用 楕円タイコ 片側1本出しマフラー タイプ6テール (中間タイコ無) ハーフステン/2WD/2400cc。 min_pro_lenを設定することで、検出されるタンパク質の最小アミノ酸鎖長を定義することができます。 1が標準テーブルです。 http://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi#SG1をご覧ください。ここでは、開始コドンがAUG(ATGと等しい)で、終了コドン(ヌクレオチド配列の*)がTAA、TAG、およびTGAであることがわかります。別の変換テーブルを使用することもできます。

追加したとき

print nuc[frame:].translate(table)

2番目のforループのすぐ内側には、次のようなものがあります エブリイ/【DA52V】【11/1~13/8】【詳細要確認】Ti2000 DOWN1台分【smtb-TD】【saitama】。

PQRGQQGTSQEGEQKLQNILEIAPRKASSQPGRFCPFHSLAQGATSPSRKDTMSTESMIRDVELAEEALPQKMGGFQNSRRCLCLSLFSFLLVAGATTLFCLLNFGVIGPQRDEKFPNGLPLISSMAQTLTLRSSSQNSSDKPVAHVVANHQVEEQLEWLSQRANALLANGMDLKDNQLVVPADGLYLVYSQVLFKGQGCPDYVLLTHTVSRFAISYQEKVNLLSAVKSPCPKDTPEGAELKPWYEPIYLGGVFQLEKGDQLSAEVNLPKYLDFAESGQVYFGVIAL*REWVFIHSLPSPHSDPFTLTPLLSTPQSPQSVSF*LRKGIMAQGPTLCSELSTTTQKHKMLGQ*PGLWASHAPPSRTQMGFPNSLEPRMSIPEFCKGRVVRLPLSQNEAG*DLRPSYLQTFPDSSLRCNAQPSSQSQPPSIYICTYYLLFIYYLFICL*MYLFGRPGCPGGPSVGSCLQTDMFSVKTELSCPHLASLPCCLLFCLCLKQNIYLTQLS**R*FGDQAVATSLNLCSPREP*L*SPYGSLREI

(アスタリスクは終止コドンの位置にあることに注意)

編集:あなたの2番目の質問への回答:

ファイルに書き込む文字列を返す必要があります。出力文字列を作成し、それを関数の最後に返します。

【送料無料 プジョー3008】 DUNLOP ダンロップ ウィンターMAXX 02 225/60R17 17インチ スタッドレスタイヤ ホイール4本セット 輸入車 EUROTECH ユーロテック ガヤ5(グロスブラック) 7J 7.00-17【DU17win】

output = "selected tupple is " + str(selected_tupple) + "\n"
output += final_seq + "\n"
output += "The longest orf length is " + str(max_val) + "\n"
return output

転載記事の出典を記入してください: Pythonでオープンリーディングフレームを見つける方法 - コードログ

{yahoojp}jpprem01-zenjp40-wl-zd-23899