python文本替换 数据库_在Python中使用ASCII文件中的注释查找/替换子...
在我正在研究的生物信息學項目中,我遇到了一些編碼問題.基本上,我的任務是從數據庫中提取基序序列并使用該信息來注釋序列比對文件.對齊文件是純文本,因此注釋不會是任何復雜的,最好只是用對齊文件本身中的星號替換提取的序列.
我有一個腳本掃描數據庫文件,提取我需要的所有序列,并將它們寫入輸出文件.鑒于查詢,我需要讀取這些序列并將它們與ASCII對齊文件中相應的子字符串相匹配.最后,對于每個出現的主題序列(一個非常大的字符串的子串),我會用一系列星號*替換主題序列XXXXXXX.
我正在使用的代碼是這樣的(11SGLOBULIN是數據庫中蛋白質條目的名稱):
motif_file = open('/users/myfolder/final motifs_11SGLOBULIN','r')
align_file = open('/Users/myfolder/alignmentfiles/11sglobulin.seqs', 'w+')
finalmotifs = motif_file.readlines()
seqalign = align_file.readlines()
for line in seqalign:
if motif[i] in seqalign: # I have stored all motifs in a list called "motif"
replace(motif, '*****')
但不是用一系列星號替換每個字符串,而是刪除整個文件.誰能明白為什么會這樣?
我懷疑問題可能在于我的ASCII文件基本上只是一個很長的氨基酸列表,而且Python不知道如何替換一個非常長的字符串中隱藏的特定子字符串.
總結
以上是生活随笔為你收集整理的python文本替换 数据库_在Python中使用ASCII文件中的注释查找/替换子...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: qq聊天框怎么做的(qq聊天框怎么做的好
- 下一篇: 来源关键词怎么观察排名(关键词排名怎么看