RDP 数据库简介
在擴增子數據分析中,有時會發現多個OTU 注釋到了同一個species , 為什么會出現這種情況呢?
首先既然在OTU水平能分開,說明序列的相似度小于97%, 同一個物種的同一個基因的片段相似度會小于97%嗎?
答案是肯定的;
對細菌,古菌,真菌來說,在species 水平下面,還有1個strain 水平,而同一個species的不同strain, 有可能會相似度小于97%;
以RDP 下載的 Fungi 數據來說,在原始數據中,會有很多類似下面這種的序列
>S000448483 Sparassis crispa; MBUH-PIRJO&ILKKA94-1587/ss5 >S000448484 Sparassis crispa; MBUH-ILKKA88-2036/ss6 >S000415306 Sparassis crispa; MAFF 238626 >S000448480 Sparassis crispa; YCD2470/ss2 >S000448481 Sparassis crispa; YCD2637/ss3 >S000448482 Sparassis crispa; MBUH-SAVOLAINEN/ss4 >S000448487 Sparassis crispa; zw-clarku003/ss9 >S000448488 Sparassis crispa; BMS2857/ss10 >S000448479 Sparassis crispa; YCD2145/ss1 >S000448492 Sparassis crispa; HKAS15728/ss19 >S000448493 Sparassis crispa; HKAS32363/ss2總結