R: [問卦] 基因定序一樣=同一個來源?

  作者  rrr518 (小籠包獵人)                                    看板  Gossiping
 標題  Re: [問卦] 基因定序一樣=同一個來源?
 時間  Fri May 14 00:19:04 2021
───────────────────────────────────────

大家安安

今天來說說 基因序列 的故事

希望大家能花點時間看完

我會盡量寫得簡單~ 讓大家都看得懂

希望會減少大家一些誤會資訊的機會

※ 引述《A1an (再說)》之銘言:
: ※ 引述《powyo (光子郎)》之銘言:
: : 這個說法是騙文組的吧 就算一樣又怎樣?是同一個人傳播嗎?
: : 所以現在是要收集三種不同病毒株 才能升三級嗎?
: : 阿印度2000多萬例確診 幾乎都是同一種病毒株 所以來源都是同一人?
: : 這邏輯怎麼看都有問題吧
: 短短的發文讓人滿滿的「你到底在問甚麼?」
: 印度2000多萬例幾乎是同一種病毒株是什麼意思?
: 在印度肆虐的B.1.617現在本身都有三個變異株了,[1]
: 印度變異株的特色就是在L452R和E484Q雙重突變,
: 但是其中的B.1.617.2沒有E484Q突變[2],
: 你還以為全印度的印度變異株都長一樣嗎?


我們先來定義一下「XX病毒株」是什麼意思

以南非病毒株為例 主要有3個在Spike(棘蛋白)上

分別是 K417N E484K N501Y

這個的意思是

在第417個位置上 K變成了N
在第484個位置上 E變成了K
在第501個位置上 N變成了Y

人們發現帶有這三個位置變異的病毒株採集到的比例越來越高

因此將有這三個特徵的病毒株取一個名字

因此 這只是其中一個「分支


但這並不代表 所有叫南非病毒株的病毒

都只有這三個突變

在南非病毒株這個大分支

還有很多小分支

分別帶有 L18F, D80A, D215G, R246I, A701V

其中我記得 D215G 和 R246I 是互斥

因為是不同的小分支 各自演化出來的變異


這表示 如果今天分別採集到病毒

其中一隻帶有 主要的 K417N, E484K, N501Y

則 我們會將他歸類為 南非病毒株

而如果採集到的兩隻南非病毒株

一隻有 D215G, 另一隻則有 R246I


那麼!!!

因為這兩個突變是互斥

表示他們分別是來自不同的小分支

因此就知道是不同的感染途徑


如果 都是南非珠 而且也都有 D215G

那麼光看這裡可以猜測來源一樣



而且要注意的是

這邊還只看Spike一個蛋白質而已唷!

這個基因佔全部序列只不過15%左右

全部基因一起看會有更多不同的變異特徵

像是Orf1ab(另一個蛋白質)有 T265I, K1655N, H2799Y ..... 以下省略

何況這裡只列出 比例多的改變功能的



當我們實務上在比較基因時

還會看到每一隻病毒 多多少少都會差一兩個位置

(全長大概30000,只要有一個位置不一樣都可以看得出來)

就跟每個人的長相有差一樣 XDDDD


小結論1: XX病毒株只是某一個分支的代號,並不表示全部完全一樣
小結論2: 病毒或多或少都會差一兩個位置,因此要「完全一樣」不是那麼容易
         要是不同的感染源,又要一樣基因,機率更低,低到可以忽略不考慮。






那麼 到底怎麼看傳染順序呢?


因此假設今天有一個病人身上採集到 AATAAAAAAA

被他傳染的採集到 AATAAAAAAA

因為在第三個位置都是T 所以很有可能就是被第一個病人感染的

之後的病毒會繼續繼承第三個位置的T

但自己也會有一些不一樣

像是可能會變成 AATAAACAAA

那麼我們因為先看到了T 就會知道大概是同一條途徑的


所以在與 參考序列(最早期的病毒序列)比較後

我們可以繪製出關係圖如下



(加上序列方便大家比較)

從這裡可以看到 Seq1 與 Seq2完全一樣 (在同一個線上,沒有往外長)

而Seq3則是從Seq1與Seq2演化出來的 (在同一個分支內,但是樹枝往外長)


只要我們有了這個關係圖

再加上 發病日期、採集時間 等等

就可以大致上知道傳染的順序


所以並不是看是不是都是英國株 或者都是南非株

就知道是不是同一個感染源

我們會去詳細看到底改變了那些位置

並結合時間、地理資訊等等 才會做出是不是同一個感染源的結論

: 然後RNA反轉錄病毒是一種鹼基很容易複製錯誤的病毒,
: 鹼基錯誤夠多可能會造成三個鹼基一組的codons突變,
: codons的突變夠多又可能會導致棘蛋白、膜蛋白、封套蛋白的改變,
: 這三種層級的突變是不一樣的,

這裡錯誤量有點大

三個鹼基會編碼成胺基酸

怎麼組成胺基酸的呢? 這個可以查密碼子表


我們舉個例子

鹼基 = 胺基酸
TTT  =    F
TTC  =    F
TTA  =    L
TTG  =    L
CTT  =    L
CTC  =    L
CTA  =    L
CTG  =    L


我們可以看到 TTT 跟 TTC 長得不一樣

但是都做出 F (苯丙胺酸)

因此如果一個序列 從TTT變成TTC

在序列上看起來不一樣 可是做成蛋白質後會長一樣

這樣子就不會改變蛋白質功能

因此我們稱為 synonymous (同義突變)

但是當 TTT 變成 TTA

查表可以得知 會從 F 變成 L

這時候會改變蛋白質結構 因此功能上就會有不同

可能是功能不一樣 也可能是功能變強變弱

總之這樣子確實有改變的突變我們稱為 nonsynonymous (異義突變)


所以我們可以知道

這樣子的改變 並不是累積多少突變才會造成的改變

而是改變到「會改變的位置」 就會改變


再來是 不論是棘蛋白(Spike)、膜蛋白(Membrane)、封套蛋白(Envelope)

層級上都一樣

好啦其實我不太懂這個怎麼分層級 XDDDD

突變就是隨機突變的

我們發現集中在某些蛋白上(例如Spike)是因為選擇壓力

但是由於是隨機突變的

所以不管是甚麼蛋白質,只要不太影響生存

就都會看得到突變


但是實務上

關注的層級的確會有差別

我們會特別關注 Spike 是因為這個棘蛋白他是負責跟人類的ACE2(血管收縮素轉化2)結合

這個ACE2是細胞膜表面的受體

簡單來說就是病毒進入細胞要透過ACE2

所以人們才會如此關注這個Spike

: 就算是同樣的變異株,
: 鹼基序列可能就不一樣了,
: 只是改變的鹼基沒有改變到例如關鍵的L452R和E484Q這類突變。

通常一個受到關注的變異株

會被冠上一個尊稱(?)

就是因為它改變了關鍵性位置

所以都會帶有這些關鍵性位置啦 而且這是他們的特徵




james732: 要突變到什麼程度才會影響疫苗的效果?                  05/13 12:02

這個問題不錯 相信也是大家最想知道 也最不懂的 XDD

如同前面說的 其實就是看有沒有變到關鍵點位

我們先來看看 關鍵點位是怎麼找出來的


整條 Spike上面其實還可以再更細分



其中RBD是結合的重要區段

在RBD裡面還有更重要的 叫做RBM

這邊就是真正結合的區域




綠色的是人類的ACE2,紫色的是SARS2的RBM

我們可以看到幾個關鍵的位置被標記出來

N501, Q493, S494, L455, F486

當然這只是其中一個模擬 (還有很多其他篇有標記更多位置)

所以只要突變是在Spike上 我們都會仔細看一下

如果突變位置坐落於 RBD 上,更要注意

如果 突變的位置 坐落於RBM上? 那真的得很小心很小心了


我們可以知道 RBM的範圍在 438 ~ 506

所以我們來看看 各個主要的病毒株

標顏色的是在RBM範圍內

南非: K417N, E484K. N501Y

英國: N501Y

印度: E484Q, L452R

因此 這些才會有名字 因為是特別被注意的


而只落在這裡面 還不夠當成會不會影響疫苗的依據

科學家還會做實驗 推測這個位置帶來的改變是什麼

還有很多複雜的分析 就不多解釋ㄌ

當然 我們只要知道在RBM裡面就要特別關注就是了


: 武漢肺炎病毒的序列大概每11天就會突變一次,
: 這不是我說是Science說的,[3]
: 如果序列不是真的一樣、是指揮中心唬爛的,
: 那當然是另外一回事,
: 如果序列真的一樣,
: 來自跟華航完全不同的感染源,
: 不知道已經跟華航感染源分道揚鑣多少個11天的病毒株,
: 出來完全一樣的序列乾屋摳寧,理組哥?
: [1] https://cov-lineages.org/lineages/lineage_B.1.617.html
: [2] https://reurl.cc/nn93nd
: [3] https://science.sciencemag.org/content/371/6528/466



文章有點長

先感謝耐心看完的鄉民唷~


大概是這樣子

謝謝大家

留言

這個網誌中的熱門文章

R: [問卦] 蚊子到底怕不怕雞雞?

R: [問卦] 魚沒有胃酸吧?那要怎麼消化食物

R: [問卦] 幫海龜去除藤壺是否違反自然生態