| Literature DB >> 33818474 |
Varsha Potdar1, Veena Vipat1, Ashwini Ramdasi2, Santosh Jadhav3, Jayashri Pawar-Patil2, Atul Walimbe3, Sucheta S Patil3, Manohar L Choudhury1, Jayanthi Shastri4, Sachee Agrawal4, Shailesh Pawar5, Kavita Lole6, Priya Abraham2, Sarah Cherian3.
Abstract
BACKGROUND &Entities:
Keywords: COVID-19- nucleotide substitution; Clades; India; SARS-CoV-2; selection pressure; whole genomes
Mesh:
Year: 2021 PMID: 33818474 PMCID: PMC8184080 DOI: 10.4103/ijmr.IJMR_3418_20
Source DB: PubMed Journal: Indian J Med Res ISSN: 0971-5916 Impact factor: 2.375
Fig. 1Workflow for SARS-CoV-2 data analysis.
Establishing an equivalence between the Global Initiative on Sharing All Influenza Data (GISAID), Nextstrain and Phylogenetic Assignment of Named Global Outbreak LINeages (Pangolin) nomenclature systems with respect to the genome sequence data from India (n=3014)
| GISAID clades | Nextstrain | Dominant Pangolin lineages | Major marker mutations |
|---|---|---|---|
| G | 20A | B.1, B.1.80 | S: D614G |
| GR | 20B | B.1.1.32, B.1.1, B.1.1.8 | S: D614G + N: G204R |
| GH | 20C | B.1.113, B.1.36 | S: D614G + nsp3:Q57H |
| V | 19A | B.2.1 | nsp6:L37F + nsp3:G251V |
| L (Ref. seq. WIV04) | 19A | B | - |
| S | 19B | A | ORF8:L84S |
| O | 19A | B.6, B.4 | ORF1a: L3606F |
Fig. 2Sunburst diagrams coloured according to Global Initiative on Sharing All Influenza Data (GISAID) clades showing relationship between GISAID and Phylogenetic Assignment of Named Global Outbreak LINeages (Pangolin) annotations on the inner and outer circles, respectively for the Indian SARS-CoV-2 genomes (n=3014). (A) The proportionate chart showing dominant Pangolin corresponding to each of the GISAID clades (The count for individual clades/lineages is shown in Supplementary Table II). (B) The schematic representation of association between the GISAID clades and the Pangolin lineages.
Distribution of the Indian sequences (n=3014) in the Global Initiative on Sharing All Influenza Data, Nextstrain and Phylogenetic Assignment of Named Global Outbreak LINeages clades
| GISAID clade | Count of sequences | Nextstrain new clades# | Pangolin |
|---|---|---|---|
| O | 649 | ||
| 19B=6 | B.1=52 | ||
| 20A=53 | B.1.1=24 | ||
| 20B=11 (65) | B.4=22 | ||
| B=18 | |||
| B.1.113=14 | |||
| A.7=6 | |||
| B.1.1.32=4 | |||
| A=3 | |||
| B.1.36=2 | |||
| B.1.80=2 | |||
| A.3=1 | |||
| L | 22 | ||
| B.4=3 | |||
| B.6=9 | |||
| V | 3 | 19A=3 | B.2.1=3 |
| S | 80 | ||
| 19A=1 | A.7=17 | ||
| 20A=1(7) | A.9=6 | ||
| A.1=2 | |||
| B.1=2 | |||
| A.2=1 | |||
| B.2=1 | |||
| G | 612 | ||
| 19A=11 | |||
| 20B=11 | B.1.113=21 | ||
| (50) | B.1.1=15 | ||
| B.1.95=11 | |||
| B.1.5=8 | |||
| B.1.87=6 | |||
| B=5 | |||
| B.1.36=5 | |||
| B.1.11=2 | |||
| B.1.102=1 | |||
| B.1.107=1 | |||
| B.1.79=1 | |||
| B.1.86=1 | |||
| B.6=1 | |||
| GH | 533 | ||
| 20C=18 | |||
| 19A=6 (49) | B.1=32 | ||
| B.1.26=6 | |||
| B.1.80=2 | |||
| B.1.1.8=1 | |||
| GR | 1115 | ||
| 20A=4 | |||
| 19A=2 (232) | |||
| B.1.1.31=3 | |||
| B.1.1.28=1 | |||
| B.1=1 | |||
| B.1.1.10=1 | |||
| Total | 3014 | 3014 | 3014 |
Bold fonts indicate the major distribution. #Clade information not available as on October 14, 2020 for the number of strains depicted in bracket. GISAID, Global Initiative on Sharing All Influenza Data; PangoLIN, Phylogenetic Assignment of Named Global Outbreak LINeages
Synonymous and non-synonymous substitutions characterizing the dominant Phylogenetic Assignment of Named Global Outbreak LINeages (Pangolin) in India
| Pangolin lineage | Synonymous substitution | Non-synonymous substitutions | Untranslated nucleotide change | ||
|---|---|---|---|---|---|
| Nucleotide variation | Gene (amino-acid change) | Nucleotide variation | Gene (amino-acid change) | ||
| B.1.113 | C22444T | S (D294D) | C28854T | N (S194L) | - |
| B.1.1.32 | C313T | NSP1 (L16L) | C5700A | nsp3 (A994D)/ORF1ab (A1812D) | - |
| B.1.1.8 | G4354A | NSP3 (E545E)/ORF1ab (E1363E) | C6573T | nsp3 (S1285F)/ORF1ab (S2103F) | - |
| C25528T | ORF3a (L46F) | ||||
| B.1.80 | C3634T | NSP3 (N305N)/ORF1ab (N1123N) | - | ||
| C15324T | NSP12b (N619N) | ||||
| B.4 | T28688C | N (A138A) | C884T | nsp2 (R27C)/ORF1ab (R207C) | 3’UTR (G29742T) |
| G1397A | nsp2 (V198I)/ORF1ab (V378I) | ||||
| G8653T | nsp4 (M33I)/ORF1ab (M2796I) | ||||
| G11083T | nsp6 (L37F)/ORF1ab (L3606F) | ||||
| B.6 | C13730T | nsp12b (A88V) | - | ||
| C28311T | N (P13L) | ||||
| C6312A | nsp3 (T1198K)/ORF1ab (T2016K) | ||||
| G11083T | nsp6 (L37F)/ORF1ab (L3606F) | ||||
Mutations representing the old Nextstrain clade and corresponding major new Nextstrain clade nomenclatures
| Nextstrain (old clades) | Mutation(s) defined for the clade | Major Nextstrain new clades (defined mutation) |
|---|---|---|
| A1a | ORF3a: G251V and ORF1a: L3606F | 19A (-) |
| A3 | ORF1a: L3606F and V378I | |
| A6 | nt: T514C | |
| A7 | ORF1a: A3220V | |
| B | ORF8: L84S | 19B (nt. C8782T) |
| B1 | ORF8: L84S, nt- C18060T | |
| B2 | ORF8: L84S, nt- C29095T | |
| B4 | ORF8: L84S, N: S202N | |
| A2 | S: D614G | 20A (ORF1b/nsp12b: P314L) |
| A2a | S: D614G, ORF1b: P314L | |
| A2a | S: D614G, ORF1b: P314L | 20B (N: R203K, G204R & ORF14: G50N) |
| - | - | 20C (ORF1a: T265I) |
Fig. 3State-wise distribution of total number of SARS-CoV-2 sequences deposited from India to Global Initiative on Sharing All Influenza Data (GISAID) from January to September 2020. The colours on the graph denote the GISAID clades.
State-wise list with clade information
| Clade | Nextstrain | Lineage | Andhra Pradesh | Assam | Bihar | Delhi | Gujarat | Haryana | Jammu and Kashmir | Karnataka | Kerala | Ladakh |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| G | 19A | B | 1 | 2 | ||||||||
| B.1 | 2 | 3 | ||||||||||
| B.1.1 | ||||||||||||
| B.1.113 | 5 | |||||||||||
| B.1.36 | 1 | |||||||||||
| B.1.80 | ||||||||||||
| B.6 | ||||||||||||
| 20A | B | |||||||||||
| B.1 | 2 | 134 | 2 | 13 | ||||||||
| B.1.1 | 2 | 1 | ||||||||||
| B.1.102 | 1 | |||||||||||
| B.1.107 | ||||||||||||
| B.1.11 | ||||||||||||
| B.1.113 | 6 | 7 | 1 | |||||||||
| B.1.36 | 3 | |||||||||||
| B.1.5 | ||||||||||||
| B.1.79 | ||||||||||||
| B.1.80 | 34 | 21 | ||||||||||
| B.1.86 | ||||||||||||
| B.1.87 | 2 | |||||||||||
| B.1.95 | ||||||||||||
| 20B | B.1 | |||||||||||
| B.1.1 | 1 | |||||||||||
| B.1.113 | 2 | |||||||||||
| Blank | B.1 | 3 | ||||||||||
| B.1.1 | 2 | |||||||||||
| B.1.5 | 1 | |||||||||||
| B.1.80 | 6 | |||||||||||
| GH | 20A | B.1 | 2 | 12 | 1 | |||||||
| B.1.113 | 11 | 219 | 26 | 16 | ||||||||
| B.1.36 | 1 | 85 | 4 | |||||||||
| B.1.80 | 2 | |||||||||||
| 20C | B.1 | 2 | 2 | 1 | ||||||||
| B.1.1.8 | ||||||||||||
| B.1.26 | ||||||||||||
| Blank | B.1 | 4 | ||||||||||
| B.1.113 | 2 | |||||||||||
| B.1.36 | 3 | |||||||||||
| GR | 20B | B.1 | ||||||||||
| B.1.1 | 7 | 4 | 4 | 74 | ||||||||
| B.1.1.28 | ||||||||||||
| B.1.1.31 | 1 | |||||||||||
| B.1.1.32 | 7 | 1 | 3 | |||||||||
| B.1.1.8 | 1 | |||||||||||
| Blank | B.1.1 | 17 | ||||||||||
| B.1.1.10 | 1 | |||||||||||
| B.1.1.32 | 3 | |||||||||||
| L | 19A | B | 1 | |||||||||
| B.4 | 3 | |||||||||||
| B.6 | 1 | 1 | 2 | |||||||||
| O | 19A | A.3 | 1 | |||||||||
| B | 1 | 1 | ||||||||||
| B.1 | 9 | 1 | 6 | |||||||||
| B.1.1 | 2 | 2 | ||||||||||
| B.1.113 | 5 | |||||||||||
| B.4 | 1 | 9 | 6 | |||||||||
| B.6 | 2 | 2 | 6 | 195 | 11 | 11 | 1 | 48 | ||||
| 19B | A | |||||||||||
| A.7 | ||||||||||||
| B.1 | ||||||||||||
| B.1.1 | ||||||||||||
| 20A | B | 1 | ||||||||||
| B.1 | 1 | 3 | 1 | |||||||||
| B.1.113 | 2 | 3 | 2 | |||||||||
| B.1.36 | 1 | 1 | ||||||||||
| 20B | B.1 | |||||||||||
| B.1.1 | 2 | 1 | ||||||||||
| B.1.1.32 | ||||||||||||
| Blank | B.1 | 1 | ||||||||||
| B.1.1 | 2 | |||||||||||
| B.1.80 | 2 | |||||||||||
| B.6 | 1 | 1 | ||||||||||
| S | 19B | A | 17 | 3 | 1 | |||||||
| A.1 | 1 | |||||||||||
| A.2 | 1 | |||||||||||
| A.7 | ||||||||||||
| A.9 | ||||||||||||
| B.1 | 1 | 1 | ||||||||||
| B.2 | ||||||||||||
| V | 19A | B.2.1 | 2 | |||||||||
| Total | 3 | 2 | 6 | 263 | 560 | 55 | 2 | 255 | 2 | 6 | ||
| Clade | Madhya Pradesh | Maharashtra | Odisha | Punjab | Rajasthan | Tamil Nadu | Telangana | Uttar Pradesh | Uttarakhand | West Bengal | Total | |
| G | 1 | 4 | ||||||||||
| 3 | 8 | |||||||||||
| 1 | 1 | |||||||||||
| 5 | ||||||||||||
| 1 | ||||||||||||
| 2 | 2 | |||||||||||
| 1 | 1 | |||||||||||
| 1 | 1 | |||||||||||
| 22 | 24 | 33 | 1 | 1 | 19 | 10 | 6 | 124 | 391 | |||
| 1 | 4 | |||||||||||
| 1 | ||||||||||||
| 1 | 1 | |||||||||||
| 1 | 1 | 2 | ||||||||||
| 14 | ||||||||||||
| 1 | 4 | |||||||||||
| 3 | 1 | 3 | 7 | |||||||||
| 1 | 1 | |||||||||||
| 2 | 34 | 9 | 6 | 1 | 9 | 6 | 122 | |||||
| 1 | 1 | |||||||||||
| 4 | 6 | |||||||||||
| 11 | 11 | |||||||||||
| 2 | 2 | |||||||||||
| 1 | 1 | 5 | 8 | |||||||||
| 2 | ||||||||||||
| 3 | ||||||||||||
| 2 | ||||||||||||
| 1 | ||||||||||||
| 6 | ||||||||||||
| GH | 1 | 3 | 2 | 2 | 23 | |||||||
| 12 | 7 | 11 | 13 | 18 | 2 | 335 | ||||||
| 1 | 14 | 14 | 1 | 27 | 1 | 4 | 152 | |||||
| 2 | ||||||||||||
| 5 | ||||||||||||
| 1 | 1 | |||||||||||
| 4 | 2 | 6 | ||||||||||
| 4 | ||||||||||||
| 2 | ||||||||||||
| 3 | ||||||||||||
| GR | 1 | 1 | ||||||||||
| 63 | 40 | 2 | 15 | 124 | 9 | 20 | 3 | 365 | ||||
| 1 | 1 | |||||||||||
| 2 | 3 | |||||||||||
| 321 | 16 | 168 | 9 | 7 | 532 | |||||||
| 191 | 192 | |||||||||||
| 17 | ||||||||||||
| 1 | ||||||||||||
| 3 | ||||||||||||
| L | 2 | 2 | 2 | 3 | 10 | |||||||
| 3 | ||||||||||||
| 1 | 1 | 3 | 9 | |||||||||
| O | 1 | |||||||||||
| 1 | 1 | 1 | 1 | 1 | 1 | 1 | 8 | 17 | ||||
| 2 | 1 | 6 | 1 | 5 | 31 | |||||||
| 4 | 5 | 13 | ||||||||||
| 5 | ||||||||||||
| 5 | 1 | 22 | ||||||||||
| 8 | 42 | 31 | 6 | 4 | 20 | 80 | 19 | 2 | 11 | 499 | ||
| 3 | 3 | |||||||||||
| 6 | 6 | |||||||||||
| 1 | 1 | |||||||||||
| 1 | 1 | |||||||||||
| 1 | ||||||||||||
| 2 | 5 | 6 | 18 | |||||||||
| 1 | 1 | 9 | ||||||||||
| 2 | ||||||||||||
| 1 | 1 | |||||||||||
| 1 | 3 | 1 | 8 | |||||||||
| 4 | 4 | |||||||||||
| 1 | ||||||||||||
| 2 | ||||||||||||
| 2 | ||||||||||||
| 2 | ||||||||||||
| S | 3 | 14 | 1 | 12 | 51 | |||||||
| 1 | 2 | |||||||||||
| 1 | ||||||||||||
| 6 | 11 | 17 | ||||||||||
| 3 | 3 | 6 | ||||||||||
| 2 | ||||||||||||
| 1 | 1 | |||||||||||
| V | 1 | 3 | ||||||||||
| Total | 45 | 553 | 227 | 10 | 6 | 36 | 639 | 58 | 70 | 216 | 3014 | |
Fig. 4Temporal distribution of SARS-CoV-2 sequences from different States of India. The number of SARS-CoV-2 sequences belonging to distinct GISAID clades is represented as a percentage plot of the clades for each month.
State-wise clade information with temporal distribution
| State | Clade | January | February | March | April | May | June | July | August | September | NA | Total |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Andhra Pradesh | GR | 1 | 1 | |||||||||
| O | 1 | 1 | 2 | |||||||||
| Assam | O | 2 | 2 | |||||||||
| Bihar | O | 3 | 3 | 6 | ||||||||
| Delhi | G | 1 | 2 | 14 | 1 | 18 | ||||||
| GH | 7 | 6 | 3 | 16 | ||||||||
| GR | 3 | 1 | 3 | 7 | ||||||||
| L | 1 | 1 | ||||||||||
| O | 2 | 25 | 185 | 5 | 217 | |||||||
| S | 2 | 2 | ||||||||||
| V | 2 | 2 | ||||||||||
| Gujarat | G | 27 | 45 | 112 | 5 | 189 | ||||||
| GH | 33 | 74 | 184 | 29 | 320 | |||||||
| GR | 2 | 4 | 5 | 11 | ||||||||
| L | 1 | 3 | 4 | |||||||||
| O | 4 | 8 | 6 | 18 | ||||||||
| S | 8 | 10 | 18 | |||||||||
| Haryana | G | 1 | 3 | 4 | ||||||||
| GH | 2 | 17 | 8 | 27 | ||||||||
| GR | 1 | 3 | 1 | 5 | ||||||||
| O | 1 | 10 | 1 | 7 | 19 | |||||||
| Jammu and Kashmir | O | 2 | 2 | |||||||||
| Karnataka | G | 14 | 16 | 13 | 4 | 47 | ||||||
| GH | 17 | 8 | 2 | 3 | 30 | |||||||
| GR | 3 | 13 | 72 | 11 | 99 | |||||||
| L | 2 | 2 | ||||||||||
| O | 28 | 35 | 8 | 2 | 73 | |||||||
| S | 4 | 4 | ||||||||||
| Kerala | L | 1 | 1 | |||||||||
| S | 1 | 1 | ||||||||||
| Ladakh | O | 6 | 6 | |||||||||
| Madhya Pradesh | G | 12 | 16 | 28 | ||||||||
| GH | 1 | 1 | ||||||||||
| L | 2 | 1 | 3 | |||||||||
| O | 6 | 7 | 13 | |||||||||
| Maharashtra | G | 7 | 12 | 31 | 6 | 3 | 8 | 67 | ||||
| GH | 3 | 12 | 5 | 7 | 27 | |||||||
| GR | 1 | 59 | 79 | 128 | 23 | 23 | 75 | 388 | ||||
| O | 12 | 32 | 9 | 4 | 2 | 59 | ||||||
| S | 11 | 11 | ||||||||||
| V | 1 | 1 | ||||||||||
| Odisha | G | 1 | 38 | 13 | 52 | |||||||
| GH | 13 | 8 | 4 | 25 | ||||||||
| GR | 1 | 26 | 29 | 56 | ||||||||
| L | 3 | 3 | ||||||||||
| O | 1 | 3 | 56 | 3 | 63 | |||||||
| S | 28 | 28 | ||||||||||
| Punjab | G | 1 | 1 | |||||||||
| GR | 2 | 2 | ||||||||||
| O | 5 | 2 | 7 | |||||||||
| Rajasthan | G | 1 | 1 | |||||||||
| O | 1 | 4 | 5 | |||||||||
| Tamil Nadu | GH | 1 | 1 | |||||||||
| GR | 9 | 6 | 15 | |||||||||
| O | 15 | 4 | 1 | 20 | ||||||||
| Telangana | G | 1 | 15 | 8 | 1 | 25 | ||||||
| GH | 1 | 29 | 6 | 1 | 7 | 44 | ||||||
| GR | 1 | 1 | 123 | 159 | 47 | 152 | 483 | |||||
| L | 2 | 2 | 1 | 5 | ||||||||
| O | 13 | 61 | 8 | 82 | ||||||||
| Uttar Pradesh | G | 2 | 1 | 11 | 14 | |||||||
| GH | 2 | 9 | 4 | 15 | ||||||||
| GR | 3 | 5 | 1 | 9 | ||||||||
| O | 3 | 12 | 5 | 20 | ||||||||
| Uttarakhand | G | 10 | 5 | 15 | ||||||||
| GH | 5 | 13 | 3 | 21 | ||||||||
| GR | 18 | 11 | 29 | |||||||||
| O | 3 | 1 | 4 | |||||||||
| S | 1 | 1 | ||||||||||
| West Bengal | G | 8 | 34 | 93 | 12 | 1 | 3 | 151 | ||||
| GH | 1 | 5 | 6 | |||||||||
| GR | 3 | 7 | 10 | |||||||||
| L | 3 | 3 | ||||||||||
| O | 7 | 3 | 3 | 11 | 7 | 31 | ||||||
| S | 10 | 5 | 15 | |||||||||
| Total | 2 | 130 | 453 | 1086 | 868 | 121 | 221 | 107 | 26 | 3014 |
NA, not available
Selection pressure analysis based on the whole-genome sequences using the methods Mixed Effects Model of Evolution and Single-Likelihood Ancestor Counting, available in the Datamonkey server
| Clade | Gene | Site | Variable amino acid residues | ||
|---|---|---|---|---|---|
| G | nsp3 | 994 | A/D | 0.01 | 0.042 |
| nsp6 | 37 | L/F | 0.01 | 0.036 | |
| nsp12 | 323 | L/P | 0.01 | 0.008 | |
| GR | nsp3 | 994 | D/A | 0.01 | 0.05 |
| nsp3 | 1103 | P/L/S | 0.02 | 0.085 | |
| nsp4 | 380 | A/V | 0.05 | 0.088 | |
| nsp7 | 54 | S/L/P | 0.07 | 0.066 | |
| nsp16 | 298 | N/L/I | 0 | 0.037 | |
| ORF3a | 46 | L/F | 0.01 | 0.06 | |
| GH | nsp6 | 37 | L/F | 0.02 | 0.04 |
| nsp12 | 323 | L/P | 0.03 | 0.059 | |
| nsp14 | 372 | T/I | 0.03 | 0.062 | |
| nsp16 | 298 | N/L/H/I | 0 | 0.062 | |
| S | - | - | - | - | - |
| O | nsp3 | 1197 | S/R/K | 0 | 0.021 |
| nsp3 | 1198 | K/T | 0.07 | 0.022 | |
| nsp3 | 1768 | V/G | 0 | 0.004 | |
| nsp6 | 37 | F/L | 0.02 | 0.009 |
Sites were identified as showing evidence of positive selection as per the statistical significance level (P<0.1) by both the methods. MEME, Mixed Effects Model of Evolution; SLAC, Single-Likelihood Ancestor Counting