Warning: Undefined array key "mm" in /www/wwwroot/www.ai-bt.com/si.php on line 10 Deprecated: trim(): Passing null to parameter #1 ($string) of type string is deprecated in /www/wwwroot/www.ai-bt.com/si.php on line 10 Appropriate data cleaning methods for genome-wide association study.

Literature DB >> 18695938

Appropriate data cleaning methods for genome-wide association study.

Taku Miyagawa¹, Nao Nishida¹, Jun Ohashi¹, Ryosuke Kimura^1,2, Akihiro Fujimoto¹, Minae Kawashima^1,3, Asako Koike⁴, Tsukasa Sasaki⁵, Hisashi Tanii⁶, Takeshi Otowa⁷, Yoshio Momose^8,9, Yasuo Nakahara⁸, Jun Gotoh⁸, Yuji Okazaki¹⁰, Shoji Tsuji^8,9, Katsushi Tokunaga¹¹.

Abstract

Genome-wide association studies (GWAS) using a large number of single nucleotide polymorphisms (SNPs) have successfully been applied to identify genetic variants of common diseases. However, genotyping using the new array technologies is often associated with spurious results that could unfavorably affect analyses of GWAS. Consequently, data cleaning is of paramount importance in excluding spurious genotyping results. In this study, we investigated the criteria required for the appropriate cleaning of 389 unrelated healthy Japanese samples analyzed using the GeneChip Human Mapping 500K Array Set for GWAS. The samples were randomly subdivided into two groups, and the allele frequencies in the groups were compared for individual SNPs as a quasi-case-control study. Then, observed results were filtered by four parameters (SNP call rate, confidence score obtained using the Bayesian Robust Linear Model with Mahalanobis genotype-calling algorithm, Hardy-Weinberg equilibrium, and minor allele frequency) and assessed for deviation from the null hypothesis. We found that appropriate data cleaning could be achieved using these four parameters. Our findings offer an avenue for obtaining appropriate data from GWAS.

Entities: Species

Mesh：

Year: 2008 PMID： 18695938 DOI： 10.1007/s10038-008-0322-y

Source DB: PubMed Journal: J Hum Genet ISSN： 1434-5161 Impact factor: 3.172

22 in total

1. Comparison of statistical power between 2 * 2 allele frequency and allele positivity tables in case-control studies of complex disease genes.

Authors: J Ohashi; S Yamamoto; N Tsuchiya; Y Hatta; T Komata; M Matsushita; K Tokunaga
Journal: Ann Hum Genet Date: 2001-03 Impact factor: 1.670

2. The expected power of genome-wide linkage disequilibrium testing using single nucleotide polymorphism markers for detecting a low-frequency disease variant.

Authors: J Ohashi; K Tokunaga
Journal: Ann Hum Genet Date: 2002-07 Impact factor: 1.670

Review 3. The complex interplay among factors that influence allelic association.

Authors: Krina T Zondervan; Lon R Cardon
Journal: Nat Rev Genet Date: 2004-02 Impact factor: 53.242

4. Complement factor H polymorphism in age-related macular degeneration.

Authors: Robert J Klein; Caroline Zeiss; Emily Y Chew; Jen-Yue Tsai; Richard S Sackler; Chad Haynes; Alice K Henning; John Paul SanGiovanni; Shrikant M Mane; Susan T Mayne; Michael B Bracken; Frederick L Ferris; Jurg Ott; Colin Barnstable; Josephine Hoh
Journal: Science Date: 2005-03-10 Impact factor: 47.728

5. A nonsynonymous SNP in PRKCH (protein kinase C eta) increases the risk of cerebral infarction.

Authors: Michiaki Kubo; Jun Hata; Toshiharu Ninomiya; Koichi Matsuda; Koji Yonemoto; Toshiaki Nakano; Tomonaga Matsushita; Keiko Yamazaki; Yozo Ohnishi; Susumu Saito; Takanari Kitazono; Setsuro Ibayashi; Katsuo Sueishi; Mitsuo Iida; Yusuke Nakamura; Yutaka Kiyohara
Journal: Nat Genet Date: 2007-01-07 Impact factor: 38.330

6. Detecting marker-disease association by testing for Hardy-Weinberg disequilibrium at a marker locus.

Authors: D M Nielsen; M G Ehm; B S Weir
Journal: Am J Hum Genet Date: 1998-11 Impact factor: 11.025

Review 7. Primate segmental duplications: crucibles of evolution, diversity and disease.

Authors: Jeffrey A Bailey; Evan E Eichler
Journal: Nat Rev Genet Date: 2006-06-13 Impact factor: 53.242

8. Genome-wide association study identifies new susceptibility loci for Crohn disease and implicates autophagy in disease pathogenesis.

Authors: John D Rioux; Ramnik J Xavier; Kent D Taylor; Mark S Silverberg; Philippe Goyette; Alan Huett; Todd Green; Petric Kuballa; M Michael Barmada; Lisa Wu Datta; Yin Yao Shugart; Anne M Griffiths; Stephan R Targan; Andrew F Ippoliti; Edmond-Jean Bernard; Ling Mei; Dan L Nicolae; Miguel Regueiro; L Philip Schumm; A Hillary Steinhart; Jerome I Rotter; Richard H Duerr; Judy H Cho; Mark J Daly; Steven R Brant
Journal: Nat Genet Date: 2007-04-15 Impact factor: 38.330

Review 9. Searching for genetic determinants in the new millennium.

Authors: N J Risch
Journal: Nature Date: 2000-06-15 Impact factor: 49.962

Review 10. A tutorial on statistical methods for population association studies.

Authors: David J Balding
Journal: Nat Rev Genet Date: 2006-10 Impact factor: 53.242

21 in total

1. A quality control algorithm for filtering SNPs in genome-wide association studies.

Authors: Monnat Pongpanich; Patrick F Sullivan; Jung-Ying Tzeng
Journal: Bioinformatics Date: 2010-05-25 Impact factor: 6.937

2. Statistical genetic issues for genome-wide association studies.

Authors: Bruce S Weir
Journal: Genome Date: 2010-11 Impact factor: 2.166

3. Genome-wide association study identifies TNFSF15 and POU2AF1 as susceptibility loci for primary biliary cirrhosis in the Japanese population.

Authors: Minoru Nakamura; Nao Nishida; Minae Kawashima; Yoshihiro Aiba; Atsushi Tanaka; Michio Yasunami; Hitomi Nakamura; Atsumasai Komori; Makoto Nakamuta; Mikio Zeniya; Etsuko Hashimoto; Hiromasa Ohira; Kazuhide Yamamoto; Morikazu Onji; Shuichi Kaneko; Masao Honda; Satoshi Yamagiwa; Kazuhiko Nakao; Takafumi Ichida; Hajime Takikawa; Masataka Seike; Takeji Umemura; Yoshiyuki Ueno; Shotaro Sakisaka; Kentaro Kikuchi; Hirotoshi Ebinuma; Noriyo Yamashiki; Sumito Tamura; Yasuhiko Sugawara; Akira Mori; Shintaro Yagi; Ken Shirabe; Akinobu Taketomi; Kuniaki Arai; Kyoko Monoe; Tatsuki Ichikawa; Makiko Taniai; Yasuhiro Miyake; Teru Kumagi; Masanori Abe; Kaname Yoshizawa; Satoru Joshita; Shinji Shimoda; Koichi Honda; Hiroki Takahashi; Katsuji Hirano; Yasuaki Takeyama; Kenichi Harada; Kiyoshi Migita; Masahiro Ito; Hiroshi Yatsuhashi; Nobuyoshi Fukushima; Hajime Ota; Tatsuji Komatsu; Takeo Saoshiro; Jinya Ishida; Hirotsugu Kouno; Hirotaka Kouno; Michiyasu Yagura; Masakazu Kobayashi; Toyokichi Muro; Naohiko Masaki; Keiichi Hirata; Yukio Watanabe; Yoko Nakamura; Masaaki Shimada; Noboru Hirashima; Toshiki Komeda; Kazuhiro Sugi; Michiaki Koga; Keisuke Ario; Eiichi Takesaki; Yoshihiko Maehara; Shinji Uemoto; Norihiro Kokudo; Hirohito Tsubouchi; Masashi Mizokami; Yasuni Nakanuma; Katsushi Tokunaga; Hiromi Ishibashi
Journal: Am J Hum Genet Date: 2012-09-20 Impact factor: 11.025

4. Genome-wide association study for oat (Avena sativa L.) beta-glucan concentration using germplasm of worldwide origin.

Authors: Mark A Newell; Franco G Asoro; M Paul Scott; Pamela J White; William D Beavis; Jean-Luc Jannink
Journal: Theor Appl Genet Date: 2012-08-03 Impact factor: 5.699

5. Quality control procedures for genome-wide association studies.

Authors: Stephen Turner; Loren L Armstrong; Yuki Bradford; Christopher S Carlson; Dana C Crawford; Andrew T Crenshaw; Mariza de Andrade; Kimberly F Doheny; Jonathan L Haines; Geoffrey Hayes; Gail Jarvik; Lan Jiang; Iftikhar J Kullo; Rongling Li; Hua Ling; Teri A Manolio; Martha Matsumoto; Catherine A McCarty; Andrew N McDavid; Daniel B Mirel; Justin E Paschall; Elizabeth W Pugh; Luke V Rasmussen; Russell A Wilke; Rebecca L Zuvich; Marylyn D Ritchie
Journal: Curr Protoc Hum Genet Date: 2011-01

6. Quality control and quality assurance in genotypic data for genome-wide association studies.

Authors: Cathy C Laurie; Kimberly F Doheny; Daniel B Mirel; Elizabeth W Pugh; Laura J Bierut; Tushar Bhangale; Frederick Boehm; Neil E Caporaso; Marilyn C Cornelis; Howard J Edenberg; Stacy B Gabriel; Emily L Harris; Frank B Hu; Kevin B Jacobs; Peter Kraft; Maria Teresa Landi; Thomas Lumley; Teri A Manolio; Caitlin McHugh; Ian Painter; Justin Paschall; John P Rice; Kenneth M Rice; Xiuwen Zheng; Bruce S Weir
Journal: Genet Epidemiol Date: 2010-09 Impact factor: 2.135

7. The Gene, Environment Association Studies consortium (GENEVA): maximizing the knowledge obtained from GWAS by collaboration across studies of multiple conditions.

Authors: Marilyn C Cornelis; Arpana Agrawal; John W Cole; Nadia N Hansel; Kathleen C Barnes; Terri H Beaty; Siiri N Bennett; Laura J Bierut; Eric Boerwinkle; Kimberly F Doheny; Bjarke Feenstra; Eleanor Feingold; Myriam Fornage; Christopher A Haiman; Emily L Harris; M Geoffrey Hayes; John A Heit; Frank B Hu; Jae H Kang; Cathy C Laurie; Hua Ling; Teri A Manolio; Mary L Marazita; Rasika A Mathias; Daniel B Mirel; Justin Paschall; Louis R Pasquale; Elizabeth W Pugh; John P Rice; Jenna Udren; Rob M van Dam; Xiaojing Wang; Janey L Wiggs; Kayleen Williams; Kai Yu
Journal: Genet Epidemiol Date: 2010-05 Impact factor: 2.135

8. Genome-wide association of IL28B with response to pegylated interferon-alpha and ribavirin therapy for chronic hepatitis C.

Authors: Yasuhito Tanaka; Nao Nishida; Masaya Sugiyama; Masayuki Kurosaki; Kentaro Matsuura; Naoya Sakamoto; Mina Nakagawa; Masaaki Korenaga; Keisuke Hino; Shuhei Hige; Yoshito Ito; Eiji Mita; Eiji Tanaka; Satoshi Mochida; Yoshikazu Murawaki; Masao Honda; Akito Sakai; Yoichi Hiasa; Shuhei Nishiguchi; Asako Koike; Isao Sakaida; Masatoshi Imamura; Kiyoaki Ito; Koji Yano; Naohiko Masaki; Fuminaka Sugauchi; Namiki Izumi; Katsushi Tokunaga; Masashi Mizokami
Journal: Nat Genet Date: 2009-09-13 Impact factor: 38.330

9. Genome-wide association study confirming association of HLA-DP with protection against chronic hepatitis B and viral clearance in Japanese and Korean.

Authors: Nao Nishida; Hiromi Sawai; Kentaro Matsuura; Masaya Sugiyama; Sang Hoon Ahn; Jun Yong Park; Shuhei Hige; Jong-Hon Kang; Kazuyuki Suzuki; Masayuki Kurosaki; Yasuhiro Asahina; Satoshi Mochida; Masaaki Watanabe; Eiji Tanaka; Masao Honda; Shuichi Kaneko; Etsuro Orito; Yoshito Itoh; Eiji Mita; Akihiro Tamori; Yoshikazu Murawaki; Yoichi Hiasa; Isao Sakaida; Masaaki Korenaga; Keisuke Hino; Tatsuya Ide; Minae Kawashima; Yoriko Mawatari; Megumi Sageshima; Yuko Ogasawara; Asako Koike; Namiki Izumi; Kwang-Hyub Han; Yasuhito Tanaka; Katsushi Tokunaga; Masashi Mizokami
Journal: PLoS One Date: 2012-06-21 Impact factor: 3.240

10. Evaluating Polygenic Risk Scores in "Lone" Atrial Fibrillation.

Authors: Julieta Lazarte; Jacqueline S Dron; Adam D McIntyre; Allan C Skanes; Lorne J Gula; Anthony S Tang; Rafik Tadros; Zachary W Laksman; Robert A Hegele; Jason D Roberts
Journal: CJC Open Date: 2021-02-06