Warning: Undefined array key "mm" in /www/wwwroot/www.ai-bt.com/si.php on line 10 Deprecated: trim(): Passing null to parameter #1 ($string) of type string is deprecated in /www/wwwroot/www.ai-bt.com/si.php on line 10 CoGenT++: an extensive and extensible data environment for computational genomics.

Literature DB >> 16216832

CoGenT++: an extensive and extensible data environment for computational genomics.

Leon Goldovsky¹, Paul Janssen, Dag Ahrén, Benjamin Audit, Ildefonso Cases, Nikos Darzentas, Anton J Enright, Núria López-Bigas, José M Peregrin-Alvarez, Mike Smith, Sophia Tsoka, Victor Kunin, Christos A Ouzounis.

Abstract

MOTIVATION: CoGenT++ is a data environment for computational research in comparative and functional genomics, designed to address issues of consistency, reproducibility, scalability and accessibility. DESCRIPTION: CoGenT++ facilitates the re-distribution of all fully sequenced and published genomes, storing information about species, gene names and protein sequences. We describe our scalable implementation of ProXSim, a continually updated all-against-all similarity database, which stores pairwise relationships between all genome sequences. Based on these similarities, derived databases are generated for gene fusions--AllFuse, putative orthologs--OFAM, protein families--TRIBES, phylogenetic profiles--ProfUse and phylogenetic trees. Extensions based on the CoGenT++ environment include disease gene prediction, pattern discovery, automated domain detection, genome annotation and ancestral reconstruction.
CONCLUSION: CoGenT++ provides a comprehensive environment for computational genomics, accessible primarily for large-scale analyses as well as manual browsing.

Entities: Chemical

Mesh：

Year: 2005 PMID： 16216832 DOI： 10.1093/bioinformatics/bti579

Source DB: PubMed Journal: Bioinformatics ISSN： 1367-4803 Impact factor: 6.937

Keyword Cloud
Cited

11 in total

Review 1. Identification of genes encoding tRNA modification enzymes by comparative genomics.

Authors: Valérie de Crécy-Lagard
Journal: Methods Enzymol Date: 2007 Impact factor: 1.600

Review 2. A bioinformatician's guide to metagenomics.

Authors: Victor Kunin; Alex Copeland; Alla Lapidus; Konstantinos Mavromatis; Philip Hugenholtz
Journal: Microbiol Mol Biol Rev Date: 2008-12 Impact factor: 11.056

3. On the artefactual parasitic eubacteria clan in conditioned logdet phylogenies: heterotachy and ortholog identification artefacts as explanations.

Authors: Ajanthah Sangaralingam; Edward Susko; David Bryant; Matthew Spencer
Journal: BMC Evol Biol Date: 2010-11-09 Impact factor: 3.260

CoGenT++: an extensive and extensible data environment for computational genomics.

Review 1. Identification of genes encoding tRNA modification enzymes by comparative genomics.

Review 2. A bioinformatician's guide to metagenomics.

3. On the artefactual parasitic eubacteria clan in conditioned logdet phylogenies: heterotachy and ortholog identification artefacts as explanations.

4. Protein coalitions in a core mammalian biochemical network linked by rapidly evolving proteins.

5. Stratification of co-evolving genomic groups using ranked phylogenetic profiles.

6. The Modular Organization of Protein Interactions in Escherichia coli.

7. Detection of genomic idiosyncrasies using fuzzy phylogenetic profiles.

8. Denoising inferred functional association networks obtained by gene fusion analysis.

Review 9. Data integration in biological research: an overview.

10. The chlamydiales pangenome revisited: structural stability and functional coherence.