|
|
|
|
Published online before print
November 12, 2003, 10.1101/gr.1532103 Genome Res. 13:2725-2735, 2003 ©2003 by Cold Spring Harbor Laboratory Press; ISSN 1088-9051/03 $5.00
Resources Analysis and Functional Annotation of an Expressed Sequence Tag Collection for Tropical Crop Sugarcane1 Centro de Biologia Molecular e Engenharia Genética, Instituto da Computação, Universidade Estadual de Campinas, 13083-970, CampinasSP, Brazil 2 Laboratório de Bioinformática, Instituto da Computação, Universidade Estadual de Campinas, 13083-970, CampinasSP, Brazil 3 Departamento de Bioquímica, Instituto de Química, Instituto de Ciências Biomédicas, Universidade de São Paulo, 05508-900, São PauloSP, Brazil 4 Departamento de Botânica, Instituto de Biociências, Instituto de Ciências Biomédicas, Universidade de São Paulo, 05508-900, São PauloSP, Brazil 5 Departamento de Microbiologia, Instituto de Ciências Biomédicas, Universidade de São Paulo, 05508-900, São PauloSP, Brazil 6 Departamento de Tecnologia, Faculdade de Ciências Agrárias e Veterinárias de Jaboticabal, Universidade Estadual Paulista, 14884-900, JaboticabalSP, Brazil 7 Departamento de Biologia Aplicada à Agropecuária, Faculdade de Ciências Agrárias e Veterinárias de Jaboticabal, Universidade Estadual Paulista, 14884-900, JaboticabalSP, Brazil 8 Departamento de Genética e Evolução, Universidade Federal de São Carlos, 13565905 São CarlosSP, Brazil 9 Departamento de Biotecnologia Vegetal, Centro de Ciências Agrárias, Universidade Federal de São Carlos, 13600-970, ArarasSP, Brazil 10 Escola Superior de Agricultura Luiz de Queiroz, Universidade de São Paulo, 13418-900, PiracicabaSP, Brazil 11 Laboratório de Genética Molecular e Genomas, Instituto de Pesquisa e Desenvolvimento, Universidade do Vale do Paraíba, 12244-000, São José dos CamposSP, Brazil 12 Departamento de Biotecnologia de Plantas Medicinais, Universidade de Ribeirão Preto, 14096-380, Ribeirão PretoSP, Brazil 13 Centro de Estudos de Insetos Sociais, Instituto de Biociências, Universidade Estadual Paulista, 13506-900, Rio ClaroSP, Brazil 14 Departamento de Biologia, Faculdade de Filosofia, Ciências e Letras de Ribeirão Preto, Universidade de São Paulo, 14040-901, Ribeirão PretoSP, Brazil 15 Núcleo Integrado de Biotecnologia, Universidade de Mogi das Cruzes, 08780-911, Mogi das CruzesSP, Brazil 16 Centro de Genética, Biologia Molecular e Fitoquímica, Instituto Agronômico de Campinas, Caixa Postal 28, 13001-970, CampinasSP, Brazil 17 Instituto de Física de São Carlos, Universidade de São Paulo, 13560-970, São CarlosSP, Brazil 18 Departamento de Defesa Fitossanitária, Faculdade de Ciências Agronômicas, Universidade Estadual Paulista, 18603-970, BotucatuSP, Brazil 19 Departamento de Genética, Instituto de Biociências, Universidade Estadual Paulista, 18618-000, BotucatuSP, Brazil 20 Centro APTA de Citros Sylvio Moreira, Instituto Agronômico de Campinas, 13490-970, CordeiropolisSP, Brazil 21 Departamento de Fonoaudiologia, Universidade Estadual Paulista, 17525-900, MaríliaSP, Brazil 22 Departamento de Ciências Farmacêuticas, Faculdade de Ciências Farmacêuticas de Ribeirão Preto, Universidade de São Paulo, 14040-903, Ribeirão PretoSP, Brazil 23 CIRAD, TA 40/03, UMR 1096, 34398 Montpellier cedex 5, France
To contribute to our understanding of the genome complexity of sugarcane, we undertook a large-scale expressed sequence tag (EST) program. More than 260,000 cDNA clones were partially sequenced from 26 standard cDNA libraries generated from different sugarcane tissues. After the processing of the sequences, 237,954 high-quality ESTs were identified. These ESTs were assembled into 43,141 putative transcripts. Of the assembled sequences, 35.6% presented no matches with existing sequences in public databases. A global analysis of the whole SUCEST data set indicated that 14,409 assembled sequences (33% of the total) contained at least one cDNA clone with a full-length insert. Annotation of the 43,141 assembled sequences associated almost 50% of the putative identified sugarcane genes with protein metabolism, cellular communication/signal transduction, bioenergetics, and stress responses. Inspection of the translated assembled sequences for conserved protein domains revealed 40,821 amino acid sequences with 1415 Pfam domains. Reassembling the consensus sequences of the 43,141 transcripts revealed a 22% redundancy in the first assembling. This indicated that possibly 33,620 unique genes had been identified and indicated that >90% of the sugarcane expressed genes were tagged.
Article and publication are at http://www.genome.org/cgi/doi/10.1101/gr.1532103. Article published online before print in November 2003. 24 Present address: Instituto Ludwig de Pesquisa sobre o Câncer, 01509-010, São PauloSP, Brazil. 25 Present address: Embrapa Recursos Genéticos e BiotecnologiaCENARGEN, Caixa Postal 02372, 70770-900, BrasiliaDF, Brazil. 26 Present address: Monsanto Company, Mailzone Q4B, St. Louis, MO 63167, USA. 27 Present address: Alellyx Applied Genomics, Rodovia Anhanguera, Km 104 (Techno Park), Rua James Clerk Maxwell, 320, 13067-850, CampinasSP, Brazil. 28 Present address: Scylla Bioinformatics, 13083-970, CampinasSP, Brazil.
29 Corresponding author.
[Supplemental material is available online at http://sucest.lad.ic.unicamp.br/public. The sugarcane EST sequence data described in this paper have been submitted to GenBank under accession nos. CA064599
This article has been cited by other articles:
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||