DAC - NG302 - Biologia Sistêmica e Integrativa Aplicada na Análise de Dados Moleculares

Ementa:

O advento das tecnologias de sequenciamento de alto desempenho, também conhecido como de nova geração, ocasionou a possibilidade de obtenção de um grande volume de dados biológicos, com efeitos diretos no estudo que questões ligadas ao dogma central da Biologia Molecular. Assim, as propostas atuais de projetos de pesquisa, passaram a incorporar questões mais complexas, com traveses mais preditivos, descritivos e agrupando informações de diferentes fontes de dados moleculares para o estudo dos sistemas e componentes biológicos envolvidos no projeto proposto. Esta revolução na aquisição de dados está sendo acompanhada de perto pela Biologia Computacional e Bioinformática, com o desenvolvimento de novas ferramentas estatísticas, matemáticas e computacionais capazes de lidar com esses grandes volumes de dados e a correlação destes com diferentes bancos de dados biológicos. Esta disciplina visa apresentar aos estudantes abordagens práticas de Biologia Computacional e Bioinformática capacitando-os para análise qualitativa dos arquivos de sequenciamentos, proposição de montagens de transcritos de novo ou baseada em modelos genômicos disponíveis, avaliação da expressão diferencial de genes/contigs entre situações diversas e anotação funcional dos transcritos envolvidos na análise. Adicionalmente, capacitar ou atualizar os alunos na utilização de ferramentas disponíveis no sistema operacional GNU/LINUX para a execução de todas as metodologias apresentadas durante o curso.

Bibliografia:

Buchfink B, Xie C, Huson DH. 2015. Fast and sensitive protein alignment using DIAMOND. Nat Methods 12(1): 59-60. Calvo B, Larranaga P, Lozano JA. 2007. Learning Bayesian classifiers from positive and unlabeled examples. Pattern Recognition Letters 28(16): 2375-2384. Chevreux B, Pfisterer T, Drescher B, Driesel AJ, Muller WE, Wetter T, Suhai S. 2004. Using the miraEST assembler for reliable and automated mRNA transcript assembly and SNP detection in sequenced ESTs . Genome Res 14(6): 1147-1159. Clarke K, Yang Y, Marsh R, Xie L, Zhang KK. 2013. Comparative analysis of de novo transcriptome assembly. Sci China Life Sci 56(2): 156-162. Dean J, Ghemawat S 2004. MapReduce: simplified data processing on large clusters.In. Proceedings of the 6th conference on Symposium on Opearting Systems Design & Implementation - Volume 6. San Francisco, CA: USENIX Association. 10-10. Eddy SR. 2011. Accelerated Profile HMM Searches. PLoS Comput Biol 7(10): e1002195. Finn RD, Bateman A, Clements J, Coggill P, Eberhardt RY, Eddy SR, Heger A, Hetherington K, Holm L, Mistry J, Sonnhammer EL, Tate J, Punta M. 2014. Pfam: the protein families database. Nucleic acids research 42(Database issue): D222-230. Fu L, Niu B, Zhu Z, Wu S, Li W. 2012. CD-HIT: accelerated for clustering the next-generation sequencing data. Bioinformatics 28(23): 3150-3152. Grabherr MG, Haas BJ, Yassour M, Levin JZ, Thompson DA, Amit I, Adiconis X, Fan L, Raychowdhury R, Zeng Q, Chen Z, Mauceli E, Hacohen N, Gnirke A, Rhind N, di Palma F, Birren BW, Nusbaum C, Lindblad-Toh K, Friedman N, Regev A. 2011. Fulllength transcriptome assembly from RNA-Seq data without a reference genome. Nat Biotechnol 29(7): 644-652. Haas BJ, Papanicolaou A, Yassour M, Grabherr M, Blood PD, Bowden J, Couger MB, Eccles D, Li B, Lieber M, Macmanes MD, Ott M, Orvis J, Pochet N, Strozzi F, Weeks N, Westerman R, William T, Dewey CN, Henschel R, Leduc RD, Friedman N, Regev A. 2013. De novo transcript sequence reconstruction from RNA-seq using the Trinity platform for reference generation and analysis. Nat Protoc 8(8): 1494-1512. He JZ, Zhang Y, Li X, Shi P. 2012. Learning naive Bayes classifiers from positive and unlabelled examples with uncertainty. International Journal of Systems Science 43(10): 1805-1825. Kadota K, Nishiyama T, Shimizu K. 2012. A normalization strategy for comparing tag count data. Algorithms Mol Biol 7(1): 5. Kanehisa M, Araki M, Goto S, Hattori M, Hirakawa M, Itoh M, Katayama T, Kawashima S, Okuda S, Tokimatsu T, Yamanishi Y. 2008. KEGG for linking genomes to life and the environment. Nucleic acids research 36(Database issue): D480-484. Kersey PJ, Staines DM, Lawson D, Kulesha E, Derwent P, Humphrey JC, Hughes DST, Keenan S, Kerhornou A, Koscielny G, Langridge N, McDowall MD, Megy K, Maheswari U, Nuhn M, Paulini M, Pedro H, Toneva I, Wilson D, Yates A, Birney E. 2011. Ensembl Genomes: an integrative resource for genome-scale data from non-vertebrate species. Nucleic acids research 40(D1): D91-D97. Koski LB, Gray MW, Lang BF, Burger G. 2005. AutoFACT: an automatic functional annotation and classification tool. Bmc Bioinformatics 6: 151. Kumar S, Blaxter ML. 2010. Comparing de novo assemblers for 454 transcriptome data. BMC Genomics 11: 571. Li B, Dewey CN. 2011. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. Bmc Bioinformatics 12: 323. Ludwig W, Strunk O, Westram R, Richter L, Meier H, Yadhukumar, Buchner A, Lai T, Steppi S, Jobb G, Forster W, Brettske I, Gerber S, Ginhart AW, Gross O, Grumann S, Hermann S, Jost R, Konig A, Liss T, Lussmann R, May M, Nonhoff B, Reichel B, Strehlow R, Stamatakis A, Stuckmann N, Vilbig A, Lenke M, Ludwig T, Bode A, Schleifer KH. 2004. ARB: a software environment for sequence data. Nucleic acids research 32(4): 1363-1371. Manning CD, Raghavan P, Schütze H. 2008. Introduction to information retrieval. New York: Cambridge University Press. Mlecnik B, Scheideler M, Hackl H, Hartler J, Sanchez-Cabo F, Trajanoski Z. 2005. PathwayExplorer: web service for visualizing high-throughput expression data on biological pathways. Nucleic acids research 33(Web Server issue): W633-637. Moreno-Hagelsieb G, Latimer K. 2008. Choosing BLAST options for better detection of orthologs as reciprocal best hits. Bioinformatics 24(3): 319-324. R-Core-Team. 2013. R: A language and environment for statistical computing. Book R: A language and environment for statistical computing. Supek F, Bosnjak M, Skunca N, Smuc T. 2011. REVIGO summarizes and visualizes long lists of gene ontology terms. PLoS One 6(7): e21800. Waterhouse RM, Tegenfeldt F, Li J, Zdobnov EM, Kriventseva EV. 2013. OrthoDB: a hierarchical catalog of animal, fungal and bacterial orthologs. Nucleic acids research 41(Database issue): D358-365. Zhou S, Liao R, Guan J. 2013. When cloud computing meets bioinformatics: a review. J Bioinform Comput Biol 11(5): 1330002. Zou Q, Li XB, Jiang WR, Lin ZY, Li GL, Chen K. 2013. Survey of MapReduce frame oper

Ano de Catálogo: 2021

Créditos: 3

Código	Significado
/	ou
*	Pré-requisito parcial
AA200	Autorização da coordenação
AA450	Ter cursado 50% do curso (CP ≥ 50)
AA475	Ter cursado 75% do curso (CP ≥ 75)
AA480	Ter cursado 80% do curso (CP ≥ 80)

NG302 - Biologia Sistêmica e Integrativa Aplicada na Análise de Dados Moleculares - 2S/2021 Imprimir

Pós-Graduação

Informações da disciplina

Turma: MMB Vagas: 30

Horários