O que é Bioinformática

25 de setembro de 2017

sequence-fotoimages.com

Olá pessoal,

Como já foi falado em outros posts, este blog se propõe fornecer conteúdos, dicas, trazer questionamentos, enfim, qualquer informação relevante que acrescente nosso conhecimento sobre bioinformática e genômica. Mas como fazer isso sem antes entender melhor O QUE É a Bioinfomática?

Com esse intuito, foi disponibilizado um e-book sobre Bioinformática, Bioinformática Elementar: Um Almanaque de Bioinformática para Iniciantes, com um conteúdo bem mais completo e detalhado sobre o tema. Aqui serão dadas apenas algumas informações resumidas tiradas do próprio e-book.

Juntamente com o e-book foi também disponibilizado um Glossário de Termos de Bioinformática com termos comuns da área.

Necessidade de Análise de grande quantidade de dados

A crescente demanda pela utilização da informática, ou melhor dizendo da computação, para a análise de dados gerados na pesquisa biológica tem marcado o século XXI de forma irreversível. Especialmente em alguns setores de pesquisa em bioquímica, genética e biologia moleculares, o uso da computação já é imprescindível para que se possa chegar a resultados definitivos a partir dos dados experimentais (como p.ex., aqueles de eletroforese bidimensional, espectrometria de massa, etc). A análise de genomas e proteomas, bem como os estudos relativos à relação estrutura e função de proteínas e de outras macromoléculas de interesse biológico são os setores em que isso mais se evidencia atualmente.

Com a explosão de informações relativas a seqüências e estruturas protéicas disponíveis aos pesquisadores e ao público em geral, o campo da Bioinformática ou Biologia Computacional está cada vez mais envolvido na elucidação dos aspectos desconhecidos da estrutura e função de genes e proteínas. Evidentemente, a Bioinformática não se limita apenas a isso; em diversas áreas da biologia e da medicina podem ser usadas diferentes técnicas computacionais para resolver problemas médicos e/ou biológicos diversos (por exemplo, análise de imagens micro-, endo- e nanoscópicas, tomo- e ultrasonográficas, reconhecimento de padrões em sinais biológicos, etc).

O que é Bioinformática

O conceito de Bioinformática pode ser resumido como a utilização de técnicas advindas da matemática, estatística e computação para a análise de problemas de biologia. O termo bioinformática é um conceito relativamente recente, tendo aparecido corriqueiramente na literatura na década de 90. Contudo, a pesquisa em Bioinformática não é um assunto novo, sendo que os marcos iniciais da pesquisa datam da década de 1960.

A Bioinformática combina a Matemática, a Computação e as Engenharias na exploração e compreensão dos dados biológicos gerados em larga-escala, tais como em experimentos de sequenciamento de genomas, expressão gênica (chips, SAGE, microarrays, etc) e proteômica (espectrometria de massas). Como uma disciplina em franca expansão, a Bioinformática se presta como o “braço exato” dos projetos genoma e pós-genomas que continuam produzindo imensas quantidades de dados biológicos a partir de diversos organismos, e, destarte, necessitam de armazenamento e tratamento desses dados em BDs públicos cada vez mais complexos e volumosos. Isto gera uma demanda para data warehouses e sistemas de informação (SI) que acompanhem o crescimento exponencial desses BDs, ao lado da literatura cientifica correlata que também se avoluma acerca destes dados depositados.

Genômica e Bioinformática

Considerando que o objetivo de toda análise é a extração de conhecimentos relevantes, pode-se dizer que as sequências são os dados; a informação é o resultado da análise feita com aqueles dados, onde se buscam os significados; o conhecimento é a interpretação ou extrapolação das informações, consideradas num determinado contexto. Os dados, portanto, possuem uma dimensão atômica (ou individual), enquanto as informações assumem uma dimensão sintática (já que possuem um significado per si) e o conhecimento tem uma dimensão semântica, uma vez que representa uma reunião de significados dentro de um contexto.

A genômica atualmente compreende o sequenciamento de genomas, a determinação do conjunto completo de proteínas codificadas por um organismo, e o funcionamento dos genes e vias metabólicas (pathways) em um organismo. Assim, a genômica não somente lida com a determinação da informação genética presente num organismo, mas também com a compreensão dos mecanismos pelos quais essa
informação é usada pelo organismo.

A informação gerada na genômica é enorme, fazendo com que a interpretação e o gerenciamento dessa informação requeiram o uso de grande poder computacional, tanto em hardware como em softwares específicos. Toda a bioinformática está voltada para a aquisição, armazenamento, análise, e visualização da informação biológica. Os BDs, para armazenamento e análise de informação genômica, são atualmente ferramentas essenciais para os geneticistas e bioquímicos. A Proteômica compreende o estudo dos produtos gênicos codificados por um genoma, incluindo uma lista de quais genes são expressos, o momento de sua expressão, o tipo e a extensão de qualquer modificação pos-tradicional da proteína, a função da proteína codificada,e sua localização em vários compartimentos celulares.

Ferramentas Básicas

Existem diversas ferramentas que são usadas na bioinformática para análise dos dados. Aqui falaremos apenas de duas, por serem as mais populares.

A primeira é o BLAST. Essa é uma ferramenta de alinhamento entre duas sequências, onde estas são pareadas e realizada uma análise e busca por trechos coincidentes (regiões de similaridade). Se você tem uma sequência biológica e quer comparar com outra para identificar semelhanças você “faz um blast” (ou você vai “blastar” a sequência).

Essa ferramenta é muito usada para realizar consulta em banco de dados onde você tem uma query (a sequência) e realiza a consulta para buscar a sequência em questão (caso seja uma sequência conhecida) ou sequências similares (em caso de nova sequência em estudo ou não possuir no banco). Através de semelhanças encontradas é possível inferir algumas funções da sequência em questão.

A segunda é o CLUSTAL, uma ferramenta para alinhamento entre mais de duas sequências. Uma razão para se realizar esse tipo de alinhamento é a comparação entre múltiplas sequências, identificando entre elas funcionalidades em comum, podendo realizar inferências e identificar famílias de sequências biológicas.

Duas das fontes mais importantes sobre o tema e onde se pode obter mais informações sobre essas e outras ferramentas são o NCBI e EMBLE.

Conclusão

Esse é um assunto vasto que poderia gerar páginas e páginas de conteúdo. Como a proposta do blog é dar informações pontuais, aqui está apenas um resumo retirado do almanaque.

Ficamos agora por aqui, mas não esqueça, caso queira se aprofundar mais no tema não deixe de ler nosso e-boolk

 

 

Nenhum Comentário

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *