MÉTODO DE OTIMIZAÇÃO DE UMA SEQUÊNCIA NUCLEOTÍDICA PARA EXPRESSÃO EM UM ORGANISMO ALVO
MODELOS COMPUTACIONAIS PARA DESENHO DE GENE SINTÉTICO. A presente invenção é delineada por métodos para desenhar sequências nucleotídicas sintéticas que codificam polipeptídeos de interesse. Os métodos envolvem a organização de um banco de dados de sequências como grupo de sequências de oligômero de...
Gespeichert in:
1. Verfasser: | |
---|---|
Format: | Patent |
Sprache: | por |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | MODELOS COMPUTACIONAIS PARA DESENHO DE GENE SINTÉTICO. A presente invenção é delineada por métodos para desenhar sequências nucleotídicas sintéticas que codificam polipeptídeos de interesse. Os métodos envolvem a organização de um banco de dados de sequências como grupo de sequências de oligômero de N-comprimento e a compilação de uma lista de escores de probabilidade para cada sequência de N-comprimento. Os escores de probabilidade são usados para substituir uma ou mais sequências de escore mais alto na sequência nucleotídica parental para gerar uma sequência otimizada. A sequência nucleotídica de interesse pode ser ainda otimizada pela remoção tanto das regiões de leitura abertas não intencionais como de elementos de DNA curtos indesejados, e/ou substituição de sequências de oligômero para alcançar um conteúdo G:C específico. Estes métodos podem ser usados para otimizar a expressão de genes heterólogos em qualquer organismo, particularmente em plantas. O método gera sequências sintéticas com uma composição similar àquela de um banco de dados alvo. Estas sequências sintéticas podem ser usadas, por exemplo, para regular a atividade pesticida ou a resistência à herbicida em organismos, particularmente plantas ou células vegetais.
The present invention is drawn to methods for designing synthetic nucleotide sequences encoding polypeptides of interest. The methods involve organizing a database of sequences as a set of N-length oligomer sequences and compiling a list of probability scores for each N-length sequence. The probability scores are used to substitute one or more higher-scoring sequences into the parent nucleotide sequence to generate an optimized sequence. The nucleotide sequence of interest may be further optimized by removing either or both of unintended open reading frames or undesired short DNA elements, and/or substituting oligomer sequences to achieve a specific G:C content. These methods may be used for optimizing expression of heterologous genes in any organism, particularly in plants. The method generates synthetic sequences with a composition similar to that of a target database. These synthetic sequences may be used, for example, for regulating pesticidal activity or herbicide resistance in organisms, particularly plants or plant cells. |
---|