MÉTODO DE OTIMIZAÇÃO DE UMA SEQUÊNCIA NUCLEOTÍDICA PARA EXPRESSÃO EM UM ORGANISMO ALVO

MODELOS COMPUTACIONAIS PARA DESENHO DE GENE SINTÉTICO. A presente invenção é delineada por métodos para desenhar sequências nucleotídicas sintéticas que codificam polipeptídeos de interesse. Os métodos envolvem a organização de um banco de dados de sequências como grupo de sequências de oligômero de...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
1. Verfasser: DANIEL J. TOMSO
Format: Patent
Sprache:por
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:MODELOS COMPUTACIONAIS PARA DESENHO DE GENE SINTÉTICO. A presente invenção é delineada por métodos para desenhar sequências nucleotídicas sintéticas que codificam polipeptídeos de interesse. Os métodos envolvem a organização de um banco de dados de sequências como grupo de sequências de oligômero de N-comprimento e a compilação de uma lista de escores de probabilidade para cada sequência de N-comprimento. Os escores de probabilidade são usados para substituir uma ou mais sequências de escore mais alto na sequência nucleotídica parental para gerar uma sequência otimizada. A sequência nucleotídica de interesse pode ser ainda otimizada pela remoção tanto das regiões de leitura abertas não intencionais como de elementos de DNA curtos indesejados, e/ou substituição de sequências de oligômero para alcançar um conteúdo G:C específico. Estes métodos podem ser usados para otimizar a expressão de genes heterólogos em qualquer organismo, particularmente em plantas. O método gera sequências sintéticas com uma composição similar àquela de um banco de dados alvo. Estas sequências sintéticas podem ser usadas, por exemplo, para regular a atividade pesticida ou a resistência à herbicida em organismos, particularmente plantas ou células vegetais. The present invention is drawn to methods for designing synthetic nucleotide sequences encoding polypeptides of interest. The methods involve organizing a database of sequences as a set of N-length oligomer sequences and compiling a list of probability scores for each N-length sequence. The probability scores are used to substitute one or more higher-scoring sequences into the parent nucleotide sequence to generate an optimized sequence. The nucleotide sequence of interest may be further optimized by removing either or both of unintended open reading frames or undesired short DNA elements, and/or substituting oligomer sequences to achieve a specific G:C content. These methods may be used for optimizing expression of heterologous genes in any organism, particularly in plants. The method generates synthetic sequences with a composition similar to that of a target database. These synthetic sequences may be used, for example, for regulating pesticidal activity or herbicide resistance in organisms, particularly plants or plant cells.