COMPUTATIONAL METHODS FOR SYNTHETIC GENE DESIGN
The present invention is drawn to methods for designing synthetic nucleotide sequences encoding polypeptides of interest. The methods involve organizing a database of sequences as a set of N-length oligomer sequences and compiling a list of probability scores for each N-length sequence. The probabil...
Gespeichert in:
1. Verfasser: | |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | The present invention is drawn to methods for designing synthetic nucleotide sequences encoding polypeptides of interest. The methods involve organizing a database of sequences as a set of N-length oligomer sequences and compiling a list of probability scores for each N-length sequence. The probability scores are used to substitute one or more higher-scoring sequences into the parent nucleotide sequence to generate an optimized sequence. The nucleotide sequence of interest may be further optimized by removing either or both of unintended open reading frames or undesired short DNA elements, and/or substituting oligomer sequences to achieve a specific G:C content. These methods may be used for optimizing expression of heterologous genes in any organism, particularly in plants. The method generates synthetic sequences with a composition similar to that of a target database. These synthetic sequences may be used, for example, for regulating pesticidal activity or herbicide resistance in organisms, particularly plants or plant cells.
La présente invention concerne des procédés de conception de séquences de nucléotides de synthèse codant des polypeptides d'intérêt. Les procédés impliquent l'organisation d'une base de données de séquences sous forme d'un ensemble de séquences d'oligomères de longueur N et la compilation d'une liste de scores de probabilité pour chaque séquence de longueur N. Les scores de probabilité sont utilisés pour substituer une ou plusieurs séquences à scores élevés dans la séquence de nucléotides parente pour générer une séquence optimisée. La séquence de nucléotides d'intérêt peut être par la suite optimisée en retirant l'un ou l'autre des cadres, ou les deux cadres, de lecture ouverts non voulus ou éléments d'ADN courts non souhaités, et/ou en substituant des séquences d'oligomères pour parvenir à une teneur G:C spécifique. Ces procédés peuvent être utilisés pour optimiser l'expression de gènes hétérologues dans n'importe quel organisme, en particulier dans les végétaux. Le procédé génère des séquences synthétiques ayant une composition similaire à celle d'une base de données cible. Ces séquences synthétiques peuvent être utilisées, par exemple, pour réguler une activité pesticide ou une résistance aux herbicides dans des organismes, en particulier des végétaux ou des cellules végétales. |
---|