Golf Kauai Hawaii - Kauai Golf Courses - Kauai Golf Packages

Optimisation automatique du plomb des inhibiteurs MMP-12 utilisant un algorithme génétique

Utilisation de données biologiques dans “ temps réel ” Il y a plus de 10 ans, plusieurs groupes ont suggéré de lancer un programme d’optimisation de la chimie.1 − 7 Chez GlaxoSmithKline (GSK), nous avons conservé un intérêt pour de telles approches depuis plusieurs années et nous avons tenté plusieurs fois ou mener des projets d’optimisation de cette manière. Cependant, plusieurs facteurs ont contribué à des résultats incomplets seulement. Le cycle de fabrication / test traditionnel peut être très long pour n’importe quoi mais la chimie la plus directe. Ceci est aggravé par le fait que les algorithmes tendent à suggérer un petit nombre de produits non-combinatoires.Les temps de cycle prolongés fournissent beaucoup de temps pour la réflexion et l’analyse, qui seront inévitablement en concurrence avec les suggestions de l’algorithme, en particulier dans les premiers stades. En outre, d’autres facteurs externes entrent en jeu, tels que la structure et la relation d’activité des séries connexes, ce qui peut rendre le modèle actuel moins intéressant pour le programme.Une plateforme de chimie et de biologie microfluidique8 fournissant des adresses d’opération autonomes beaucoup de ces problèmes et est idéalement adapté à une optimisation axée sur la biologie en temps réel. De tels systèmes offrent l’avantage d’une synthèse rapide dans des conditions contrôlées, suivie d’une mesure presque immédiate de la réponse biologique. Lorsqu’elles sont guidées par les outils logiciels appropriés, ces plates-formes se prêtent à un fonctionnement 24 heures sur 24, autonome et sans surveillance. Le processus itère sur les “ μ -COSM ” (collecte des étapes et des matériaux), en utilisant le DAS généré à chaque itération pour concevoir le choix du réactif et des réactions pour les cycles suivants. Le but ultime est de découvrir le (s) produit (s) optimal (s) accessible (s) à partir de chaque μ -COSM dans le temps minimum. Nous avons implémenté avec succès les composants individuels d’un tel système.9 − 13 Cependant, la chimie médicinale traditionnelle L’analyse SAR devient le goulot d’étranglement lorsque les temps de cycle des minutes peuvent être atteints grâce à l’automatisation. Ainsi, pour que le système fonctionne efficacement, un algorithme de conception efficace est nécessaire pour piloter chaque itération. Pour faciliter le développement et la validation des algorithmes pour piloter le processus de sélection autonome, il faut idéalement accéder à un ensemble de données combinatoires de portée raisonnable. Cependant, ces ensembles de données sont relativement rares. Ainsi, pour valider notre approche et démontrer le concept d’optimisation autonome, une expérimentation à grande échelle a été entreprise avec les objectifs suivants: (1) Mettre en place un environnement de test pour évaluer les performances des plateformes microfluidiques en cours de développement rapide de composés, en fournissant des échantillons de composés de haute qualité préparés et purifiés par des procédés conventionnels et des données de test de haute qualité (dans des tests conventionnels à base de plaques) pour servir de standards contre lesquels comparer la sortie correspondante de la plate-forme microfluidique. Fournir un environnement de test dans lequel évaluer des algorithmes pour la sélection de composés autonomes potentiels, en fonctionnant en temps réel à travers 10 générations de synthèse et de dosage en utilisant des processus conventionnels, guidés par un algorithme d’optimisation approprié (voir ci-dessous). compléter l’ensemble de données par rapport auquel évaluer l’efficacité des algorithmes ci-dessus et d’autres pour l’optimisation itérative du fil, par des synthèses izing (par plusieurs voies différentes appropriées aux groupes R), en purifiant, en analysant et en testant un 50 &#x000d7 complet; 50 Dans ce document, nous décrivons les résultats de cette expérience, ainsi que les détails d’un optimiseur d’algorithme génétique (GAO) développé spécifiquement pour conduire notre système microfluidique. Les structures chimiques d’un 50 × La bibliothèque 50, synthétisée de manière conventionnelle, est divulguée avec des données de CQ et biologiques associées, fournissant ainsi un ensemble de données unique et précieux pour l’exploration et le développement algorithmique. Le GAO utilisé pour conduire chaque cycle d’itération est similaire aux publications précédentes, 1,2 et le schéma général est illustré à la Figure ​ Figure1.1. Cependant, nous avons incorporé un certain nombre de fonctionnalités supplémentaires importantes. Dans le langage de l’AG, chaque réactif est un allèle dans un gène spécifique (produit). La bibliothèque complète, ou génome, est la collection de gènes. La population est l’ensemble des molécules (individus) qui ont été ou seront fabriquées. Pour démarrer le processus, l’utilisateur fournit l’algorithme avec le génome et divers paramètres d’optimisation. L’algorithme génère la population de départ (chaque molécule étant une combinaison d’allèles de chaque gène), et les composés sont synthétisés et testés. La population est mise à jour avec les résultats du dépistage (scores), et une nouvelle population est générée à l’aide d’opérateurs génétiques. Le processus est répété jusqu’à ce que la convergence ou un nombre d’itérations défini par l’utilisateur soit atteint. Ici, nous mettons en évidence plusieurs caractéristiques importantes de la mise en œuvre qui le distinguent des approches précédentes, avec des détails approfondis fournis dans l’information de support. Figure 1Outline du processus GAO.Tout processus expérimental, que la synthèse ou le dosage, sera sujette à des erreurs . De même, certaines molécules peuvent ne pas être synthétisables. Ainsi, un nouvel aspect de l’algorithme décrit ici est de permettre ces erreurs potentielles dans le processus d’optimisation. À chaque itération, les personnes sélectionnées pour être parent sont considérées pour un nouveau test. Si le parent a été testé moins d’un nombre de fois défini par l’utilisateur, il sera marqué pour un nouveau test.Une proportion d’individus aléatoires peut être un bon moyen de maintenir la diversité au sein de la population. Dans le contexte d’un tableau virtuel, il est possible d’identifier des régions de l’espace qui ont été mal échantillonnées. Ainsi, comme alternative à l’opérateur aléatoire, un opérateur de recherche a été implémenté pour identifier ces régions et focaliser la génération aléatoire. Si GAO demande un test et qu’il n’y a aucun résultat disponible pour le test, alors l’utilisateur peut faire l’une des trois choses suivantes : n’ajoutez aucune entrée pour le test dans le fichier de remise en forme, ajoutez une entrée avec des données de remise en forme ou ajoutez une entrée avec “ < NULL_FITNESS > ” Dans tous les cas, GAO gardera l’individu pour retester et demandera qu’il soit testé à nouveau à une génération future. Toutes les personnes non testées seront stockées dans le fichier de population en tant qu’individus sans données de condition physique. Si l’utilisateur souhaite indiquer que le test ne peut pas être effectué et que le GAO ne doit pas demander un nouveau test, l’utilisateur marque l’individu avec “ < NULL_INDIV > ” comme l’aptitude.L’algorithme ne sait rien sur la composition chimique des réactifs individuels (allèles) ou les produits. Ainsi, nous avons implémenté la possibilité de définir la similarité entre les allèles. La similarité est définie en termes de distance et n’a pas besoin d’être symétrique. De plus, les allèles peuvent être groupés. Deux allèles qui ne sont pas dans le même groupe ont une similitude de zéro. Un allèle peut appartenir à plus d’un groupe. Il existe de nombreuses façons de définir la similarité entre les réactifs et les composés de regroupement ou de regroupement, et la mise en œuvre laisse à l’utilisateur le soin de décider des critères les plus appropriés, en fonction du problème rencontré. Par exemple, un groupe d’hétérocycles peut appartenir à la fois à un groupe de substituants cycliques aromatiques et à un groupe de substituants accepteurs de liaisons hydrogène. La similitude entre les produits (gènes) plutôt qu’entre les réactifs (allèles individuels) peut également être définie. Lorsqu’elle est activée, la similarité et le groupement conduisent à des conditions de sélection modifiées pour le croisement et la mutation qui tiennent compte de la similarité moléculaire ou du réactif en plus de la similitude de la réponse biologique. Si l’utilisateur a défini un ensemble initial de groupements ou de similitudes aux données biologiques réelles obtenues? Est-il possible d’apprendre des regroupements appropriés et de générer ainsi un DAS implicite à partir des données? Pour répondre à ces questions, des options ont été ajoutées pour réévaluer les niveaux de similarité associés au sein des groupes à intervalles réguliers au cours de l’optimisation. L’algorithme utilise l’écart-type de l’aptitude au sein du groupe pour redéfinir la similarité du groupe. Pour tester le GAO, nous avons utilisé des données provenant d’une matrice combinatoire interne de 7 amines de 80 acides sur un modèle conçu dans un programme de découverte de médicaments. Les composés avaient des valeurs de pIC50 variant de 4 à 8,8. Les données n’étaient pas disponibles sur 24 membres du tableau, et ceux-ci ont été définis sur NULL_INDIV (voir ci-dessus). Pour rendre l’expérience plus réaliste, 100 amines et 100 acides supplémentaires ont été sélectionnés au hasard à partir d’une base de données de réactifs interne et utilisés pour étendre la bibliothèque à 19260 composés. Les données d’activité pour les composés supplémentaires ont été fixées à un nombre aléatoire sur l’intervalle 3.5 − 4. Le GAO a été exécuté avec les paramètres par défaut et en mode d’optimisation (croisement, 40%, mutation, 60%) ou . L’algorithme a été exécuté jusqu’à l’exhaustivité, c’est-à-dire jusqu’à ce que tous les produits aient été sélectionnés, et les résultats ont été moyennés sur 50 analyses indépendantes (différentes graines de nombres aléatoires). La performance d’optimisation est représentée sur la figure ​ Figure2,2, pour différentes tailles de génération: 5, 10, 15, 20, 25, 30 et 50 (où la taille de génération est le nombre de molécules sélectionnées dans cette génération). Le score représente l’activité moyenne des 10 molécules les plus actives de la population à ce stade. L’optimisation fonctionne bien par rapport à la marche aléatoire avec les cycles d’optimisation convergeant après environ 2000 molécules sur toutes les tailles de génération. Figure 2 Activité moyenne des 10 premiers composés les plus actifs sélectionnés jusqu’à présent en fonction de la taille de la population. Les résultats représentent la moyenne de 50 passages à chaque taille de génération. (a) La performance globale avec l’optimisation s’exécute comme des lignes pleines et le hasard … En regardant de plus près la première partie de la courbe (Figure ​ (Figure2b), 2b), on peut voir que un impact mineur sur les performances d’optimisation, sauf pour une taille de génération de 50. L’algorithme se souvient et peut utiliser toutes les données générées, pas seulement celles de la dernière génération (voir Informations de support). Les résultats de cette analyse rétrospective suggèrent que le nombre d’itérations est plus important que la taille de la génération en soi. Des tailles de génération plus petites permettent une utilisation plus efficace de l’information. Les résultats ci-dessus montrent que le GAO peut identifier efficacement de petits îlots d’activité à partir de grands ensembles composés.En fait, l’algorithme fonctionne de manière équivalente à un sous-ensemble conçu synthétisé sous la forme d’un tableau combinatoire. Il est donc parfaitement adapté au problème posé, à savoir piloter un système de synthèse et de test microfluidique pour l’optimisation des leads où les temps de cycle signifient que de nombreuses itérations sont possibles. Ces résultats nous ont donné suffisamment de confiance pour valider davantage l’approche en appliquant l’algorithme dans un cadre prospectif. La MMP-12 est une cible d’importance thérapeutique, et le criblage à haut débit interne (HTS) a identifié une série de biaryl sulfonamides représentés par 1, se prête à la synthèse de tableau. Ainsi, cette cible et cette série ont été choisies pour l’expérience tadalafilfrance.com. Conformément au premier objectif ci-dessus, les composés ont été synthétisés et criblés de manière itérative hors de la plate-forme en utilisant des méthodes conventionnelles telles que décrites dans les Informations de Support. L’expérience impliquait deux efforts de synthèse indépendants. Le premier était axé sur la synthèse d’un 50 &#x000d7 complet; 50 array avec des tests biologiques ultérieurs (voir les informations de support). Le pool de réactifs initial a été sélectionné en tenant compte de la diversité afin de permettre l’exploration d’un espace chimique aussi complet que possible, tout en maintenant un profil physico-chimique raisonnable. Les réactifs ont été sélectionnés à l’aide du système ADEPT14, une application Web interne qui fournit des outils pour identifier les réactifs disponibles, calculer les propriétés, affiner la liste des réactifs et énumérer les bibliothèques virtuelles. Une implication importante de l’approche de sélection des réactifs est que des chimies différentes étaient nécessaires dans la synthèse de la bibliothèque complète, de sorte qu’une approche de chimie combinatoire traditionnelle à l’ensemble complet ne serait pas réalisable. Des problèmes similaires se poseront lorsque l’on tentera de déplacer cette chimie vers la plate-forme microfluidique, non pas à cause du grand nombre de schémas réactionnels, mais à cause de la nécessité de déterminer a priori la chimie la plus appropriée pour un produit particulier. . Il est intéressant de noter que les capacités de retest du GAO fournissent une approche à ce problème et, en principe au moins, le GAO pourrait apprendre des réactions réussies pour les réactifs liés.Dans un deuxième effort indépendant, les composés ont été synthétisés conformément aux résultats des sélections GAO. Tirant les leçons de l’analyse rétrospective, nous avons choisi de synthétiser 14 composés par génération. GAO a été géré avec crossover, 50%; mutation, 40%; et aléatoire, 10%. Pour éviter que les premières générations ne recherchent des points de départ actifs, la première génération a été ensemencée avec deux composés connus pour être actifs (A04B02 et A28B02), tandis que les 12 restants ont été sélectionnés au hasard par GAO. Aucune connaissance structurale (telles que les caractéristiques de regroupement et de regroupement de GAO) n’a été utilisée dans cette expérience préliminaire, même si on s’attendait à une optimisation plus rapide. Au total, il y a eu 10 itérations de synthèse et de test. Tous les résultats sont montrés par rapport aux données du tableau complet pour la cohérence, bien que la corrélation entre les résultats soit très élevée. Des résultats détaillés pour la bibliothèque complète sont donnés dans l’information d’appui, avec une indication de la génération du GAO où en vigueur. La carte thermique de la bibliothèque complète est représentée sur la figure ​ Les réactifs ont été triés par leur valeur maximale de pIC50. Une vue alternative des données est donnée dans la Figure ​ Figure4.4. Ceci présente un histogramme de la proportion de composés dans une plage d’activité définie, en comparant la bibliothèque complète (barres rouges) à la sélection GAO-optimisée (barres bleues). A partir de ces chiffres, il est clair que le GAO a en effet optimisé la sélection, en privilégiant les molécules d’activité supérieure dans l’ensemble de données. Par exemple, en considérant une coupure de pIC50 > 6, l’ensemble composé GAO a 68/140 (48,5%) de composés dans cette gamme d’activité par rapport à seulement 21,3% de l’ensemble du tableau. Bien sûr, alors que l’enrichissement est bon, tous les composés les plus puissants n’ont pas été suggérés dans l’ensemble limité de composés. Est-ce un problème? Nous ne le ferions pas. Clairement, cette question n’a de valeur qu’une fois que tous les composés ont été faits (bénéfice du recul). Nous avons déjà montré dans l’expérience précédente que, avec suffisamment d’itérations, GAO localisera tous les composés actifs significativement plus efficacement qu’une marche aléatoire. Cependant, ce qui est plus important, c’est que toute optimisation subséquente est axée sur la région la plus pertinente de l’espace de la chimie. De la figure ​ Figure3,3, on peut voir que SAR est plus serré autour de R2, et cela est évident à partir de la sortie GAO. Neuf des 10 réactifs les mieux classés pour R2 (tri par le composé le plus actif) ont été couverts avec des composés ayant pIC50 > 6. Le “ manquant ” le réactif est B07, phényle, qui n’a pas été sélectionné du tout durant le nombre limité d’itérations utilisé ici.Cependant, à la fois le p-Br et le p-Me-phényle sont inclus dans l’ensemble GAO, fournissant ainsi suffisamment d’informations pour focaliser une autre itération.Figure 3 Cartes de la chaleur de l’activité pour la bibliothèque complète et la bibliothèque optimisée GAO. (a) Carte thermique MMP-12 pIC50 pour la bibliothèque complète. (b) carte thermique pour la bibliothèque GAO, carrés solides; superposé sur la carte de chaleur complète de la bibliothèque, carrés ouverts. Les réactifs sont triés par … Figure 4Proportion de composés échantillonnés par GAO (barres bleues) par rapport à la bibliothèque complète (barres rouges) en fonction de MMP12 pIC50. Les résultats montrent que le GAO est un processus d’optimisation robuste. Dans l’ensemble, 25% de la bibliothèque complète (620 composés) n’ont pas pu être synthétisés, comme le montre la figure ​ Figure 44 (barres rouges). Un autre 7% (176 composés) étaient inactifs dans l’essai. Ainsi, près d’un tiers de la bibliothèque n’a fourni aucun SAR. Figure ​ La figure 55 montre les plages d’activité pour chacune des 10 générations. Comme indiqué ci-dessus, GAO peut utiliser les informations de toutes les itérations précédentes, de sorte que l’aptitude de la bibliothèque dans son ensemble devrait s’améliorer, ce qui peut être moins apparent dans une génération particulière (par exemple, si tous les composés les plus puissants ont déjà été fabriqué). Néanmoins, les générations individuelles peuvent fournir des informations intéressantes sur les progrès de l’optimisation. Dans la première génération, trois des molécules n’ont pas pu être fabriquées, et deux autres étaient inactives au test. Le nombre de composés non synthétisables et inactifs diminue au cours des prochaines générations, puis augmente de nouveau au fur et à mesure que le GAO cherche de nouvelles zones à explorer.Figure 5Gammes d’activité pour chaque génération du GAO. En conclusion, la mise en œuvre d’une plateforme microfluidique l’optimisation nécessite une combinaison de technologie robuste et d’informatique pour soutenir le processus. Les temps de cycle réalisables sur une plate-forme microfluidique signifient que des alternatives aux stratégies traditionnelles d’optimisation de la chimie médicinale doivent être explorées, sinon l’interprétation des données et la prise de décision qui en résulte deviennent le goulot d’étranglement. Dans cet article, nous avons décrit une procédure d’optimisation, GAO, basée sur les principes d’un algorithme génétique. GAO intègre de nouvelles fonctionnalités qui le rendent particulièrement adapté à la tâche. Il est robuste aux données manquantes et peut suggérer que les composés doivent être refaits et retestés. Dans une expérience prospective impliquant l’optimisation d’une série de composés contre MMP-12, les composés ont été synthétisés et testés en utilisant une méthodologie classique de synthèse et de criblage selon les suggestions de GAO dans des cycles de 14 composés. La bibliothèque complète de 2500 composés a été synthétisée indépendamment pour fournir des preuves que le GAO a effectivement optimiser et trouver des molécules puissantes. En seulement 10 cycles, ou 140 composés soumis à la synthèse, un échantillonnage approfondi de la région active de l’espace chimique a été réalisé, et les composés actifs ont été identifiés pour une étude plus approfondie. Les structures chimiques de la bibliothèque complète sont décrites avec CQ et données biologiques associées, fournissant ainsi un ensemble de données unique et précieux pour l’exploration et le développement algorithmique. Cette expérience de preuve de principe illustre que les algorithmes d’optimisation utilisés dans de nombreuses autres disciplines et industries sont applicables. la chimie médicinale, une fois que les goulets d’étranglement de la synthèse et du criblage sont surmontés. Bien que cette expérience d’optimisation ait été menée sur un seul paramètre (inhibition MMP-12), les méthodes sous-jacentes peuvent facilement être adaptées pour orienter l’optimisation multiobjectif.15