客座博客:WEHI癌症治疗CRC药物化学小组负责人Jonathan Baell博士

2010年3月8日

我们CDD希望引起人们对社区有益发展的关注。在这种情况下, 最近出版的J. Med。化学纸 由我们的SAB成员Christopher Lipinski引起我们的注意“新的子结构过滤器,用于从筛选库中除去泛测定干扰化合物(PAINS)并将其排除在生物测定中。”我们认为,本文将帮助药物开发界避免在鲱鱼上浪费宝贵的资源。我们’我很高兴赞助作者的来宾博客条目,重点介绍了澳大利亚沃尔特和伊丽莎·霍尔医学研究所的乔纳森·贝尔(Jonathan Baell)博士所提供的科学驱动力背后的一些个人因素。除了强调这项重要工作之外,我们还邀请社区中的其他人对此主题或其他及时主题做出贡献。

“专利申请和已颁发专利现在对任期决定/地位与学术界的高质量手稿一样有价值。”

—杰夫·奥伯(Jeff Aube)2009

如果您愿意从事转化研究,那么这句话肯定会吸引您,因为总是欢迎您加入一点阿斯巴甜来奖励学术药物发现的艰难旅程。简而言之,对增值研究困难的认识似乎越来越受到关注。时间长了,因为您知道您的化合物只有在受专利保护的情况下才有价值,并且此过程可能会阻碍及时发布–因此,以不同的指标来判断您的工作是明智的。

从定义上说,专利就意味着新颖性和实用性,并且从某些推断中也可以理解,对吗?有什么更好的方法切实地向纳税人显示他们的钱去向?与转换研究一样,这一概念应得到奖励和鼓励。

当然,这是有问题的:任何具有主动性的专利律师都可能会就羧甲基-2-基乙酸的镇痛或解热特性申请一项临时专利,并乐意为之付出几美元的报酬(对于临时专利,这是几美元,但后来变得丑陋)。专利未经同行评审,与论文不同,不需要以能够对所涉及的科学创造力进行及时评估的方式撰写专利。直到获得专利的很多年后,才有合理的保证,这项工作甚至是新颖的和实用的。这可能会使判断翻译跟踪记录的过程变得混乱。真炖因此,显而易见的解决方案是对带有出版物的那些专利进行更多的评估,因为同行评审是评估真实科学进步的最便捷方法,对吗?

令人遗憾的是,现在,化学化学生物学联系正处于大锅中。像任何牢固的婚姻一样,这个奇妙而受到赞誉的婚姻并非没有问题,而现在,这些问题正在公开化。

具体来说,我在这里谈论的是能激发初级竞争测定,然后在二级结合测定中进行确认,最后在基于细胞的测定中成功读出的化合物的发现。稍作搜索就会发现相关化合物具有生物学活性的健康证据–始终是一个好兆头[与那些类似物众多但缺乏生物学文献的类相反。明确的黄牌。看到这个有用的链接: 克里斯托弗·利宾斯基(Christopher Lipinski)博士(辉瑞公司前Melior Discovery公司) ]。 您甚至可以看到与已知药物的相似之处。这样一来,您就可以将一些类似物放入清晰的IP空间,申请物质专利组合,并及时在合理的期刊上发表论文,瞧! –翻译历史记录开始看起来不错。

但是有一个问题。一个大问题。这些化合物实际上毫无用处的机会很大,在您对它们进行的任何测定中,它们都会以错误的读数简单地胜过您。即使您的筛查集不含已知的反应性基团,您对癌症的下一个治愈方法仍然可能是蛋白质反应性的,几乎没有发展的希望。

以烯基罗丹宁为例。它们通常是彩色的,可以螯合金属并以多种方式与蛋白质反应-侧链亲核试剂和肽骨架-在若丹宁本身上有多个反应位点!在某些罗丹宁中,而在另一些中没有,反应性可能是光诱导的。更糟糕的是,它们可能只会对您的蛋白质造成打击,而不会被用作选择性对照。基本上,这些令人讨厌的事情可以在多种不同的检测方案中得到证实,并且令人信服地显示为真正的成功案例,已经成熟。它们很容易获得,在计算机筛查命中中很常见,并且将类似地显示为已确认的活性物质,并且似乎可以同时验证计算机筛查。无论是通过湿式筛选还是干式筛选,这些化合物都可以选择自己取代其他较弱的化合物,而这些较弱的化合物在本质上可能会(或可能不会)存在。

在HTS成立之初,毫无疑问,制药业会熟悉许多此类筛选命中方法,并且多年来,它们必然将它们视为“不可行”的选择。学术研究人员没有这种历史性的奢侈,而整个情况因学者相对突然地便捷地使用HTS而恶化。

我应该知道。这些超级聪明的假阳性(SSFP,有人吗?),这些泛分析干扰化合物(也许是PAINS?– hmmm,绝对更可口)给我们带来了很多年前的悲伤。因此,我们已经做出了一些努力来识别这些疼痛,而我的同事Georgina Holloway博士和我最近在《药物化学杂志》上发表了我们的发现,免费提供了所有结果。我们对这项工作的兴趣感到高兴,但也感到沮丧。

罗丹宁只是我们确定的400多种潜在疼痛中的一种。但是,其中大多数都是单身人士-稀有化学物质-不应吓academic学术研究人员学习识别最严重的罪犯。这些仅由少数定义明确且易于识别的类主导。

那么,如果您发现自己的PAIN呈现出有希望的生物学数据,该怎么办?我的本能反应是制定“法律上的反省”协议(而不是不太有效的协议):逃避喧嚣,自动怀疑近亲。

但是,此响应需要严格限定:目前,如果它是鲜为人知的PAINS之一,而仍然鲜为人知,则尝试回答以下问题可能会很有用:“如果这可能干扰我的测定,如何解决?这样做吗?”实际上,我将欢迎学术药物发现界帮助我们大家更好地了解PAINS,以便我们可以更好地定义其当前和将来的各种类别。例如,我想知道我们讨论的稠合四氢喹啉如何与蛋白质发生反应。第一个发现这一点的人可以很容易地发表他们的结果:我们有一名博士生专门研究另一个推定的PAIN,以详细了解正在研究的特定类别的SAR。

对于某些阅读本书的人来说,这可能为时已晚,您的学生可能正在整理并准备发表。我认为每个人都对这样的需求表示同情,但至少可以在您的手稿中提及对潜在问题的暗示?也许不把您的痛苦描绘成有希望的线索?

更一般而言,任何将化合物报告为真正的测定阳性的出版物都应理想地附有令人信服的数据。这包括特异性和可逆结合的证据,十几个好的探针中的SAR清晰,如果可能的话,还有功能性生物标志物的反应(生化;细胞良好但不是必需的)。如果文献中充斥着相似的化合物,例如在不同的检测方法中对不同靶标的命中率,则危险信号会上升,并且玩家会离开现场。具有讽刺意味的是,没有这样的文献不应该被认为是放心的,因为您可能只是在处理稀有化学物质(其他原因也请参见上面的链接)。介于两者之间的某些东西是正确的,文献不一定是基于筛选的,而是更下游的。

请注意,如果提出这一点,或者至少如果ISN并未表明它们是高度可优化的,我对发布结构上可疑的筛选结果完全放心(尽管我已经有足够的罗丹宁和一些其他成分) 。在某种程度上,这仍然是一个有用的公众意识练习,您将看到我们小组在这些方面的未来工作。

在实践中,识别PAINS(对于Sybyl的用户)最简单的方法是使用本文提供的slns运行dbslnfilter(或者,如果从pdf转换证明很麻烦,请与我联系以获取文本文件),如实验中所述部分(非常感谢Craig Morton在这里发现了一个错误,该错误现在已在当前的ASAP文章中得到纠正)。对于SMARTS的用户,我们也希望在新生同事Ian Watson,Lakshmi Akella,Rajarshi Guha和Wolf Ihlenfeldt的努力下,也能够以这种形式提供过滤器。

当前的目标是使这些过滤器在CDD上完全起作用。

在我们的论文中,我们还在补充信息的广泛列表中提供了所有可能的和推定的PAINS的结构表示(图S1)。尽管准确性较低,但对于那些无法使用文本过滤器的人来说非常有用。但是,它们的作用远不止于此:它们提供了识别未被文本过滤器严格定义所识别的PAINS的关键。这需要一些我们的PAINS文件中没有讨论的解释。

让我们看一下PAINS的“ cyano_imine”系列。这些很容易在补充图S1中找到,其中疼痛按字母顺序列出:

 cyano_imines

在这里,括号中的数字告诉我们库中这些数字的数量。然后,该数字有用地链接到补充表S7,该表按家庭大小的顺序进行过滤,依此类推,在第S24页上,可以轻松找到cyano_imine_A的确切sln定义。补充表S9可能更通用,因为该表包含“assay counts.”该表还按数据库中出现频率的顺序列出了PAINS。因此很容易获得以下数据:

 痛苦表

在这里可以看出,例如cyano_imine_B非常讨厌,击中2次和6次检测(而不是无检测)的百分比(“ EBAELL”值)为275%!超过30%的结果都是不好的-cyano_imine_C甚至更糟。不难推测,蛋白质亲核试剂对腈或亚胺的攻击可能是问题所在。

那么为什么我们不首先过滤掉这些组呢?首先,应该在左西孟旦中存在cyano_imine_B,但可以承认,如果需要口服活性剂并需要较长的半衰期,则可以注射这种仅静脉注射的活性药物的PK。 (http://indianpediatrics.net/july2009/593.pdf)。其次,很难设想未公开的官能团的所有组合,直到您在测定中找到它们为止。无论哪种方式,我们现在都不希望将它们作为筛选结果,也不要在我们的图书馆中使用它们。

那么我如何命名这些疼痛类呢?好了,在结构上定义了所有类别之后,很明显会出现重复出现的主题:某些苯胺(anil_),烯烃(ene_),腈(cyano_),亚胺(imine_),(hzone_),吡咯(pyrrole_),杂种杂环(het_),含硫杂环(het_thio_)和含硫羰基的化合物(thio_)等。我试图给可能引起该问题的基团起一个根名,因此命名为“ cyano_imine_”。

让我们再看几个示例:

 更多痛苦

“ Het_thio_”描述了其中存在怀疑的有问题的(内-或外-)硫的任何杂环,并且还描述了环稠合。但是,如果存在例如环外烯烃,则将具有优先权。在存在S-N键的情况下,此严重存在问题的功能将获得其自己的命名法(“ thio_N”),如“ het_thio_N_5A”中所示。有时我决定给在几个不同类中存在的易于识别的系统起自己的名字,例如“ naphth”。我们的过滤器中有七个含萘的类,其中四个属于napth_amino_分组。因此,在这种情况下,您将不会在根目录“ het_”下找到它们。与“ thio_carbam_ene”类似-硫代羰基优先。

我并不要求绝对严格,我注意到下面的thio_pyridine_A应该确实是“ het_thio_6_furan”。但是你让我流连忘返。

硫代吡啶

我为什么要讲这个细节?因为存在这些过滤器可能无意用于善而不恶的危险,所以这就是原因。例如,给定的研究人员可能对此有很高的评价:

额外的cyano_imine

由于我们的过滤器目前已严格定义,因此不会被过滤器识别,因此可能得出以下结论:“我们已经证明该化合物不是疼痛”。但是,它显然属于高度成问题的cyano_imine_类化合物,并且它本身可能是成问题的PAIN。如果学术研究人员熟悉我的命名系统,他们可以很容易地发现这一点(从旁看来,我指出,如果我们之前提供的功能组过滤器没有被使用,那么可能也不会识别出真正的鼻涕)。

那么,为什么我不扩大定义:例如,去除所有含硫化合物和所有氰胺?在我们的过滤器的Alpha版本中,很多情况下我都遵循了这一原则,但是我发现我开始讨厌几乎所有事物的外观,并且越来越多的可能良性的系统被删除了(有人怀疑这种自然的人类倾向有时是否扩展到大型制药公司,从而导致无法获得真正的筛查多样性)。例如,我正在考虑将所有定义为有问题的,因为它们似乎经常与有问题的化合物缔合,而且它们也是非常常见的化合物。但是,在进一步检查中,很明显的某些子类引起了主要问题。确实,我们最成功的药物化学程序之一是从含containing的started头开始的,由于在商业上没有代表不同结合元素之间的替代键,因此我们从未发现过。而且我们能够相当快地优化出PK依赖的键。

因此,最后,我努力采用一种纯粹基于证据的方法,并定义了结构类别,并尽可能给出具有更高EBAELL百分比的更具体的子类别。

最后是技术性。我们定义的480多个类不一定都是PAINS。将化合物类别定义为PAIN是一项重要的命令,因此在此阶段,我不仅要求该类别在我们的测定中必须是有问题的,而且在文献中还必须有证据表明相似的化合物正在击中不同的靶标使用不同的检测方法(在这种情况下,特权结构和PAINS可能会混合在一起。在某些方面还存在悖论,因为根据这些标准,我首先要求提供误报!)。我仅对最常见和最明显的候选者进行了文献检索,因此只将少数问题类提升为PAIN状态,并在本文的主体中进行了命名。因此,我们在补充图中列出了许多其他类,我现在将其称为推定疼痛。

我希望我们的过滤器可以对学术研究人员有所帮助,并间接地为有效治疗方法的发展提供更多文献资料。

就目前而言,令人遗憾的是,科学文献中充斥着误导性出版物。

但是那些住在玻璃房里的人不应该扔石头。最近,这些痛苦中的一些使我和我的同事们蒙骗了。他们可能愚弄任何人。好吧,几乎任何人。许多人不会愚弄大型制药公司(尽管我们’我们有理由相信其中一些鲜为人知的PAINS对其中一些人来说可能是新的)。

如果您已成功将生物活性化合物许可给大型制药公司(不一定是规模较小的生物技术公司,也不一定不是分拆公司,这取决于谁拥有具有丰富制药经验的SAB),那么您至少可以确定自己是特别的东西。对于翻译研究人员而言,这是一次罕见而重大的事件,与无牌临时专利的潜在价值不足形成鲜明对比。实际上,通过SciFinder快速搜索发现的大量基于PAINS的虚假专利在一定程度上令人沮丧,并为这些机构带来了巨大的成本。

我们在研究所进行辩论–取得了一些成功–这比生物学家的《自然》杂志的要多。相反,如果您无法获得IP许可,也许您应该要求诚实的答案,为什么不这样做。

许可IP应该是您的晋升委员会真正的成功者。更重要的是,这也许是衡量您的翻译业绩的最终有形指标。


该博客由CDD Vault社区的成员创作。 CDD库 是托管的 药物发现信息学 安全管理私人和外部生化数据的平台。它提供了核心功能,包括 化学注册, 结构活动关系, 化学品库存电子实验室笔记本 能力!

CDD库 :您的整个项目团队都会使用的药物发现信息学!