目前的问题是,资助机构和研究人员都不愿意冒险研究未知蛋白质,因为他们担心相关的研究工作无足轻重,无法得到回报。图片来源:SCIENCE PHOTO LIBRARY
一个被称为unknome的蛋白质数据库根据人们对蛋白质的了解程度对其排名。结果显示,人们对数千种人类蛋白质几乎一无所知,包括一些对人类生存至关重要的蛋白质。8月8日,相关成果发表于《科学公共图书馆-生物学》。
为创建unknome数据库,英国剑桥大学MRC分子生物学实验室Sean Munro团队从人类身上发现的约2万个蛋白质基因入手,将关系密切、可能具有相似功能的人类基因或蛋白质组合在一起,产生了大约7500个蛋白质簇。
接下来,他们将在老鼠或果蝇等常见动物身上发现的相关蛋白质添加到该蛋白质簇中。因为这些蛋白质可能具有相同功能。然后,他们根据基因功能信息库中的条目数量,给每个蛋白质簇打分。
一种没被直接研究过的人类蛋白质,如果在其他动物身上的等效蛋白质得到充分研究,它的得分仍然很高。如果蛋白质在被认为更可靠的条目中出现也会得到高分,比如发表在期刊上。 Munro坦言,这种评分有些武断,但目前还没有更好的评分办法。
一些蛋白质被研究得十分透彻,因此其得分远超100分。例如,一种参与胚胎发育、名为“音猬因子”的蛋白质得分为168,而帮助阻止细胞癌变的蛋白质p53得分为126。然而,仍有超过2200种蛋白质的得分低于2、1100种低于1,甚至有超过800种得分为0。
理论上,这些得分低的蛋白质可能没有被研究过。为了解这些蛋白质是否重要,研究小组使用一种名为RNA干扰的技术,降低果蝇体中260种得分低于1的蛋白质水平。在60个案例中果蝇很快死亡,这表明这些特殊的蛋白质同样具有重要功能。
Munro说,这对研究果蝇的团队成员来说是一个很大的惊喜。“他们只是假设已经找到了所有可能的重要基因,事实证明并非如此”。
他说,未知蛋白质的数量正在慢慢减少,但他希望加快发现的步伐。目前的问题是,资助机构和研究人员都不愿意冒险研究未知蛋白质,因为他们担心相关的研究工作无足轻重,无法得到回报。
“甚至有我们可能不知道的生物过程存在,但没有人去寻找与这一过程有关的蛋白质,因为没有人知道它们。”Munro说,这听起来令人惊讶,但被称为CRISPR的基因编辑技术是基于细菌蛋白质的,后者的功能直到2012年才被发现。
相关论文信息:
https://doi.org/10.1371/journal.pbio.3002222