一、在尋找疾病靶點(diǎn)方面,drugbank和TTD等數(shù)據(jù)庫的區(qū)別
1、數(shù)據(jù)來源不同
DrugBank主要以已經(jīng)上市的藥物為主,其數(shù)據(jù)來源包括FDA批準(zhǔn)的藥物、文獻(xiàn)、專利和非專利報(bào)道等。TTD則是基于公開的文獻(xiàn)、專利、臨床試驗(yàn)等多種來源整理而成。
2、數(shù)據(jù)內(nèi)容不同
DrugBank提供的信息更為全面,包括藥物的化學(xué)結(jié)構(gòu)、藥理學(xué)特征、轉(zhuǎn)運(yùn)蛋白相關(guān)信息、藥物副作用等方面。而TTD則主要提供靶點(diǎn)的信息,包括其結(jié)構(gòu)、功能、通路以及小分子化合物對其的調(diào)控作用等方面。
3、數(shù)據(jù)組織形式不同
DrugBank在數(shù)據(jù)庫的構(gòu)建和管理中采用了關(guān)系型數(shù)據(jù)庫的方法,可以通過類似SQL查詢語句來查詢數(shù)據(jù)。而TTD則主要采用基于網(wǎng)絡(luò)的圖形顯示方式來展示靶點(diǎn)的信息。
二、常用藥物靶點(diǎn)搜索查詢的數(shù)據(jù)庫
1、DrugBank
DrugBank數(shù)據(jù)庫是阿爾伯塔大學(xué)將詳細(xì)的藥物數(shù)據(jù)和全面的藥物目標(biāo)信息結(jié)合起來,結(jié)果都是有實(shí)驗(yàn)驗(yàn)證過的,真實(shí)可靠的生物信息學(xué)和化學(xué)信息學(xué)數(shù)據(jù)庫。
DrugBank的角色主要有兩個(gè):
臨床導(dǎo)向的藥品百科全書:DrugBank能夠提供關(guān)于藥品,藥品靶點(diǎn)和藥物作用的生物或生理結(jié)果的詳細(xì)、最新、定量分析或分子量的信息。化學(xué)導(dǎo)向的藥品數(shù)據(jù)庫:DrugBank能夠提供許多內(nèi)置的工具,用于查看、排序、搜索和提取文本、圖像、序列或結(jié)構(gòu)數(shù)據(jù)。自數(shù)據(jù)庫首次發(fā)布信息起,DrugBank已被廣泛應(yīng)用于計(jì)算機(jī)檢索藥物、藥物“復(fù)原”、計(jì)算機(jī)檢索藥物結(jié)構(gòu)數(shù)據(jù)、藥物對接或篩選、藥物代謝預(yù)測、藥物靶點(diǎn)預(yù)測和一般制藥教育。DrugBank包含13791種藥物條目,其中包括2653種經(jīng)批準(zhǔn)的小分子藥物、1417種經(jīng)批準(zhǔn)的生物技術(shù)(蛋白質(zhì)/肽)藥物、131種營養(yǎng)品和6451種實(shí)驗(yàn)藥物。此外,5236個(gè)非冗余蛋白(即藥物靶標(biāo)/酶/轉(zhuǎn)運(yùn)體/載體)序列與這些藥物條目相關(guān)聯(lián)。每個(gè)DrugCard條目包含200多個(gè)數(shù)據(jù)字段,其中一半用于藥物/化學(xué)數(shù)據(jù),另一半用于藥物靶標(biāo)或蛋白質(zhì)數(shù)據(jù)。DrugBank最大的特色是它支持全面而復(fù)雜的搜索,結(jié)合DrugBank可視化軟件,這些工具能讓科學(xué)家們非常容易的檢索到新的藥物靶目標(biāo)、比較藥物結(jié)構(gòu)、研究藥物機(jī)制以及探索新型藥物。
2、Therapeutic Target Database
Therapeutic Target Database (以下簡稱TTD) 是全球名列前茅個(gè)提供免費(fèi)藥物靶標(biāo)信息的在線數(shù)據(jù)庫,是藥物靶標(biāo)發(fā)現(xiàn)和新藥開發(fā)領(lǐng)域具有國際影響力的數(shù)據(jù)平臺。該數(shù)據(jù)平臺的年訪問量超過15萬人次,總訪問量達(dá)240余萬人次,年平均被引次數(shù)超過200次。隨著精準(zhǔn)醫(yī)療的發(fā)展和AI技術(shù)的突破,TTD數(shù)據(jù)庫的構(gòu)建部分滿足了相關(guān)AI研究的數(shù)據(jù)需求,為藥物設(shè)計(jì)與新藥發(fā)現(xiàn)提供了不可或缺的重要支持。目前,該數(shù)據(jù)庫收錄了3500余個(gè)藥物靶點(diǎn),近4萬個(gè)藥物分子。
TTD數(shù)據(jù)庫針對藥靶信息定義不嚴(yán)格這一爭議問題,提出了一套基于“藥、靶、病”三者關(guān)聯(lián)的藥靶確定策略。運(yùn)用這一策略,TTD嚴(yán)格確證了所有美國FDA已批準(zhǔn)藥物(2000余個(gè))和臨床試驗(yàn)藥物(9400余個(gè))的主要療效藥靶,嚴(yán)格區(qū)分了“無療效”和“有療效”藥靶的概念,最終發(fā)現(xiàn)目前所有FDA已批準(zhǔn)藥物僅作用于近500個(gè)療效藥靶。同時(shí),為了推動(dòng)COVID-19新藥開發(fā),TTD整理了目前正在臨床和臨床前研究的候選藥物信息,嚴(yán)格確定了每種藥物的主要療效藥靶,提供了214個(gè)獨(dú)立藥物分子實(shí)體信息。藥靶確定研究發(fā)現(xiàn),這些藥物作用于53個(gè)藥靶上,為抗新冠藥物設(shè)計(jì)、發(fā)現(xiàn)和測試提供了嚴(yán)格的藥靶信息。
基于嚴(yán)格確定的療效藥靶信息,TTD數(shù)據(jù)庫還發(fā)展了一系列輔助藥靶發(fā)現(xiàn)的新功能,為彌合藥靶數(shù)據(jù)與新藥靶發(fā)現(xiàn)之間的鴻溝,提出了創(chuàng)新性的解決方案。這些新功能包括:藥靶差異表達(dá)分析和突變識別,藥靶調(diào)節(jié)因子發(fā)現(xiàn)和信號通路分析、藥物藥靶的相似性搜索等。嚴(yán)格確定的藥靶數(shù)據(jù)與構(gòu)建的新型藥靶發(fā)現(xiàn)工具之間,相輔相成、互為依托,為當(dāng)前藥靶發(fā)現(xiàn)研究打下了堅(jiān)實(shí)的數(shù)據(jù)和工具基礎(chǔ)。
3、PubChem
PubChem,有機(jī)小分子生物活性數(shù)據(jù),是一個(gè)生環(huán)化材中應(yīng)用分子的數(shù)據(jù)模型庫,它是由美國國家健康研究院支持,美國國家生物技術(shù)信息中心(NCBI)負(fù)責(zé)維護(hù)的一款實(shí)用查詢網(wǎng)站。
PubChem里面包含了大量分子材料的理化性能介紹,而且對應(yīng)每個(gè)有機(jī)分子的應(yīng)用都能夠追根溯源到較為全面的文獻(xiàn)報(bào)道,生物醫(yī)藥和生化交叉領(lǐng)域的科研人員尤為青睞。我們可以按名稱,分子式,結(jié)構(gòu)和其他標(biāo)識符搜索化學(xué)物質(zhì)來查找化學(xué)和物理性質(zhì),生物活性,安全性和毒性信息,專利,文獻(xiàn)引用等等??晒z索的化合物有11100萬種,物質(zhì)28700萬種,生物活性27300萬種、相關(guān)文獻(xiàn)3200萬篇、專利250萬種。
PubChem數(shù)據(jù)庫包括3個(gè)子數(shù)據(jù)庫(可集成在一起檢索,也可以單獨(dú)檢索):
PubChem BioAssay (化合物)–用于存儲生化實(shí)驗(yàn)數(shù)據(jù),實(shí)驗(yàn)數(shù)據(jù)主要來自高通量篩選實(shí)驗(yàn)和科技文獻(xiàn);PubChem Compound (物質(zhì)) –用于存儲整理后的化合物化學(xué)結(jié)構(gòu)信息;PubChem Substance (生物檢測劑)–用于存儲機(jī)構(gòu)和個(gè)人上傳的化合物原始數(shù)據(jù)。4、ChEMBL
ChEMBL數(shù)據(jù)庫是歐洲生物信息研究所(European Bioinformatics Institute,EBI)開發(fā)的一個(gè)靶點(diǎn)與生物活性藥物數(shù)據(jù)庫,收集的是藥物研究和開發(fā)過程中的藥物化學(xué)數(shù)據(jù)和知識,比如臨床實(shí)驗(yàn)藥物和批準(zhǔn)藥物的治療靶標(biāo)和適應(yīng)癥,旨為藥物化學(xué)家們提供一個(gè)非常便利的查詢靶點(diǎn)或化合物的生物活性數(shù)據(jù)的平臺。截至2019年10月29日,該數(shù)據(jù)庫共收集了12482個(gè)靶點(diǎn),1,961,462個(gè)不同的化合物和13,382個(gè)靶點(diǎn)信息。
ChEMBL數(shù)據(jù)庫信息統(tǒng)計(jì):
ChEMBL也有一些小分子及其生物活性的信息,它們來自核心藥物化學(xué)期刊的全文文章,并與已批準(zhǔn)的藥物和臨床開發(fā)候選藥物的數(shù)據(jù)(如作用機(jī)制和治療適應(yīng)癥)相結(jié)合,做到權(quán)威與實(shí)用的完美結(jié)合。
延伸閱讀1:靶點(diǎn)是什么
靶點(diǎn)是與藥物特異性結(jié)合的生物大分子的統(tǒng)稱。靶點(diǎn)的種類主要有受體、酶、離子通道和核酸,存在于機(jī)體靶器官細(xì)胞膜上或細(xì)胞質(zhì)內(nèi)。迄今為止所發(fā)現(xiàn)的藥物作用靶點(diǎn)總數(shù)約為500個(gè)左右,其中還不包括抗菌、抗病毒等作用靶點(diǎn),其中受體尤其是G蛋白偶聯(lián)受體靶點(diǎn)占據(jù)絕大多數(shù)。