全球領(lǐng)先的基因組學(xué)信息及精準醫學(xué)公司明碼(上海)生物科技有限公司(WuXiNextCODE)和Simons基金會(huì )今天宣布,SimonsSimplexCollection(SSC)現在可以在明碼生物科技的WuXiNextCODEExchange上進(jìn)行查詢(xún)。WuXiNextCODEExchange是一種一體化的云端數據存貯、注釋和發(fā)現系統。來(lái)自美國、加拿大、中國、法國、冰島、澳大利亞、愛(ài)爾蘭、巴西和卡塔爾的17家行業(yè)領(lǐng)先的研究機構的自閉癥科學(xué)家們已經(jīng)正式使用了WuXiNextCODESSC客戶(hù)端。從今天起,該客戶(hù)端向全球科學(xué)家開(kāi)放,有意者可以通過(guò)注冊WuXiNextCODESSC來(lái)申請培訓和使用,或者寫(xiě)郵件給collections@simonsfoundation.org進(jìn)行申請。
SSC包含近2,600個(gè)家庭的基因組序列數據和詳細的臨床表型數據,所有這些家庭均包含有一個(gè)患一種自閉癥(autismspectrumdisorder,ASD)的兒童、正常的父母和兄弟姐妹。它是深化我們理解ASDs的重要資源,也是全球最大的專(zhuān)業(yè)性基因組序列數據庫。正是由于明碼生物科技數據庫架構的計算效率,才使得如此大規模的數據運算成為可能。使用明碼生物科技的一體化clinicaldiscoverytools,SSC用戶(hù)可以直接查詢(xún)個(gè)人基因組數據、家系數據、或者整個(gè)數據庫。不需要移動(dòng)或者下載數據文件,就可以挖掘所有樣本的GATK和FreeBayes突變;可以通過(guò)由歸一化的全球標準序列數據在后臺支持的、始終處于運行狀態(tài)的可視化工具查看運算結果;或者與同行開(kāi)展合作。數據存貯于可彈性擴展的、兼容HIPAA規則的明碼生物科技云端,由DNAnexus提供后臺技術(shù)支撐。
“SSC的設計初衷是成為大規模、開(kāi)放性查詢(xún)的發(fā)現引擎,并且取得了成功。我們很高興與明碼生物科技開(kāi)展合作,進(jìn)一步挖掘SSC的潛力,使它能夠被全球自閉癥研究者直接查詢(xún)。”SimonsFoundationAutismResearchInitiative(SFARI)主任LouisReichardt博士說(shuō),“數據上線(xiàn)便于它成為主要自閉癥數據庫網(wǎng)絡(luò )的中樞,便于研究者構造更大規模的虛擬隊列。我們邀請該領(lǐng)域的所有人使用它。”
“能與Simons基金會(huì )開(kāi)展合作,我們感到非常激動(dòng)和自豪。對于更好地理解、診斷和治療ASD而言,我們認為這是翻開(kāi)了全球合作的新一頁(yè)。”明碼生物科技COOHannesSmarason先生說(shuō),“對于創(chuàng )建一個(gè)DNA互聯(lián)網(wǎng)而言,把SSC導入WuXiNextCODEExchange是一個(gè)里程碑式的事件,必將促進(jìn)自閉癥治療研究的進(jìn)展。而要解決這一復雜的難題,我們必須創(chuàng )建真正巨大的數據庫。我們期待著(zhù)與Simons基金會(huì )和自閉癥團體的合作,來(lái)使這一資源變得更加完善,導入全基因組數據,持續擴大其規模、范圍,以達成這一目標。”
“這是一個(gè)規則改變者。我們已經(jīng)在使用明碼生物科技客戶(hù)端來(lái)驗證和拓展新的發(fā)現、確認臨床診斷,”波士頓兒童醫院神經(jīng)病學(xué)醫生及助理教授TimothyYu博士說(shuō),“這是大基因組學(xué)投資促進(jìn)我們理解自閉癥和其他種類(lèi)復雜疾病的正確方式。由于我們以及越來(lái)越多的合作者擁有GOR格式的研究和診斷數據,我們已經(jīng)感受到了大規模虛擬隊列對于加快研究進(jìn)度的影響,并且我們正在邀請我們的合作者也加入進(jìn)來(lái)。”
SSC是設計用于支持發(fā)現增加自閉癥風(fēng)險的罕見(jiàn)及新生遺傳事件的專(zhuān)業(yè)、嚴謹的數據庫,包含接近2600個(gè)ASD先征者以及他們的父母和表型正常的兄弟姐妹的全外顯子測序數據和大于2000種表現型數據。經(jīng)過(guò)批準的研究者可以通過(guò)SFARIBase或者寫(xiě)郵件給collections@sfari.org來(lái)獲得SSC生物學(xué)樣本和表現型數據和遺傳數據。SSC測序數據已經(jīng)獲得了100種自閉癥候選基因??蛻?hù)端的特征包括:
所有SFARIGene和其他主要的ASD基因及其突變列表
所有主要的公開(kāi)標準數據庫
原始BAM測序數據的即時(shí)圖形化展示
突變類(lèi)聚以強化罕見(jiàn)突變的統計關(guān)聯(lián)性
新生同源基因檢測
攜帶者分析
預測的基因突變效應和等位基因頻率過(guò)濾
定義表現型的性狀選擇器和報告生成器
其他來(lái)源數據的輸入與功能整合