云之器度丨助力中科普瑞上線表觀星云平臺
發布者:海云生物????發布時間:2018-10-15 16:35
隨著基因測序產生的龐大數據增量讓整個生命科技行業面臨數據的存、傳、算、查各個環節的巨大壓力,而且,生物信息個性化分析需求也在不斷增多,利用云平臺進行自主信息分析的模式已經成為新的發展趨勢。2018年5月28日,中科普瑞聯合海云基因發布全新表觀星云(Epigenetics Cloud,EC)平臺,助力十萬人甲基化組計劃,為國內各科研單位和醫療機構的精準診斷和精準治療提供甲基化層面的基因數據保證,為全球華人的基因診斷提供更精準的參考。

基因測序作為一種新型的基因檢測技術,在生命科學研究中扮演著十分重要的角色,行業的蓬勃發展催生了生物基因數據爆炸式的增長。但是與之對應的測序數據分析手段卻仍然停留在初級階段,如何解決基因大數據分析流程繁瑣,計算資源緊缺與醫學解讀需求的時效性和準確性之間的矛盾,成為行業最大難點。海云基因推出的基因云計算系統(GeneApps)在此提供了一種有效的緩解途徑,極大提升人類全基因組分析效率,有效改善基因領域數據分析速度慢、效率低等問題,將數據的分析與挖掘走向云端。GeneApps基于多年分布式計算開發經驗,由專業的生物信息團隊和IT團隊攜手開發完成,是目前基因檢測市場中領先能同時做到云計算技術、可視化界面、容量級監控、自定義流程和自主算法開發的產品。

繼中科普瑞十萬人甲基化計劃發布后,海云基因以其GeneApps的產品優勢與中科普瑞達成合作,定制化搭建全自動化解決方案-表觀星云。
海云基因自成立已來,一直致力于基因云計算系統及相關聯超融合精準醫療數字化產品的開發,2018年,海云基因GeneApps步入V4.0時代,能夠以更成熟更全面更靈活更安全的方式快速響應需求,為企業提供生物醫療大數據整體解決方案。GeneApps具有以下優勢:
云計算架構,高效率,低成本
GeneApps云計算解決方案包含統一的計算資源池、統一的網絡資源池、統一的存儲資源池,并提供了一體化的監控和部署工具進行統一的虛擬化與云業務管理,通過簡潔的管理界面,輕松地統一管理數據中心內所有的物理資源和虛擬資源,不僅能提高管理員的管控能力、更可降低IT環境的復雜度和管理成本。
采用基于Hadoop的云計算架構,能夠根據分析數據的量彈性配置計算資源。分布式計算方式能極大加快數據處理速度,降低時間成本和人力成本。
使用Hadoop Yarn作為任務的調度框架,其作為Hadoop MR的核心框架,相對其他調度框架,是目前分布式計算的最佳選擇。在基礎云中,我們的Yarn實現,也嚴格參考了MR的源碼。
采用基于Hadoop的云計算架構,能夠根據分析數據的量彈性配置計算資源。分布式計算方式能極大加快數據處理速度,降低時間成本和人力成本。
使用Hadoop Yarn作為任務的調度框架,其作為Hadoop MR的核心框架,相對其他調度框架,是目前分布式計算的最佳選擇。在基礎云中,我們的Yarn實現,也嚴格參考了MR的源碼。
極速流程、高效拼接,定制化服務
GeneApps 平臺具備全基因組測序分析、全外顯子組測序分析、轉錄組與調控RNA測序分析、微生物宏基因組分析、表觀遺傳學測序分析工作流等十余條生物信息流程,近百個算法模塊,充分滿足用戶標準和個性化分析。此外,平臺提供自由搭建分析流程的功能,所有分析功能被模塊化配置,用戶能夠自由自組合,實現完美的定制化分析流程服務。
GeneApps 平臺獨特的框架技術可借助一些加速軟件及硬件資源力量對一大批分析工具加速,從長期也考慮到利用機器學習的手段,優化各種算法,使其在算法靈敏度及特效性方面具有極佳的表現。
GeneApps 平臺獨特的框架技術可借助一些加速軟件及硬件資源力量對一大批分析工具加速,從長期也考慮到利用機器學習的手段,優化各種算法,使其在算法靈敏度及特效性方面具有極佳的表現。

可視化操作界面,簡化操作流程
平臺提供多項全套分析流程,并提供一站式分析結果。用戶不需要掌握繁瑣的編程語言,只需上傳數據并填好樣本信息,即可點擊運行并通過可視化平臺輕松進行數據分析,真正實現生物信息零代碼。通過多級權限,層級配額,滿足用戶對于云服務的分配和管控能力,同時支持對云資源使用情況進行精細化計量和可視化呈現。
其中,我們的臨床序列分析工具能夠在序列讀取片段水平上及時查看任意候選基因,可視化操作界面讓分析結果清晰易懂,直接關聯至表型、性狀。
基于Docker的自定義模塊開發
Docker在其輕量、配置便捷性以及資源利用率方面有明顯優勢,生物信息開發人員可以自行開發分析模塊,將傳統分析功能封裝在模塊中,由此實現分析功能擴展。
數據的安全和高可靠性
采用分布式云存儲系統將數據和校驗數據分別存放在不同的存儲服務器上,并可以同時使用多條高速數據通道,可消除網絡層的單點故障,進一步提高系統的高可用性。在這樣的情況下,即使出現存儲服務器宕機、網絡中斷、磁盤損壞時,仍然能夠保障數據完整性和數據服務的持續運行。相對于傳統的RAID技術具備更快的數據重建速度,這也能夠有效提升數據的安全性。
系統延伸,數據全程打通
當前,海云基因已經完成了基因云計算產品GeneApps火箭助推——產品化突圍,并逐步布局火箭發射——生態杠桿。我們已推出了創新的基因云相關聯的超融合新品——醫學云(智能化基因診斷決策支持系統)和健康云(健康基因檢測風險畫像與報告管理系統)的超融合與數據打通,并已經在今年年初正式上市。
海云基因CTO曹春筍表示:“超融合與數據打通就是在基因測序領域實現數字化整體解決方案,形成閉環。數字化整體解決方案的下半場是云計算的軟硬一體交付,主要包括三大產品特征:支持多云、微服務粒度升級和以產品應用為核心。”

海云基因云計算系統應用之于基因測序服務,就如智能操作系統應用之于手機。在生態布局上,超融合系統上市不到半年時間海云基因已擁有醫院、第三方檢驗機構、測序企業和研究單位數十家生態合作伙伴和超過十余個渠道合作伙伴。我們也將與一些高校合作推出OceanCloud基因云容器技術課程,培育中國生物信息新一代基因云計算人才。
基因牽手云計算,海云基因GeneApps助力生物醫學發展
基因測序已進入爆發式的階段,GeneApps通過海量可彈性調度的計算與存儲資源,幫助測序中心、科研與臨床用戶、SaaS服務提供商便捷地在云端部署基因數據分析乃至整個精準醫療與健康管理數據分析的全流程,從而推動精準醫療知識庫的開發和應用,讓醫學數據分析成為全球協作的事業。此次與中科普瑞發布表觀星云,助力十萬人甲基化計劃,對海云基因具有非常重要的戰略意義。

海云基因攜手中科普瑞將發揮各自在基因組測序、云計算、測序數據分析、數據處理、隱私安全保護等方面的長處,達成更快速、更靈活的生物醫療大數據處理模式。
關于海云基因(Oceancloud Gene)
海云基因是一家新興的基因科技公司,以海內外高等院校的專家教授團隊為依托,并擁有生物信息學、臨床醫學及云計算的專業技術人員支持,在云計算技術、大數據開發和生物信息領域有雄厚的基礎。通過開發高通量基因測序和生物信息學領域先進的基因云計算平臺GeneApps,打造服務于精準醫療數字化整體解決方案的生態系統。公司致力于醫療信息化、基因云計算平臺和疾病知識庫的構建互補融合,通過健康大數據來驅動精準診療與健康指導。公司同時也面對保險醫療、健康體檢、婦幼呵護、兒童成長等多個行業提供基因檢測與分析的健康服務。
關于中科普瑞基因科技(Sinotech Genomics)
中科普瑞科技服務平臺依托中科普瑞基因科技和上海鯨舟醫學檢驗所平臺和技術力量,由國內知名基因中心核心團隊人員組建,平臺專注于新一代測序(二代+三代測序技術)、基因芯片及相關分子生物學技術在生命科學研究、疾病健康等領域的應用,利用一流的平臺設備和專業水平的實驗及生物信息團隊,為廣大科研用戶提供從基因組、轉錄組、表觀遺傳到代謝組的高通量組學綜合解決方案。

中科普瑞十萬人甲基化組介紹
表觀星圖計劃(Epigenetics Atlas Project)是國內首個大型甲基化組項目,通過與國內外基因組隊列計劃聯動,以及與Illumina公司的戰略合作,建立中國人甲基化基準數據庫,為表觀遺傳領域研究、應用和臨床檢測等建立基礎數據庫。該項目計劃首期完成十萬人甲基化芯片與大數據分析(2018年計劃招募首期星盟計劃參與課題,免費提供10,000例DNA甲基化芯片用于項目研究),后期逐步擴大范圍,通過甲基化基準基因數據庫的建立,為科研和臨床研究,乃至臨床檢測等應用提供基礎數據庫,并建立相關標準,為國內各科研單位和醫療機構的精準診斷和精準治療提供甲基化層面的基因數據保證,同時為全球華人的精準診斷提供更為精準的參考。