

研究主要以統計理論、統計機器學習理論及方法為基礎,並透過跨領域合作與系上各組研究做連結,以解決問題為導向的生物統計和生物資訊方法的創新與研究。
- 基因富集分析 (GSEA ): 近年內由於微陣列實驗及高通量定序的發展,各類型基因體資料有著飛快成長,基因富集分析 (GSEA ) 方法主要應用在基因體資料中,偵測出與疾病或生物特徵有顯著相關之代謝路徑或細胞調控結構有關之基因叢集。主要研究為提供一較彈性化及穩健的統計分析模型,能同時使用在偵測與多類別及連續型的生物體外表性狀有關之顯著表現基因叢集,並開發R程式套件供研究者使用。
- 全基因體選拔 (Genomic Selection): 基因組選種 (genomic selection) 是新興的分子標記輔助選種策略,透過由訓練族群所建構的統計預測模型,直接以個體大量的分子標記基因型資料計算各個個體的個體育種價估計值,並以此為依據選拔個體。然而,全基因體選拔育種研究仍然存在一些極待解決的重要問題,比如複雜數量性狀預測困難、基因型與多環境間交感作用、如何兼顧主效基因和微效基因效應、外表型鑑定精確度不夠及成本過高等實際問題。
- 統計機器學習: 機器學習演算法在數據探勘技術中許多研究和應用領域中發揮著重要作用。分類演算法已經在許多不同領域及數據資料中進行了大量探索和應用,例如,數值、圖像分析、基因表現、單詞數據等。然而,面對未來大量、多樣化及非對稱的資料分析,傳統分類演算法往往力有未逮,需要考量數據資料的異質性且存在複雜結構之下,發展新的統計機器學習方法,進而探討模式預測與決策支持系統的建構。