近日,Google Research 的基因组学团队在利用高维临床数据(HDCD)表征疾病和生物学特征方面取得进展。他们提出无监督深度学习模型 REGLE,可发现基因变异与 HDCD 间的关联。REGLE 利用变分自动编码器模型,通过学习 HDCD 的非线性、低维、解纠缠表示,对每个编码坐标进行 GWAS,再用多基因风险评分创建特定疾病或特征的 PRS。该模型计算效率高,无需疾病标签,还能整合专家定义知识信息。其包含的临床相关信息超出现有专家定义特征所捕获的信息,能改善基因发现和疾病预测。
近日,Google Research 的基因组学团队在利用高维临床数据(HDCD)表征疾病和生物学特征方面取得进展。他们提出无监督深度学习模型 REGLE,可发现基因变异与 HDCD 间的关联。REGLE 利用变分自动编码器模型,通过学习 HDCD 的非线性、低维、解纠缠表示,对每个编码坐标进行 GWAS,再用多基因风险评分创建特定疾病或特征的 PRS。该模型计算效率高,无需疾病标签,还能整合专家定义知识信息。其包含的临床相关信息超出现有专家定义特征所捕获的信息,能改善基因发现和疾病预测。