一直以来,看到这本书《Statistical Analysis of Microbiome Data with R》活跃在朋友圈和公众号,既然口碑这么好,当然有必要学习下啦!分享记录一下书中我所认为重要的点。
继续上次的读书笔记,宏基因组学习笔记。 宏基因组 1.定义 metagenomics, 在希腊语中meta意思是超越的。
本周受邀来武汉菲沙基因参加三维基因组学习研讨班,所以更新该系列该领域基础知识以及一个实战项目的方方面面,测试数据以及流程软件的解说,希望大家喜欢! 基础知识学习 背景知识 定义: 三维基因组学是以研究真核生物核内基因组空间构象,及其对不同基因转录调控的生物学效应为主要研究内容的一个新的学科方向;也是后基因组学时代研究的一个热门领域。 通过三维基因组学技术,科学家将能对基因组的折叠和空间构象、转录调控机制、复杂生物学性状、信号传导通路和基因组的运行机制等一系列重要问题进行更深入的探讨和研究,为系统解读生命百科全书和精准生物学的实施奠定坚实基础 本文综述了目前三维基因组学研究领域中的主要技术、研究现状、科研进展、存在问题、未来及与精准生物学的关系等内容。 以期能较系统地展示三维基因组学取得的一系列成果,解读从三维空间构象信息到不同基因功能研究的路径,精准决定在转录调控网络中不同基因表达的时空特异性的可能模式。
IHEC全称如下 International Human Epigenome Consortium 称之为国际人类表观基因组联盟,由来自多个国家和实验室的团队共同参与,致力于提供一个公开免费的人类表观基因组学图谱
表型,英文名phenotype,译名表现型,是与基因型相对应的概念,是兴趣基因(或分子)之外另一个重量级对象。疾病、基因和表型,就构成了生信分析、基础科研的基本元素。中学时,我们都学过孟德尔遗传定律,其中绿色、矮茎等等是表型;描述人体特征的双眼皮、高鼻梁、宽额头、棕头发等等,也是表型。
ONCOMINE从全景、亚型两个维度做表达差异分析; 临床标本从蛋白水平确认(或HPA数据库),很重要; Kaplan-Meier Plotter从临床意义的角度阐明其重要性; cBio-portal数据库做基因组学的分析 基因组学分析是从DNA水平对肿瘤或者表型的出现进行阐释,包括基因突变、删除、扩增和表观遗传(DNA甲基化)等。 目前有很多数据库可以对特定基因的基因组学和表观遗传进行纯网页分析,是互联网带给果友们的福利。 ? 基因组学分析数据库 cBioPortal(组学分析的神器,推荐) https://www.cbioportal.org/ UALCAN(甲基化是特色,推荐) http://ualcan.path.uab.edu
MPM提供了基于网络的诊断和药物基因组学方法,用来了解临床环境中复杂的基因型-表型关系和治疗反应,有望促进肿瘤发生的可操作突变的鉴定和人类相互作用组水平的个体化治疗。 ? 这些结果激励作者开发一个系统生物学工具,用于查询人类相互作用体中的此类节点突变和边缘突变,这将有助于识别用于精确癌症药物的新的功能突变/基因、药物靶点和药物基因组学生物标志物。 ? MPM的未来更新将侧重于提供更完整、更高质量的人类相互作用体(包括蛋白质-DNA/RNA相互作用)、功能位点和来自CPTAC的蛋白质基因组学数据。
除了提高医生对引起每个人癌症的原因的理解之外,基因组学还提供了有关个人癌症可能如何发展及其对治疗的可能反应的见识。 处理突变 癌症基因组学所具有的最大影响之一就是治疗选择。Blombery说:“正确的诊断是获得正确治疗的最有力决定因素。” NCI癌症基因组学办公室的网络科学程序经理Subhashini Jagu说:“这是通过这些大规模基因组计划产生的所有数据之间的桥梁程序。” 尽管积累了有关癌症基因组学的大量数据,但实际收益仍然不明确。对于可以通过现有疗法靶向的癌症突变患者来说,毫无疑问,癌症基因组测序可以带来更好的结果和生存。 “那么我认为基因组学的影响确实很大。” ---- 原文:https://www.nature.com/articles/d41586-020-00845-4
UCSC Xena是一个癌症基因组学数据分析平台,支持对癌症样本的多种组学数据进行可视化和分析,网址如下 https://xenabrowser.net/ 该平台内置了一些公共数据集,比如来自TCGA,
基于滑膜肉瘤的含碱性,目前关于滑膜肉瘤的基因组学和分子致病机理依然来源于少部分样本的大块组织分析,医学界对于个中的肿瘤异质性和免疫微环境的了解依然少之又少。
在开始之前,大家可以想一想如果是在sanger测序的时候,我们第一步就是需要确定样品,然后是对样品提取DNA,检验DNA质量,之后便是根据引物去配置pcr体系,然后跑pcr,跑完之后,我们还会进行跑胶检验,看看是否真的p出条带了。假如一切顺利,p出了条带,那我们就会拿去测序公司对样品进行测序。测完序之后,我们会放进读峰图的软件,然后把测序质量可靠的保留下来,作为后续分析的基础。
导语 GUIDE ╲ 肿瘤药物敏感性基因组学数据库(Genomics of Drug Sensitibity in Cancer,GDSC)由英国桑格研究院开发,收集肿瘤细胞对药物的敏感度和反应数据 检索细胞系 (1) (2)也可在Cell Lines 选项检索 二、数据下载 下载后数据: 小编总结 GDSC数据库是生信药物基因组学相关分析等非常常用的数据库,它的细胞系与COSMIC
今天给大家介绍一部病毒宏基因组学方法与指南,该书详细介绍了不同类型样品的处理流程,以及基本的分析方法,堪称宏病毒组研究宝典。 病毒宏基因组学:方法和指南 Viral Metagenomics Methods and Protocols 内容介绍: 1 细菌-宿主系统中噬菌体的分离及病毒宏基因组学样品制备 2 藤本植物与木本植物组织中小 植物中的病毒双链RNA:高通量测序核酸样品制备的备选方案 5 HIV基因组深度测序中人体血液样品的制备 6 Monolith色谱用于水体病毒组研究中样品的制备 7 多足节肢动物和植物病毒群落的高精度病毒宏基因组学方法
首创的合作关系将利用基因组学和人工智能确定药物靶点并加速新疗法的开发。 药物发现是困难的、昂贵的、缓慢的,由于对许多疾病的复杂性质的生物学认识存在差距,90%的疗法在开发中失败",Illumina首席战略和企业发展官Joydeep Goswami说,"Deerfield的遗传学和基因组学副总裁 "Illumina首席技术官Alex Aravanis说:"下一代药物发现将由人类遗传学、功能基因组学和数据科学的进步所推动",在Illumina,我们有能力通过生成和解释大规模的基因数据来深入了解疾病生物学
此外,癌症基因组学和临床实践之间的更好整合,将允许我们直接鉴定表型-基因型。 TCGA代表癌症研究领域的一项重大贡献。
----/ START /---- 今天想分享一个主题:人类基因组时代的泛基因组学。 萨尔兹伯格是一位横跨计算机领域和生物学领域的专家,名气很大,他是约翰霍普金斯大学计算生物学中心的主任,同时在计算机系和医学院任职,专门从事基因测序和基因组学应用研究,人类基因组计划的参与者之一,最近还主持了非洲裔美国人的基因组学项目等 萨尔兹伯格 2010年,华大基因提出了人类泛基因组学的概念,发表了关于泛基因组学的重要文章,那时我刚刚到华大基因实习,虽然未参与过该项目,但多多少少还是有所了解,后来在丹麦人基因组中也对此进行了探索。 这里我参照萨尔兹伯格的综述文章将内容分为以下 6 个部分,同时也融入部分我对泛基因组学的理解: 单一“参考基因组”分析模式的局限; “泛基因组学”概念的由来和定义 构建物种泛基因组的意义; 人类泛基因组的构建 我们知道基因组学的研究都需要围绕 “参考基因组” 来开展,因此它的作用和意义非凡。
Cancer Receptors Status 标准化方法对于乳腺癌受体状态的影像学表型自动检测影响 一、研究背景 在乳腺癌研究中,影像学特征的定量(quantitative radiomic)和基因组学的结合可以帮助鉴定和描述基因组表型 考虑到影像学特征与基因组学的特征分布不是正态的,作者使用Spearman相关秩对miRNAs与影像学特征的关系进行分析,并根据相关性绘图(深浅与大小表示相关程度,颜色表示相关方向)。
2022年1月27日,GSK官方网站发表文章,介绍了GSK与Cerebras在表观基因组学模型开发方面的合作。 与Cerebras Systems的合作,首次实现了用大型数据集 (以前令人望而却步) 来训练复杂的表观基因组学模型。 前言 人工智能有可能改变药物发现的速度、复杂性和安全性,产生更好的药物和疫苗。 人工智能在GSK发挥着关键作用,GSK在人类遗传学、功能基因组学和人工智能的交叉领域进行了大量投资。人工智能使我们能够分析和理解来自基因数据库的数据,这意味着我们可以采取一种更具预测性的方法。 在药物发现中使用表观基因组学 人类是令人难以置信的复杂生物体:人类基因组包含约3万个基因。我们曾经认为基因组是一个完整的蓝图,但这幅图是不完整的。 我们有足够的现实世界中的表观基因组学影响的例子来教计算机做同样的事情,创建一个模型,然后可以用来预测许多重要的生物过程。这使我们更接近于那个完美的数字孪生。
此外,EpiAgent可通过模拟顺式调控元件的敲除来推演细胞状态变化,并在零样本条件下实现细胞类型注释,展示出在单细胞表观基因组学中的广泛潜力。 讨论 EpiAgent首次将基础模型理念系统引入单细胞表观基因组学,通过“细胞句子”的方式有效缓解了scATAC-seq数据的稀疏与高维问题。 该研究为单细胞表观基因组学提供了强有力的计算框架,也为未来探索疾病机制与药物作用提供了新工具。其局限性在于:对训练数据依赖度高,潜在偏倚需进一步评估;在更复杂的扰动场景下仍需扩展验证。 总体而言,EpiAgent标志着单细胞表观基因组学进入基础模型驱动的新阶段。 整理 | DrugOne团队 参考资料 Chen, X., Li, K., Cui, X. et al.
尤其是当深度学习由于“black box”限制不能充分地推动AI在生物学、基因组学中的发展时,很多学者力求探索生成式模型在其中的应用。 基因组学不同于传统的遗传学,它的数据量非常大。遗传学研究通常只牵扯到个别基因,但基因组学研究需考虑一个生物体的所有基因,从整体水平上探索全基因组在生命活动中发挥的作用。 CNN在图像处理领域卓越的性能亦可被用于基因组学研究中。 由于深度学习方法本身的这点不足,人们在直接将其应用在基因组学中,力求解释基因问题时,希望能够赋予自己的模型适当的可解释性。 建模方式讨论 想要提高深度学习在基因组学中应用的效果,除了提升模型结构上的设计,还可以考虑从模型训练上提高。