搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏生信修炼手册
使用picard评估文库复杂度
本文主要介绍下通过picard这个工具来评估文库复杂度，用法如下 java -jar picard.jar \ EstimateLibraryComplexity \ I=input.bam \ O=lib_complex_metrics.txt
1.3K30发布于 2020-05-07
来自专栏简说基因
Picard：高效处理测序数据的必备工具
今天，我将向你介绍Picard的主要功能、它的优缺点，以及如何通过Galaxy平台（usegalaxy.cn）来简化使用。 Picard是什么？ Picard 是一个开源的Java工具集，专门用于操作和分析高通量测序数据。Picard被广泛应用于生物信息学领域，特别是在处理以BAM和SAM格式存储的测序数据时，它表现尤为出色。 Picard的优缺点优点 • 功能强大且全面：Picard的功能涵盖了从去除PCR重复到文库复杂性评估等多个常见分析需求，极大地方便了测序数据的处理。在Galaxy平台上使用Picard 如果你对命令行操作不太熟悉，或者希望更简便地使用Picard，Galaxy生信云平台提供了一个图形化的解决方案。你可以通过中国的Galaxy实例 usegalaxy.cn 来访问和运行Picard。如何在Galaxy上使用Picard？ 1.
85110编辑于 2024-12-23
来自专栏AI科技评论
深度 |“情感计算”之母 Rosalind Picard 二十年经验分享：那些令我惊讶的发现
AI科技评论按：本文将为大家介绍一位在世界 AI 江湖享有特殊声望的人工智能大牛—— Rosalind Picard。而身为“情绪计算”之母的 Rosalind Picard，便是该领域首屈一指的专家。在机器学习算法工具日渐普及的今天，人们猛然醒觉“认知”“情感”正是创造出真正的 AI 的瓶颈。于是，全世界的目光都投向了 Rosalind Picard 的研究。 Rosalind Picard 这次演讲中，我想要与大家分享很多故事。尤其自我早年受到 AI 启发后，研究中遇到的惊奇发现。我年轻的时候，想要创造一个无比智能的 AI 。有一天，实验室里的一名本科生对我说：“教授 Picard，我的弟弟不能说话，他有孤独症，我很想知道到底是什么事让他这么紧张？我能借一个智能腕带在圣诞假期时给我弟弟用吗？拜托了！”
3.1K40发布于 2018-03-09
来自专栏数据科学（冷冻工厂）
CUT&Tag 数据处理和分析教程（5）
以下命令展示了如何使用 Picard 来检查重复率。 ##== linux command ==## ## depending on how you load picard and your server environment, the picardCMD Adjust accordingly. picardCMD="java -jar picard.jar" mkdir -p $projPath/alignment/removeDuplicate/picard_summary /${histName}_picard.rmDup.txt 总结了明显的重复率，并计算出唯一的库大小而无需重复。估计的文库大小是根据 Picard 计算的 PE 重复率来估算文库中独特分子数量的。估计的文库大小与目标表位的丰度以及抗体的质量成正比，而 IgG 样本的估计文库大小通常会很低。
69710编辑于 2025-04-04
来自专栏生信修炼手册
GATK4最佳实践-数据预处理篇
命令如下 java -jar picard.jar SamToFastq \ INPUT=${input_bam} \ FASTQ=/dev/stdout \ NON_PF=true | \ bwa mem -K 100000000 -p -v 3 -t 16 -Y ${bash_ref_fasta} /dev/stdin - | \ java -jar picard.jar 将ubam转换成fastq; 第二步bwa 比对参考基因组；第三步picard将原始数据ubam和比对产生的aligned bam 合并，产生一个最终的bam文件。 Mark Duplicates 标记bam文件中的重复序列，使用picard的MarkDuplicates命令，代码如下： java -jar picard.jar \ MarkDuplicates 标记完重复序列之后，需要对产生的bam文件进行排序，命令如下 java -jar picard.jar \ SortSam \ INPUT=${input_bam} \ OUTPUT=
2.3K40发布于 2020-05-11
来自专栏生信修炼手册
GATK4基本概念整理
和之前的版本相比，GATK4在算法上进行了优化，运行速率有所提高，而且整合了picard 软件的功能。GATK4基于java 语言开发的，需要java 1.8 版本。子命令后面如果有(picard), 说明这个功能是继承于picard软件，从这里也可以看出，GATK4集成了picard软件的功能。再不需要像之前版本一样，混合使用picard 和 gatk 了。总结 GATK4整合了picard软件，在算法上进行了优化，新增了许多新的功能。官网给出了基于GATK4的pipeline, 以WDL这种workflow 流程管理语言编写。
1.3K40发布于 2020-05-11
来自专栏京程一灯
JavaScript 的 Map 指南[每日前端夜话0xC7]
const obj = { name: 'Jean-Luc Picard', age: 59, rank: 'Captain' }; obj.name; // 'Jean-Luc Picard 首先 // 每个嵌套数组的元素是键，第二个是值 ['name', 'Jean-Luc Picard'], ['age', 59], ['rank', 'Captain'] ]); // map.get('name'); // 'Jean-Luc Picard' 假设你想获得 Picard 船长的 age。对于一个对象，你可以用 obj.age。在 Picard 船长的示例中，map.keys() 将始终按该顺序返回 name, age 和 rank 。这也能够保证符合ES6的浏览器的对象键顺序。 const map = new Map([ ['name', 'Jean-Luc Picard'], ['age', 59], ['rank', 'Captain'] ]); const
1.5K30发布于 2019-09-27
来自专栏生信技能树
天真的我准备把全部流程迁移到GATK4
回去就回去，gatk3代码是： module load java/1.8.0_91 GATK=/home/jianmingzeng/biosoft/GATK/GenomeAnalysisTK.jar PICARD =/home/jianmingzeng/biosoft/picardtools/2.9.2/picard.jar GENOME=/home/jianmingzeng/biosoft/GATK/resources basename $id ) sample=${file%%_*} echo $sample java -Djava.io.tmpdir=$TMPDIR -Xmx25g -jar $PICARD rna \ RGPL=illumina RGPU=hiseq RGSM=${sample} java -Djava.io.tmpdir=$TMPDIR -Xmx25g -jar $PICARD METRICS_FILE=$sample.metrics REMOVE_DUPLICATES=TRUE java -Djava.io.tmpdir=$TMPDIR -Xmx25g -jar $PICARD
1.6K10发布于 2018-12-18
课前准备--解析空间转录组肿瘤微环境SNV（visium、stereo）
-@ 10 \ --fasta GRCh38.p12.genome.fa \ --dbsnp dbsnp.chr9.hg38.vcf.gz \ --removetmp \ --picard $pathtopicard/picard.jar \ --gatk $pathtogatk/gatk \ --samtools $pathtosamtools/samtoolsstereo-seqspatialsnvtools -@ 10 \ --fasta GRCh38.p12.genome.fa \ --dbsnp dbsnp.chr9.hg38.vcf.gz \ --removetmp \ --picard $pathtopicard/picard.jar \ --gatk $pathtogatk/gatk \ --samtools $pathtosamtools/samtoolsSNV Calling
23820编辑于 2025-09-12
来自专栏正则
RNAseq 1.1
:samtools, bamo -readcount, HISAT2, stringtie, gffcompare, htseq-count, flexbar, R, ballgown，fastqc和picard-tools /fastqc --help MultiQC pip3 install multiqc multiqc --help Picard wget https://github.com/broadinstitute /picard/releases/download/2.18.15/picard.jar -O picard.jar java -jar $RNA_HOME/student_tools/picard.jar
66520发布于 2021-09-07
来自专栏生信修炼手册
NGS测序中PCR重复序列的判定方法
2. picard MarkDuplicates picard的MarkDuplicates命令称得上是使用的最广泛的去除PCR重复的工具了，要求输入的bam文件为按照比对位置排序之后的文件，用法如下第一步，按照coordinate排序bam文件 samtools sort -o positionsort.bam input.bam # 第二步，运行MarkDuplicate命令 java -jar picard.jar markdup.bam \ M=markdup.metrc.csv 3. sambamba sambamba是一款比samtools速度更快的操作BAM文件的工具，也提供了markdup命令，其PCR重复的判定方法和picard
5.7K21发布于 2020-05-07
来自专栏生信修炼手册
GATK推荐的序列存储格式-uBAM
picard提供了一个FastqToSam功能，可以将序列转换成ubam格式。基本用法如下： java -jar picard.jar FastqToSam F1=sampleA_R1.fastq.gz F2=sampleA_R2.fastq.gz PL= 通过FastqToSam可以从fastq文件得到ubam文件，picard 还提供了SamtoFastq命令，从bam 文件得到fastq 文件用法如下： java -jar picard.jar SamToFastq 总结通过picard工具，可以轻松实现FASTQ和uBAM格式之间的转换。
1.7K20发布于 2020-05-10
来自专栏生命科学与未来科学
心理压力如何加速你的衰老？
纽约哥伦比亚大学的心理生物学家Martin Picard说，由于它们看起来闲着没事，生物学家曾认为，这些宛如僵尸的衰老细胞的能量消耗应低于仍在复制的年轻细胞。在Picard和同事看来，这种能量使用上的不匹配并不矛盾：衰老细胞会积累一些高能耗的损伤如DNA改变，并激活促炎信号。来源：Ref. 2Picard及其同事将这一观点称为“大脑–身体能量节约模型”。 Picard及其团队认为，他们提出的“大脑-身体能量节约模型”可能为此提供理论框架，用以解释压力效应如何从大脑传导至全身。 Picard团队在今年发布的预印本研究中揭示，人体血液和唾液中的GDF15水平会因心理压力刺激而升高[13]。
12100编辑于 2026-05-14
来自专栏生信探索
01.GATK肿瘤基因变异最佳实践SnakeMake流程：WorkFlow简介
BaseRecalibrator) Apply base quality score recalibration (ApplyBQSR) Merge CRAMs of every sample, repesectly (Picard LearnReadOrientationModel) Filter somatic SNVs and indels called by Mutect2 (FilterMutectCalls) Merge all the VCF files (Picard
53500编辑于 2023-05-29
来自专栏生信技能树
一个优秀的ATAC-seq数据分析资源实战（一）
用于移除PCR重复的一个常用程序是Picard的MarkDuplicates工具。 # 安装一下 picard wget https://github.com/broadinstitute/picard/releases/download/3.3.0/picard.jar # 测试一下是否可以使用 java -jar picard.jar -h # 生成 rmDup.sh # REMOVE_DUPLICATES=false: mark duplicate reads, not remove. while read id do echo "java -XX:ParallelGCThreads=30 -Djava.io.tmpdir=/tmp -jar /nas2/zhangj/biosoft/picard /picard.jar MarkDuplicates QUIET=true INPUT=${id}.rmChrM.bam OUTPUT=${id}.rmDup.bam METRICS_FILE=${id
98610编辑于 2025-02-27
来自专栏生信技能树
生物信息学流程也可以是perl开发
align reads of each sample in a run against reference genome (using STAR) and add read groups (using Picard ) perform quality control on generated BAM files (using Picard) count reads in features (using HTSeq-count
77420发布于 2019-05-15
来自专栏生信技能树
Variant 分析阶段小结2- 变异寻找碎碎念
aligned_rmdup.bam> # 会直接取出掉那些重复的reads # samtools index samtools index <aligned_rmdup.bam> GATK and picard compatibility) # picard sort java -Xmx10g -jar /home/zf/software/picard/build/libs/picard.jar SortSam \ INPUT=aligned.sam OUTPUT=aligned_sort.bam SORT_ORDER=coordinate # picard rmeomv dupilcate java -Xmx10g -jar /home/zf/software/picard/build/libs/picard.jar \ MarkDuplicates INPUT=aligned_sort.bam \ OUTPUT index java -Xmx10g -jar /home/zf/software/picard/build/libs/picard.jar \ BuildBamIndex INPUT=aligned_rmdup.bam
4.4K40发布于 2018-07-27
来自专栏生信探索
基因组实战01: introduction
Starting with version 4.0, GATK contains a copy of the Picard toolkit, so all Picard tools are available
33820编辑于 2023-03-25
来自专栏生物信息学、python、R、linux
ChIP-seq分析的一般流程方法
example_dup 其中第二条已经被picard标注出来了。被标注的第二列flag会加1024。去重的软件中samtools rmdup （基本已不用），samtools markdup（更新后的）和picard最常用。 picard与samtools markdup效果相似（仿佛调用的同一个？并不确定）。都可以标记重复，也可以选择直接去掉。以下是用法： samtools markdup -@ 8 -r test.bam filter_test.bam # -r是直接去掉重复，不加是直接标记 picard去重有三种方式可选，在DUPLICATE_SCORING_STRATEGY picard MarkDuplicates I=test.bam O= filter_test.bam M=dup_metrics.txt REMOVE_DUPLICATES=true 4.peak
5.2K20发布于 2020-04-01
来自专栏生信技能树
肿瘤全外显子测序数据分析流程大放送
%N)echo SortSam `date`java -Djava.io.tmpdir=$TMPDIR -Xmx40g -jar $PICARD SortSam SORT_ORDER=coordinate %N)echo MarkDuplicates `date`java -Djava.io.tmpdir=$TMPDIR -Xmx40g -jar $PICARD MarkDuplicates \INPUT %N)echo FixMateInfo `date`java -Djava.io.tmpdir=$TMPDIR -Xmx40g -jar $PICARD FixMateInformation \INPUT /picard-tools/1.119/picard-tools-1.119.zipunzip picard-tools-1.119.zipmkdir 2.9.2 && cd 2.9.2 wget https ://github.com/broadinstitute/picard/releases/download/2.9.2/picard.jarcd ~/biosoft## https://sourceforge.net
3.5K80发布于 2018-03-09

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页

点击加载更多

使用picard评估文库复杂度

Picard：高效处理测序数据的必备工具

深度 |“情感计算”之母 Rosalind Picard 二十年经验分享：那些令我惊讶的发现

CUT&Tag 数据处理和分析教程（5）

GATK4最佳实践-数据预处理篇

GATK4基本概念整理

JavaScript 的 Map 指南[每日前端夜话0xC7]

天真的我准备把全部流程迁移到GATK4

课前准备--解析空间转录组肿瘤微环境SNV（visium、stereo）

RNAseq 1.1

NGS测序中PCR重复序列的判定方法

GATK推荐的序列存储格式-uBAM

心理压力如何加速你的衰老？

01.GATK肿瘤基因变异最佳实践SnakeMake流程：WorkFlow简介

一个优秀的ATAC-seq数据分析资源实战（一）

生物信息学流程也可以是perl开发

Variant 分析阶段小结2- 变异寻找碎碎念

基因组实战01: introduction

ChIP-seq分析的一般流程方法

肿瘤全外显子测序数据分析流程大放送

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐