搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏单细胞天地
Barcoding || 海量单细胞的关键技术
下面我们来算一下几个例子： library(stringdist) # 至少你应该知道我用的是R语言 stringdist('ATGCCTAA','ATGCCTAA', method = "hamming ") [1] 0 stringdist('AAAAAAAA','ATGCCTAA', method = "hamming") [1] 5 stringdist('AAAAAACC','ATGCCTAA' 10000,function(i){ x = sample(seq1,1) y = sample(seq1,1) while(x==y){y=sample(seq1,1)} stringdist
1.6K10发布于 2021-04-29
来自专栏医学和生信笔记
fuzzyjoin实现模糊匹配连接
regex_inner_join regex_left_join regex_right_join regex_full_join regex_semi_join regex_anti_join 除此之外，还有以下前缀： stringdist 2 现在我们根据sub_misspellings中的misspelling列和words中的word列进行连接，正常情况下，由于misspelling列中都是拼错的单词，它是不可能连接起来的，但是stringdist_inner_join 可以根据单词之间的距离进行连接，达到忽略拼写错误的目的： joined <- sub_misspellings %>% stringdist_inner_join(words, by = c(misspelling
75961编辑于 2023-08-30
来自专栏社区的朋友们
Kaggle 实战：Quora Question Pairs
# 使用 stringdist 包 library(stringdist) # 余弦相似度 dist_cos = stringdist(q1, q2, method="cosine ") # 莱文斯坦距离 dist_lv = stringdist(q1, q2, method="lv") # 转化为 0-1 范围 dist_lv_r <- 1 -
2.2K10发布于 2017-06-15
来自专栏R语言交流中心
R语言实现多序列比对（MSA）可视化
然后，我们看下增加了进化树的综合绘图： library(Biostrings) x <- readAAStringSet(sequences) d <- as.dist(stringDist(x, method
9.7K20发布于 2020-02-25
来自专栏生信技能树
基因家族分析之获取全部cDNA碱基序列构建进化树
sdist <- stringDist(as(auto,"AAStringSet"), method="hamming") clust <- hclust(sdist, method = "single
1.9K31发布于 2019-10-09
来自专栏作图丫
ggtree-给你的进化树盛世美颜
tipseq_aln <- muscle::muscle(tipseq) tipseq_aln <- DNAStringSet(tipseq_aln) ## 计算成对距离 tipseq_dist <- stringDist
14.3K42编辑于 2022-03-29
来自专栏大数据文摘
12月的音乐可视化笔记：我从TOP2000歌曲中，分析了这几年流行音乐的变化趋势
我使用了R语言的stringdist包，用其中的Full Damerau-Levenshtein距离来比对两个榜单的歌曲名与歌手名（它计算了将b转为a时相邻字符发生的删除、插入、替换、转置等必要变换的数量
1.6K30发布于 2018-05-24

Barcoding || 海量单细胞的关键技术

fuzzyjoin实现模糊匹配连接

Kaggle 实战：Quora Question Pairs

R语言实现多序列比对（MSA）可视化

基因家族分析之获取全部cDNA碱基序列构建进化树

ggtree-给你的进化树盛世美颜

12月的音乐可视化笔记：我从TOP2000歌曲中，分析了这几年流行音乐的变化趋势

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐