搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏腾讯云大数据
Flink 实践教程-进阶（4）：TOP-N
作者：腾讯云流计算 Oceanus 团队流计算 Oceanus 简介流计算 Oceanus 是大数据产品生态体系的实时化分析利器，是基于 Apache Flink 构建的具备一站开发、无缝连接、亚秒延时、低廉成本、安全稳定等特点的企业级实时大数据分析平台。流计算 Oceanus 以实现企业数据价值最大化为目标，加速企业实时化数字化的建设进程。本文将会介绍如何使用 Flink 实现常见的 TopN 统计需求。首先使用 Python 脚本模拟生成商品购买数据（每秒钟发送一条）并发送到 CKafka，随后
81620编辑于 2021-12-22
来自专栏后端技术
【论文】Joint Representation Learning for Top-N Recommendation with Heterogeneous Information Sources
在推荐系统中，最常用的就是用户分数了，它是矩阵协同过滤的基础。但除了分数外，图片、文字等特征也有利于勾勒用户的喜好轮廓。然而，图片、文字、分数的结构不同，难以统一地处理。在此之前，人们的做法无非两种：
1K31发布于 2019-06-25
来自专栏stream process
storm RollingTopWords 实时top-N计算任务窗口设计
(3) IntermediateRankingsBolt,这是个中间bolt，主要是为了预先计算部分word的top-N排行榜出来，减少最终节点的排序工作。（4）TotalRankingsBolt 最终top-N排序并输出计算结果。
69610发布于 2020-03-05
来自专栏暴走大数据
Flink SQL高效Top-N方案的实现原理
Top-N Top-N是我们应用Flink进行业务开发时的常见场景，传统的DataStream API已经有了非常成熟的实现方案，如果换成Flink SQL，又该怎样操作？ rankRange：排名区间（即Top-N一词中的N）。注意如果是分组Top-N（即有PARTITION BY子句），就会按照partitionKey的hash值分发到各个sub-task，否则会将并行度强制设为1，计算全局Top-N。另外从代码可以读出，Top-N语法目前仅支持ROW_NUMBER，暂时还不支持RANK和DENSE_RANK排名。如果Top-N的规模比较大，适当增加此值可以避免频繁访问状态，提高执行效率。
2.8K20发布于 2021-01-26
来自专栏大数据成神之路
Flink SQL高效Top-N方案的实现原理
Top-N是我们应用Flink进行业务开发时的常见场景，传统的DataStream API已经有了非常成熟的实现方案，如果换成Flink SQL，又该怎样操作？ rankRange：排名区间（即Top-N一词中的N）。注意如果是分组Top-N（即有PARTITION BY子句），就会按照partitionKey的hash值分发到各个sub-task，否则会将并行度强制设为1，计算全局Top-N。另外从代码可以读出，Top-N语法目前仅支持ROW_NUMBER，暂时还不支持RANK和DENSE_RANK排名。如果Top-N的规模比较大，适当增加此值可以避免频繁访问状态，提高执行效率。
1.4K30发布于 2021-10-27
来自专栏小晨讲Flink
Flink SQL高效Top-N方案的实现原理
Top-N Top-N是我们应用Flink进行业务开发时的常见场景，传统的DataStream API已经有了非常成熟的实现方案，如果换成Flink SQL，又该怎样操作？ rankRange：排名区间（即Top-N一词中的N）。注意如果是分组Top-N（即有PARTITION BY子句），就会按照partitionKey的hash值分发到各个sub-task，否则会将并行度强制设为1，计算全局Top-N。另外从代码可以读出，Top-N语法目前仅支持ROW_NUMBER，暂时还不支持RANK和DENSE_RANK排名。如果Top-N的规模比较大，适当增加此值可以避免频繁访问状态，提高执行效率。 The End
97650编辑于 2022-03-09
来自专栏开源部署
Oracle子查询相关内容(包含TOP-N查询和分页查询)
二、oracle中TOP-N查询：概念：用于获取一个查询中的前N条记录，需要借助rownum伪列来实现，rownum伪列，oracle为每个查询自动生成的伪列，物理上并不存在，查询中经常涉及多个表，但每个查询只有一列伪列
1.6K20编辑于 2022-08-17
来自专栏博文视点Broadview
Excel Power Query与Power Pivot结合：TOP-N对象贡献度分析
TOP-N分析法通常用来分析客户、店铺或产品对于整体的贡献度问题。本节内容我们需要指定N个门店，分析这N个门店的产品销售总金额或毛利润对于整体的贡献度，如图所示。该模型主要的功能在于可以根据选择的指标动态地进行筛选，方便我们实时把握贡献最大的TOP-N的门店，开展有针对性的经营活动。下面介绍一下这个模型的具体的建立步骤。经过以上的几个步骤，这个查看TOP-N门店销售和利润贡献度的模型就建立完成了，核心点就是参数表的建立。最后在Power Pivot的管理界面中将不需要在数据透视表里显示的度量值“筛选条件”隐藏即可。
2.9K70编辑于 2023-04-04
来自专栏AI科技评论
Top-N物品推荐算法评测设置回顾
近十年里，top-N商品推荐是隐式反馈中一个被广泛研究的课题，其目的是从大量数据中识别出用户可能偏爱的一小部分物品。各种top-N物品推荐算法已经被开发出来，特别是基于深度学习的研究取得了很大的进展。为了证明推荐算法的有效性，需要在基准数据集上建立可靠的评价实验。对于top-N物品推荐，每条评论被视为用户和某个物品之间的交互记录，而其余信息则被丢弃，比如文本和元数据。评价指标 Top-N项目推荐可以视为一项排序任务，排在前端的结果需要重点考虑。 4 结语我们通过实验检验了三个重要因素对于top-N推荐算法评测的影响。我们的实验结果为物品推荐算法提出了一些经验建议。
1.9K20发布于 2020-10-27
来自专栏小麦苗的DB宝专栏
【DB笔试面试399】现需要查询参加了课程ID为C10的考试，并且分数排在前10名的学生，以下哪项语句能够实现此功能（）
本题考察TOP-N查询。在数据库查询中，“Top-N分析”也称“Top-N查询”，就是获取某一数据集合（表或查询结果集）中的前N条记录，例如，考试成绩前三名的学生信息、销量前十名的畅销书信息、从当前时刻开始最早离港的五次航班信息等，实际应用中Top-N分析经常会用到。以下几点内容是Top-N的性质：（1）Top-N分析就是查询前几名的意思。（2）Top-N分析通过ROWNUM实现。（3）Top-N分析中必须使用ORDER BY排序子句。（4）Top-N分析中通常会有内建视图，一般的方法是先对内建视图的某一列或某些列排序，然后对此内建视图使用ROWNUM取前多少行数据。所以，本题的答案为D。
85110发布于 2019-09-30
来自专栏机器学习之旅
R开发：协调过滤推荐
模型预测 TOP-N预测对模型预测可运用predict()函数，在此分别以TOP-N预测及评分预测为例，预测第940-943位观影者的评分情况。 n表示最终为TOP-N的列表推荐，参数type = "ratings"表示运用评分预测观影者对电影评分，模型结果均需转为list或矩阵表示 pred <- predict ( key1_popul , #top-N为有序列表，抽取最优推荐子集 pred3 <- bestN ( pred , n = 3 ) as ( pred3 , "list" ) ? TOP-N预测模型评价通过4-fold交叉验证方法分割数据集，运用evaluate()进行TOP-N预测模型评价,评价结果可通过ROC曲线及准确率-召回率曲线展示: #4-fold交叉验证 tops 可首先构建一个推荐算法列表，通过ROC曲线、、准确率-召回率曲线或RMSE直方图进行比较 TOP-N算法比较 set.seed ( 2016 ) scheme <- evaluationScheme
54020发布于 2018-08-27
WAR-Re：语义推理让API推荐快3倍
“固定 top-N”就像给所有脚塞同一码鞋——83%的API推荐因此错配。固定Top-N的坑有多深 2.4 万条真实 mashup 日志显示，固定 Top-N 推荐像钝刀切菜：简单场景只需 1～2 个接口，系统硬塞 10 个，冗余度 78%；复杂场景需 8 个以上，却只给 5 冷启动更惨烈：新 API 占 registry 18%，在固定 Top-N 列表里出现不足 1%，零交互使其永沉底部，潜在有效组合被漏掉 63%，长尾 API 集体失声。让API列表自己“伸缩” TinyLlama词表新增<API_start/stop>令牌，模型遇停符即截断，推荐长度由固定top-N变为1~N弹性输出。
10910编辑于 2026-05-18
来自专栏专知
【论文读书笔记】个性化序列推荐：卷积序列嵌入方法
【论文】：Personalized Top-N Sequential Recommendation via Convolutional Sequence Embedding ? 序列推荐将每个用户建模为过去交互过的物品的序列，目的是预测用户可能在“不久的将来”进行交互的Top-N个物品。大多数系统，例如top-N推荐，根据用户的一般喜好推荐物品，而不注意项物品的最近情况。例如，一些用户总是更喜欢苹果的产品而不是三星的产品。和传统的Top-N推荐不同的是，top-N序列推荐将用户行为建模为物品的序列，而不是物品的集合。本文在公开的现实生活数据集的实验和案例研究表明，caser的性能优于Top-N 序列推荐的最新方法。
3.1K70发布于 2018-04-13
来自专栏炼丹笔记
庖丁解牛之ComiRec
Serving阶段，每个兴趣向量召回Top-N Items，然后输入到Agrregation Module，最终平衡准确性和多样性召回Top-N的items。 07 Aggregation Module 在获得多个兴趣向量后，每个向量都能ANN检索出top-N个item，怎么聚合这些item呢？
1.6K30发布于 2021-05-14
来自专栏数据库新发现
深入内核丨12C 新特性之 TOP - N 频率柱状图原理和算法
因而，TOP - N 数值的数据总数在该字段的非空值数据总数中的比例大于（1-1/MNB）也成为产生 Top－N 频率柱状图的一个必要条件。（调整后的 Top - N 数据记录总数）/（非空数值记录总数）>（1-(1/MNB)）演示以下用一个例子来演示 Top－N 频率柱状图的产生。 ? 注意：因为最小值(1)没有被包含在最初分析的 Top－N 值当中，它替换了里面数据量最少的唯一值(5)，并且数据量设置为1。 ? 本例当中，新的密度为（非空值总数－ Top - N 数值总数）/（非 Top－N 数值总数）/（非空值总数）= （4650-4501）/（30-26）/4650 = 0.008010753。
1.2K20发布于 2019-05-26
来自专栏数据和云
深入内核丨12C 新特性之 TOP - N 频率柱状图原理和算法
因而，TOP - N 数值的数据总数在该字段的非空值数据总数中的比例大于（1-1/MNB）也成为产生 Top－N 频率柱状图的一个必要条件。（调整后的 Top - N 数据记录总数）/（非空数值记录总数）>（1-(1/MNB)）演示以下用一个例子来演示 Top－N 频率柱状图的产生。注意：因为最小值(1)没有被包含在最初分析的 Top－N 值当中，它替换了里面数据量最少的唯一值(5)，并且数据量设置为1。本例当中，新的密度为（非空值总数－ Top - N 数值总数）/（非 Top－N 数值总数）/（非空值总数）= （4650-4501）/（30-26）/4650 = 0.008010753。
1.2K120发布于 2018-03-12
来自专栏月小水长
复杂网络 | 社交媒体话题和人物共现
csv 文件，就能实时生成这个 ChatGPT 帖子讨论中的 hashtag 话题和 user 人物共现可视化矩阵，结果文件为 Gephi 所需的 nodes.csv 和 edges.csv 和前 Top-N top_N_matrix.csv echarts 实现的网络可视化以及顺带的一些基本的复杂网络分析：度分布、度度相关性、核度分布和集聚系数等基本统计特征类似地，同时生成的 user 人物共现可视化结果如下： Top-N
70510编辑于 2023-04-27
来自专栏机器之心
腾讯QQ看点团队：用迁移学习架构解决短视频冷启推荐问题
3、样本选择经过上述处理，对于不同观看历史的用户，PeterRec 模型预测出来的 top-N 结果已经具有一定的相关性。我们发现 LambdaFM 论文提供了 3 种负采样方法，本文这里采用了第一种负采样方式，在后续工作我们也会尝试动态负采样，根据论文动态负采样通常推荐 top-N 效果更好。表 1：QQ 看点的新冷用户推荐示例后续为了增加推荐 top-N 结果中的多样性，我们在 Predict 的过程中做了一些改变： ? 第二类是从用户的有效播序列中随机采样一些 item 来构造子序列，原因是用户的播放序列中往往包含了多个种类的视频，随机构造子序列引入了随机性，可以更好地丰富 top-N 结果中包含的视频种类。最后将用户对应的所有子序列的 top-N 结果，进行 concat、shuffle 和去重，得到用户最终的 top-N 推荐列表。
2.6K20发布于 2020-11-04
来自专栏null的专栏
推荐系统——（论文阅读笔记）YouTube的视频推荐系统
以下是论文的核心内容：目标帮助用户找到高质量且符合用户兴趣的视频，最终实现的是Top-N推荐。总的思想利用用户的互动行为数据，推荐与互动过视频相似的视频。计算出所有的与视频相似的视频，根据相似性的值从候选集中找到Top-N的相似视频。
2.2K31编辑于 2022-03-04
来自专栏bisal的个人杂货铺
从rownum的SQL需求还能归纳出的知识
ROW_NUMBER() OVER ([query_partition_clause] order_by_clause) ROW_NUMBER()为查询出来的每一行记录生成一个序号，依次排序且不会重复，能用于实现top-N This use of the function lets you implement top-N, bottom-N, and inner-N reporting 这是《Reference》的示例
87620发布于 2019-03-11

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

Flink 实践教程-进阶（4）：TOP-N

【论文】Joint Representation Learning for Top-N Recommendation with Heterogeneous Information Sources

storm RollingTopWords 实时top-N计算任务窗口设计

Flink SQL高效Top-N方案的实现原理

Flink SQL高效Top-N方案的实现原理

Flink SQL高效Top-N方案的实现原理

Oracle子查询相关内容(包含TOP-N查询和分页查询)

Excel Power Query与Power Pivot结合：TOP-N对象贡献度分析

Top-N物品推荐算法评测设置回顾

【DB笔试面试399】现需要查询参加了课程ID为C10的考试，并且分数排在前10名的学生，以下哪项语句能够实现此功能（）

R开发：协调过滤推荐

WAR-Re：语义推理让API推荐快3倍

【论文读书笔记】个性化序列推荐：卷积序列嵌入方法

庖丁解牛之ComiRec

深入内核丨12C 新特性之 TOP - N 频率柱状图原理和算法

深入内核丨12C 新特性之 TOP - N 频率柱状图原理和算法

复杂网络 | 社交媒体话题和人物共现

腾讯QQ看点团队：用迁移学习架构解决短视频冷启推荐问题

推荐系统——（论文阅读笔记）YouTube的视频推荐系统

从rownum的SQL需求还能归纳出的知识

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐