搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏JavaScript全栈
每日两题 T5
每个值 v = grid[i][j] 表示 v 个正方体叠放在对应单元格 (i, j) 上。
50910发布于 2020-07-17
来自专栏计算机工具
Starting window AppWindowToken，MainActivity t5}}} timed out
AppWindowToken{425222e8 token=Token{42565028 ActivityRecord{42323ea8 u0 com.itep.mt.infoviewer/.MainActivity t5
19310编辑于 2024-12-16
来自专栏深度学习自然语言处理
【长文详解】T5: Text-to-Text Transfer Transformer 阅读笔记
本文是对 T5 论文[1]的阅读笔记，原文篇幅很长并且涉及很多模型与技术，我将其视为一份实验报告性质的综述，于是花了较长时间进行阅读与笔记的整理。 T5 的基本思想是将每个 NLP 问题都视为“text-to-text”问题，即将文本作为输入并生成新的文本作为输出，这允许将相同的模型、目标、训练步骤和解码过程，直接应用于每个任务。 text-to-text 任务的方法，并描述了 “Colossal Clean Crawled Corpus” C4 数据集，模型和框架称为 “Text-to-Text Transfer Transformer” T5 为了促进结果的复制，扩展和应用，我们发布了每个 T5 变体的代码，C4 数据集和预训练的模型权重。参考 ^T5 论文 https://arxiv.org/abs/1910.10683 ^相对位置嵌入 https://arxiv.org/abs/1803.02155 ^decaNLP https://
12.8K23发布于 2019-11-12
来自专栏机器学习初学者精选文章
【NLP】使用Google的T5提取文本特征
---- 在本文中，我们将演示如何使用Google T5对表格数据中的文本进行特征化。关于T5 对于任何不熟悉T5的读者来说，T5模型出现在谷歌的论文中，题目是Exploring the Limits of Transfer Learning with a Unified Text-to-Text 使用Hugging Face T5的一个机器学习demo ? 为了扩展NLP库以便与T5一起使用，我们将构建两个自定义TransformPrimitive类。编码器的新类，该类将使用微调的T5模型，下面的代码创建了一个名为T5SentimentEncoder的新类，该类将使用预训练的T5模型。
1.9K30发布于 2021-07-29
从 BART 到 T5：大型语言模型的演进与未来趋势
T5：统一 NLP 任务的革新者紧随 BART 之后，2020 年 T5（Text-to-Text Transfer Transformer）的出现，再次颠覆了人们对 NLP 模型的认知。 T5 基于 Transformer 架构构建，同样拥有强大的编码器 - 解码器结构。演进脉络：架构、训练与任务处理的升级从 BART 到 T5，我们能清晰地看到大型语言模型在多个维度的显著演进。 T5 的架构设计更加简洁、通用，减少了针对特定任务的复杂调整，提升了模型的灵活性和适应性。 T5 使用了更大规模的数据集进行训练，这使得模型能够接触到更广泛、更丰富的语言表达形式，从而增强了模型的泛化能力。
49410编辑于 2025-10-14
来自专栏AI科技大本营的专栏
T5，一个探索迁移学习边界的模型
Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer》这篇论文中提出了一个最新的预训练模型 T5 T5是什么？ ? T5 是一个文本到文本迁移 Transformer 模型，通过将所有任务统一视为一个输入文本并输出文本，其中任务类型作为描述符嵌入到输入中。 T5的贡献是什么？ T5 模型通过将不同的任务编码为输入流中的文本指令，以统一的方式处理各种多对一和多对一 NLP 任务。本文的目的主要是通过使用 T5 模型研究从大规模的无监督预训练到监督任务，与大规模利用转移学习相关的因素在此过程中，性能指标也体现出迁移学习在某些语言理解（在人的层面上）任务上的局限性。与真正的回归模型输出可以是一个连续的值不同，T5 模型预测值的范围为 1-5，增量 .2.。这与值为 0 结合产生 21 个值，本质上是 21 类分类问题。
1.1K00发布于 2019-11-13
来自专栏大数据文摘
最强记忆 VS 最强检索：T5 & REALM 你pick谁？
这里提到的两个模型，类比的话，T5 便是那个将一切都记下来并回答的人，而 REALM 则是善于利用它的“搜索引擎”的人。最强记忆 T5 关于 T5 模型，原理并不难，简单说就是：一个超大Transformer Encoder-Decoder 模型（11B，110亿参数） Bert 式的文本破坏(corrupt)方法 Replace 最近发了篇 T5 在开放域问答的短论文，How Much Knowledge Can You Pack Into the Parameters of a Language Model? 在实验结果中，REALM 也与 T5 进行了比较，打爆了 T5，同时参数量少了很多，也比较有解释性。但另一方面，REALM 也因为中间步骤太多，导致超参有些多，训练麻烦。
1K31发布于 2020-03-05
T5：开启文本生成新时代的全能型 Transformer
一、T5 原理：用 “文本生成” 统一 NLP 任务 T5 的核心思想非常简洁且极具创新性 —— 将所有 NLP 任务，无论是文本分类、问答系统，还是机器翻译、摘要生成，都视为从输入文本到输出文本的转换过程二、Java 语言示例：使用 T5 进行简单文本生成虽然 T5 原生基于 Python 的 TensorFlow 和 PyTorch 实现，但可以通过 Java 调用相关服务或接口来使用 T5。以下示例基于 Deeplearning4j 和模拟的 T5 服务调用（实际需通过 HTTP 或其他方式调用 T5 模型服务），展示如何使用 T5 进行文本摘要生成： import org.deeplearning4j.nn.graph.ComputationGraph 空间复杂度 T5 的空间复杂度主要来源于模型参数和中间计算结果。 T5 以其 “大一统” 的设计理念和强大的文本处理能力，为 NLP 领域带来了新的变革。无论是新手探索 NLP 的奥秘，还是成手寻求技术突破，T5 都值得深入研究和实践。
68810编辑于 2025-10-14
来自专栏小七的各种胡思乱想
冻结Prompt微调LM： T5 & PET & LM-BFF
以下按时间顺序介绍，支持任意NLP任务的T5，针对文本分类的两篇PET和LM-BFF。不知道这是否是谷歌押注T5，而没有像OpenAI一样选择Deocder结构的原因。并没有太多从语义和上下文关联的角度去进行prompt模板的构建，我猜这是T5在论文中提到他们尝试了不同的prompt模板发现效果影响有限的原因（哈哈因为都不太好所以没啥差异），不不能否定T5在通用LM上做出的贡献 prompt模板搜索固定标签词，作者使用T5来进行模板生成，让T5负责在标签词前、后生成符合上下文语义的prompt指令，再在所有训练样本中选择整体表现最优的prompt模板。如下, 固定二分类的标签词是great和terrible，T5的模型输入为Input+MASK+标签对应标签词+MASK，让模型来完成对MASK部分的填充。
2.8K81编辑于 2023-02-26
来自专栏AI研习社
T5 模型：NLP Text-to-Text 预训练模型超大规模探索
首先为什么叫 T5 模型，因为是 Transfer Text-to-Text Transformer 的简写，和 XLNet 一样也不在芝麻街玩了，也有说法是吐槽谷歌 T5 Level（高级软件工程师）比如上图中，输出 3.8 其实不是数值，而是一串文本，之所以能进行这样的操作，应该完全赖于 T5 模型强大的容量。于是乎，就把它定为 T5 模型，因此所谓的 T5 模型其实就是个 Transformer 的 Encoder-Decoder 模型。终于获得了完整的 T5 模型，还有它的训练方法。到此基本上 T5 预训练就大致说完了，之后是些细碎探索。
2.3K31发布于 2019-11-06
来自专栏AI小白入门
【NLP】T5 模型：Text-to-Text 预训练模型超大规模探索
首先为什么叫 T5 模型，因为是 Transfer Text-to-Text Transformer 的简写，和 XLNet 一样也不在芝麻街玩了，也有说法是吐槽谷歌 T5 Level（高级软件工程师）比如上图中，输出 3.8 其实不是数值，而是一串文本，之所以能进行这样的操作，应该完全赖于 T5 模型强大的容量。于是乎，就把它定为 T5 模型，因此所谓的 T5 模型其实就是个 Transformer 的 Encoder-Decoder 模型。终于获得了完整的 T5 模型，还有它的训练方法。到此基本上 T5 预训练就大致说完了，之后是些细碎探索。
1.1K40发布于 2019-12-09
来自专栏数据派THU
【NLP】从T5到GPT-4！大语言模型全新综述来了
从 2019 年的谷歌 T5 到 OpenAI GPT 系列，参数量爆炸的大模型不断涌现。
1K20编辑于 2023-05-11
来自专栏相约机器人
谷歌T5模型刷新GLUE榜单，110亿参数量，17项NLP任务新SOTA
在 GLUE 基准排行榜上，T5 超越 ALBERT，位列榜首。 T5 模型谷歌提出的 T5 模型具体是何构造呢？他们的编码器-解码器 Transformer 实现大致遵循 Vaswani 等人提出的原版 Transformer 架构。实验在论文的「实验」部分，谷歌的研究者进行了一系列实验来测试 T5 模型的迁移学习性能。结果如下表 14 所示： ? 表 14：T5 模型众多变体在各个任务上的性能。总体而言，在实验的 24 项任务中，T5 模型在其中的 17 个任务上都取得了 SOTA 性能。不出所料，参数量为 110 亿的最大 T5 模型在所有任务中性能最佳。
1.5K10发布于 2019-11-01
来自专栏腾讯技术工程官方号的专栏
聚集在腾讯CSIG的T5科学家，究竟是怎样的存在？
“T5”在腾讯是怎么样的存在？这个问题，如果给两万名腾讯技术人员来回答，大部分的答案估计只有一个字 —— 神。腾讯对T5科学家的评定标准极其严苛：他们不仅要是各自领域公认的资深专家，还需要有足够的战略眼光参与公司重大领域和项目。这让创立20年的腾讯T5科学家极为稀缺，此前他们像七龙珠一般星散在各个事业群。吴石等团队骨干也在回国后不久加入腾讯，成立了科恩实验室，正式成为腾讯T5科学家。从这些让人眼花缭乱的成就，可以想见每一次关于T5的任命消息出炉，在腾讯内外会引发怎样的关注。 T5的队伍依旧在不断壮大中，标准也愈发严苛，下一位科学家将会是谁？
3.3K31发布于 2019-05-16
来自专栏数据派THU
Google的预训练模型又霸榜了，这次叫做T5（附榜单）
Google又出大招了，这次叫做T5: T5 serves primarily as code for reproducing the experiments in Exploring the Limits T5 can be used as a library for future model development by providing useful modules for training and
1.2K80发布于 2019-11-01
来自专栏小七的各种胡思乱想
冻结Prompt微调LM： T5 & PET & LM-BFF
以下按时间顺序介绍，支持任意NLP任务的T5，针对文本分类的两篇PET和LM-BFF。不知道这是否是谷歌押注T5，而没有像OpenAI一样选择Deocder结构的原因。并没有太多从语义和上下文关联的角度去进行prompt模板的构建，我猜这是T5在论文中提到他们尝试了不同的prompt模板发现效果影响有限的原因（哈哈因为都不太好所以没啥差异），不不能否定T5在通用LM上做出的贡献 prompt模板搜索固定标签词，作者使用T5来进行模板生成，让T5负责在标签词前、后生成符合上下文语义的prompt指令，再在所有训练样本中选择整体表现最优的prompt模板。如下, 固定二分类的标签词是great和terrible，T5的模型输入为Input+MASK+标签对应标签词+MASK，让模型来完成对MASK部分的填充。
2K21编辑于 2023-03-06
来自专栏机器之心
谷歌T5模型刷新GLUE榜单，110亿参数量，17项NLP任务新SOTA
在 GLUE 基准排行榜上，T5 超越 ALBERT，位列榜首。 T5 模型谷歌提出的 T5 模型具体是何构造呢？他们的编码器-解码器 Transformer 实现大致遵循 Vaswani 等人提出的原版 Transformer 架构。实验在论文的「实验」部分，谷歌的研究者进行了一系列实验来测试 T5 模型的迁移学习性能。结果如下表 14 所示： ? 表 14：T5 模型众多变体在各个任务上的性能。总体而言，在实验的 24 项任务中，T5 模型在其中的 17 个任务上都取得了 SOTA 性能。不出所料，参数量为 110 亿的最大 T5 模型在所有任务中性能最佳。
1.1K20发布于 2019-10-30
来自专栏AI科技评论
谷歌提出“T5” 新NLP模型，多基准测试达SOTA
作者在C4数据集上对T5 模型进行预训练，让模型在许多 NLP 基准上都实现了最佳结果，与此同时还拥有足够的灵活性，进行微调后可应用到多个重要的下游任务上。 T5 模型甚至可以被应用到回归任务上，具体方式是训练 T5 模型来预测一个数字的字符串表示，而不是这个数字本身。文本到文本框架图。 5、扩展到其他任务，表现也同样可喜 T5非常灵活，可以非常容易的进行修改，除了作者论文中的一些任务，在其他任务中也能取得了巨大的成功。例如在下面两个新任务中，模型表现也不错。在预训练期间，T5学习如何从C4文档中填充文本的丢失跨度。对模型进行了微调，在无需输入任何信息或者上下文的情况下，将其应用于已经封闭式问答。为了客观看待此类问题，T5团队在酒吧琐事挑战（pub trivia challenge）与训练好的模型并肩作战，但不幸的是惨败而归。如下动图所示 2、完形填空第二个任务是完形填空。
1.2K40发布于 2020-02-26
来自专栏DeepHub IMBA
微调大型语言模型示例：使用T5将自然语言转换成SQL语句
在本文中，我们将使用谷歌的文本到文本生成模型T5和我们的自定义数据进行迁移学习，这样它就可以将基本问题转换为SQL查询。我们将在T5中添加一个名为:将英语翻译为SQL的新任务，它可以转换以下示例查询: Cars built after 2020 and manufactured in Italy 将输出一下SQL语句 SELECT : target_ids.to(dtype=torch.long), 'target_ids_y': target_ids.to(dtype=torch.long) } 微调 T5 T5是一个大型型号，我们需要GPU对其进行微调。 @pip_requirements：微调我们的模型所需的Python软件包。我们可以设计自己的任务，并进行微调T5供自己使用。
1.7K30编辑于 2022-06-04
来自专栏CSDNToQQCode
2022年11月21日13:32:00——T5——JS对象与Date日期函数
其中：dateObject 所指的月份中的某一天，使用本地时间。返回值是 1 ~ 31 之间的一个整数。
88620编辑于 2022-11-28

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

每日两题 T5

Starting window AppWindowToken，MainActivity t5}}} timed out

【长文详解】T5: Text-to-Text Transfer Transformer 阅读笔记

【NLP】使用Google的T5提取文本特征

从 BART 到 T5：大型语言模型的演进与未来趋势

T5，一个探索迁移学习边界的模型

最强记忆 VS 最强检索：T5 & REALM 你pick谁？

T5：开启文本生成新时代的全能型 Transformer

冻结Prompt微调LM： T5 & PET & LM-BFF

T5 模型：NLP Text-to-Text 预训练模型超大规模探索

【NLP】T5 模型：Text-to-Text 预训练模型超大规模探索

【NLP】从T5到GPT-4！大语言模型全新综述来了

谷歌T5模型刷新GLUE榜单，110亿参数量，17项NLP任务新SOTA

聚集在腾讯CSIG的T5科学家，究竟是怎样的存在？

Google的预训练模型又霸榜了，这次叫做T5（附榜单）

冻结Prompt微调LM： T5 & PET & LM-BFF

谷歌T5模型刷新GLUE榜单，110亿参数量，17项NLP任务新SOTA

谷歌提出“T5” 新NLP模型，多基准测试达SOTA

微调大型语言模型示例：使用T5将自然语言转换成SQL语句

2022年11月21日13:32:00——T5——JS对象与Date日期函数

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐