搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏Dance with GenAI
零代码编程：用ChatGPT将vtt转换成LRC和srt格式的字幕
要把VTT字幕文件转换成SRT或LRC格式，可以使用Python的webvtt库。安装命令： pip install webvtt-py WebVTT字幕格式与SRT字幕格式主要区别在于时间格式的区分。下面是一个WebVTT格式的字幕文件 00:00:20.000 --> 00:00:24.400 En réponse à l'augmentation dramatique de la criminalité lexfridman-podcast\vtt 读取文件夹中的vtt后缀文件，然后转换成SRT格式和LRC格式；注意：每一步都要输出相关信息 ChatGPT给出的源代码： import os import webvtt convert_vtt_to_srt(vtt_filename, srt_filename): print(f"正在将 {vtt_filename} 转换为 {srt_filename}") vtt = webvtt.read
1.7K10编辑于 2024-06-24
每日一库：go-astisub —— 专注于多格式字幕文件的处理
支持主流格式如.srt、.ssa/.ass、.stl、.ttml、.vtt（WebVTT）、teletext等，提供时间轴调整、分段/合并、格式转换等实用功能。格式支持： • 输入/输出格式：SRT、SSA/ASS、STL、TTML、WebVTT、Teletext。 • 支持跨格式转换（如 SRT 转 TTML）。 2. s2.ttml -o merged.srt 安装通过 Go Modules 安装： go get github.com/asticode/go-astisub 使用示例场景：将 SRT 字幕转换为 WebVTT = nil { panic(err) } // 调整时间：整体延迟 2 秒 subs.Add(time.Second * 2) // 保存为 WebVTT
18310编辑于 2026-03-18
来自专栏Michael阿明学习之路
使用edge-tts将文字转成语音
submaker.create_sub((chunk["offset"], chunk["duration"]), chunk["text"]) with open(WEBVTT_FILE VOICE = "zh-CN-YunyangNeural" # ShortName OUTPUT_FILE = "test1.mp3" WEBVTT_FILE = "test.vtt"
3.9K00编辑于 2024-05-24
来自专栏全栈程序员必看
走进音视频的世界——Matroska封装格式的介绍(二)「建议收藏」
S_TEXT / WEBVTT 编解码器ID：S_TEXT / WEBVTT 编解码器名称：Web视频文本轨道格式（WebVTT）描述：高级文本字幕。 WebVTT “ Web视频文本轨道格式”（简称：WebVTT）由万维网联盟（W3C）开发。其规格可免费获得。在Matroska中存储WebVTT的指导原则是：一致性：以与其他字幕编解码器类似的方式存储数据简单性：使现有基础架构的解码和重新混合尽可能容易完整性：从原始WebVTT文件中保留尽可能多的数据存储WebVTT CodecID：编解码器标识要使用的CodecID为S_TEXT/WEBVTT。 CodecPrivate：全局WebVTT块的存储该元素包含第一个字幕条目之前的所有全局块。它从“ WEBVTT”文件标识标记开始，但不包括可选的字节顺序标记。
2.2K10编辑于 2022-11-04
什么是字幕、有哪些格式？
vtt 格式VTT 文件是一个文本文件，其中包含使用 Web 视频文本轨道 (WebVTT) 格式显示定时文本轨道（例如字幕或字幕）的信息。定时文本轨道包括诸如字幕或字幕之类的信息。基于 WebVTT 的文本文件使用 UTF-8 编码。 VTT 文件包含诸如字幕、描述、标题、描述、章节和元数据等信息。 WEBVTT Kind: captions Language: en 00:09.000 --> 00:11.000 We are in New York City 00:11.000 --> 00 视频文字稿视频文件格式 WebVTT（维基百科）
71710编辑于 2026-03-18
来自专栏媒矿工厂
WWDC2023 | 如何为visionOS准备和提供视频内容
与视频和音频编码类似，应该生产HLS支持的字幕文件和格式，最常见的是WebVTT。媒体的打包打包是将源媒体转换为各种类型的段以进行可靠交付的过程。对于目标段持续时间，源 WebVTT 文件可以拆分为任意数量的 WebVTT 文件。 2D媒体的生产与交付 2D媒体的生产和交付流程包括编码、打包，以及通过HTTP进行交付。
68310编辑于 2024-02-29
来自专栏javascript学习笔记
CSS伪元素的基本使用
color: red } .item::after { content: '*'; color: red } 二、::before 略三、::cue 匹配所选元素中的WebVTT
1.8K00编辑于 2022-03-04
来自专栏AgenticAI
肝了4天，我用ChatTTS和LLM让deeplearning.ai课程说上流畅中文
字幕文件是WEBVTT（Web Video Text Tracks）格式，常用于web前端加载。 WEBVTT格式： WEBVTT 1 00:00:02.080 --> 00:00:05.660 Retrieval Augmented Generation, or RAG, has become a 1 00:00:02,080 --> 00:00:05,660 Retrieval Augmented Generation, or RAG, has become a key 使用FFmpeg将WEBVTT 字幕文件转换为SRT文件： ffmpeg -i subtitle.vtt subtitle.srt 但是我发现转换后第一行字幕被移除了，这是因为VTT文件的第一行包含"WEBVTT"，被识别为非字幕块我们仍然需要字节写代码移除第一行WEBVTT。
2K10编辑于 2025-03-18
来自专栏媒矿工厂
纵观OTT服务中的视频工程
有两种流行的标准来表示这些字幕——SRT 和 WebVTT。字幕和隐藏式字幕(Closed Captions)之间有非常细微的区别。在“打包”阶段，对 WebVTT 的引用被添加到 HLS 和 DASH 清单文件中。每一项技术，无论它看起来多么简单--如果你以正确的方式采用它，就有机会实现差异化。
1.2K30发布于 2021-07-06
来自专栏媒矿工厂
Demuxed 2019 演讲视频选（十三）
a93e34d3dab9dad31fed2bd8611b5d78&dis_t=1578993604 第二场演讲的演讲者是来自Seven West Media Australia的Jeremy Brown，演讲主题是”WebVTT
65510发布于 2020-01-14
直播实时字幕的端到端延迟之谜：从流媒体到 AI 的秒级链路拆解
8.3 多端一致性移动端、Web 端、TV 端需统一字幕协议（WebVTT 最常用）。推荐格式： WEBVTT 00:01:23.000 --> 00:01:25.500 各位观众大家好，欢迎来到今天的直播九、三档架构参考 9.1 稳健型（< 5 秒 G2G） LL-HLS（2s 片
13410编辑于 2026-05-29
来自专栏嵌入式音视频
【Airplay】WWDC学习_苹果开发者大会
我们推荐第二种方式但你可以使用两者最后我们讲下其他要求如果你要使用HDR内容最好的方式是提供多种格式类型比如Dolby Vision和HDR 10 因为TV可能只支持其中一种格式使用WebVTT 添加字幕所有网络内容我们都推荐都使用MIME格式下面我们来讲下具体细节我们使用MIME格式发送HLS播放列表很长时间了关于视频和音频的 MIME格式推荐可能是你想要了解的请留意对于WebVTT 我们使用text/plain 尽管WebVTT文档推荐text/VTT格式然而text VTT格式并不是由IANA注册也可能不被一些客户端兼容所以要使用text/plain格式下面是一些不太常用的
1.3K10编辑于 2023-04-07
来自专栏媒矿工厂
进度条滑动预览的四种方式
后来，开发者发现，用于字幕传输的WebVTT非常适合该项任务，而由于此前使用的Sprite API和VTT有许多相似之处，开发者很快实现了使用VTT Playlist。
2.3K20发布于 2021-03-25
来自专栏媒矿工厂
演进中视频流媒体容器格式与传输协议
一直以来，Apple使用基于文本的Web视频文本轨道（WebVTT）标准在HLS中隐藏字幕（Figure4），并可能继续使用它。 ? 图4 DASH可以使用WebVTT，但也使用称为Timed Text Markup Language Profiles for Internet Media Subtitles and Captions 因此，CMAF支持WebVTT和IMSC-1格式。 ? 图5 对于DRM，CMAF支持通用加密（CENC，Common Encryption），它可以将多个DRM合并到一个包中。
4.2K30发布于 2018-07-26
生成式引擎优化（GEO）避坑指南：从认知到实践的全面纠偏
技术原理：豆包等平台对短视频的引用权重高于纯文本，其视觉解析系统可识别WebVTT格式的字幕时间轴与文本对应关系。避坑方案：视频优化：添加字幕、章节标记、关键帧描述，使用WebVTT格式标注时间轴。
1.9K10编辑于 2025-09-01
来自专栏刘悦的技术博客
口播神器,基于Edge,微软TTS(text-to-speech)文字转语音免费开源库edge-tts语音合成实践(Python3.10)
Downloads edge-tts --voice zh-CN-XiaoyiNeural --text "你好啊，我是智能语音助手" --write-media hello_in_cn.mp3 WEBVTT import asyncio import edge_tts TEXT = "这里是语音流测试" VOICE = "zh-CN-XiaoyiNeural" OUTPUT_FILE = "test.mp3" WEBVTT_FILE submaker.create_sub((chunk["offset"], chunk["duration"]), chunk["text"]) with open(WEBVTT_FILE
6.4K20编辑于 2023-03-09
来自专栏前端食堂
2020年你不应该错过的CSS新特性
: The Web Video Text Tracks Format(https://w3c.github.io/webvtt/#the-cue-pseudo-element) 模块中的。具体的作用： ::cue伪元素（不带参数）匹配元素构造的任何WebVTT节点对象列表，但与背景符号对应的属性必须应用于WebVTT线索背景框，而不是WebVTT节点对象列表 ::cue(selector ::cue { color: white; background-color: hsl(0 0% 0% / 90%); } 说实话，没有完全阅读 WebVTT: The Web Video Text Tracks Format(https://w3c.github.io/webvtt) 模块所有内容，对其并不完全了解。这里只是做一个抛砖引玉的作用，如果你的工作内容和WebVTT相关，那应该对你会有一定的作用；如果你对这方面感兴趣的话，可以深挖这方面的知识。
1.5K41发布于 2020-11-02
【GEO优化助手】GEO优化实践中有哪些关键的技术难点需要重点培养
技术原理：豆包等平台对短视频的引用权重高于纯文本，其视觉解析系统可识别WebVTT格式的字幕时间轴与文本对应关系。优化要点：字幕与时间轴：为视频添加WebVTT格式字幕，标注关键节点（如“02:15 实测降噪效果”）。语义标签：使用YOLOv8模型进行物体检测，标注“120Hz刷新率”“OLED屏幕”等技术参数。
95410编辑于 2025-09-03
来自专栏Gnep's_Technology_Blog
HLS直播协议详解
HLS 中，索引文件可以嵌套，一般只有一级索引和二级索引；媒体流封分片装格式只支持 MPEG-2 传输流（ts）、WebVTT[WebVTT]文件或 Packed Audio 文件。 EXT-X-MAP：表示 Media Segment 的头部信息，比如 PAT/PMT 或者 WebVTT 头。
3.6K10编辑于 2023-10-29
来自专栏DotNet NB && CloudNative
多模态RAG应用之实现文本检索视频内容
v=33bZIOLX4do 大家自行下载视频到本地，有很多在线下载工具的，如：https://yt1d.com/en12/ 先提取视频字幕 captions.vtt WEBVTT 00:00:00.120 # load video using cv2 video = cv2.VideoCapture(path_to_video) # load transcript using webvtt trans = webvtt.read(path_to_transcript) # iterate transcript file # for each video
91610编辑于 2025-01-07

第 2 页

零代码编程：用ChatGPT将vtt转换成LRC和srt格式的字幕

每日一库：go-astisub —— 专注于多格式字幕文件的处理

使用edge-tts将文字转成语音

走进音视频的世界——Matroska封装格式的介绍(二)「建议收藏」

什么是字幕、有哪些格式？

WWDC2023 | 如何为visionOS准备和提供视频内容

CSS伪元素的基本使用

肝了4天，我用ChatTTS和LLM让deeplearning.ai课程说上流畅中文

纵观OTT服务中的视频工程

Demuxed 2019 演讲视频选（十三）

直播实时字幕的端到端延迟之谜：从流媒体到 AI 的秒级链路拆解

【Airplay】WWDC学习_苹果开发者大会

进度条滑动预览的四种方式

演进中视频流媒体容器格式与传输协议

生成式引擎优化（GEO）避坑指南：从认知到实践的全面纠偏

口播神器,基于Edge,微软TTS(text-to-speech)文字转语音免费开源库edge-tts语音合成实践(Python3.10)

2020年你不应该错过的CSS新特性

【GEO优化助手】GEO优化实践中有哪些关键的技术难点需要重点培养

HLS直播协议详解

多模态RAG应用之实现文本检索视频内容

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

零代码编程：用ChatGPT将vtt转换成LRC和srt格式的字幕

每日一库：go-astisub —— 专注于​​多格式字幕文件的处理

使用edge-tts将文字转成语音

走进音视频的世界——Matroska封装格式的介绍(二)「建议收藏」

什么是字幕、有哪些格式？

WWDC2023 | 如何为visionOS准备和提供视频内容

CSS伪元素的基本使用

肝了4天，我用ChatTTS和LLM让deeplearning.ai课程说上流畅中文

纵观OTT服务中的视频工程

Demuxed 2019 演讲视频选（十三）

直播实时字幕的端到端延迟之谜：从流媒体到 AI 的秒级链路拆解

【Airplay】WWDC学习_苹果开发者大会

进度条滑动预览的四种方式

演进中视频流媒体容器格式与传输协议

生成式引擎优化（GEO）避坑指南：从认知到实践的全面纠偏

口播神器,基于Edge,微软TTS(text-to-speech)文字转语音免费开源库edge-tts语音合成实践(Python3.10)

2020年你不应该错过的CSS新特性

【GEO优化助手】GEO优化实践中有哪些关键的技术难点需要重点培养

HLS直播协议详解

多模态RAG应用之实现文本检索视频内容

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

每日一库：go-astisub —— 专注于多格式字幕文件的处理