搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏python前行者
whisper(音转文)使用教程
github：https://github.com/openai/whisper https://gitcode.com/gh_mirrors/whisp/whisper/overview https ://github.com/jhj0517/Whisper-WebUI 安装Whisper pip install -U openai-whisper 此外你还需要安装ffmpeg。下载模型： Whisper提供了多种大小的模型，您可以根据需要下载。 /large-v3.pt", } 使用Whisper进行语音识别 import whisper # 加载模型 model = whisper.load_model("large-v2") # 转录音频文件 Whisper 是一个基于 CTranslate2 的 OpenAI Whisper 模型的重新实现。
2.3K11编辑于 2024-11-24
来自专栏信数据得永生
Whisper 整体架构图
Whisper Whisper 整体模型。
1.1K20编辑于 2023-10-23
来自专栏CSDN博客
微调Whisper模型和加速推理
openai/whisper-tiny openai/whisper-base openai/whisper-small openai/whisper-medium openai/whisper-large openai/whisper-large-v2 源码地址：Whisper-Finetune 使用环境： Anaconda 3 Python 3.8 Pytorch 1.12.1 Ubuntu 18.04 merge_lora.py：合并Whisper和Lora的模型。 evaluation.py：评估使用微调后的模型或者Whisper原模型。 Whisper是支持有标点符号的，所以训练的数据集中可以带有标点符号。如下命令，--model参数指定的是合并后的模型路径，同时也支持直接使用Whisper原模型，例如直接指定openai/whisper-large-v2。
3.1K30编辑于 2023-04-30
来自专栏华仔的技术笔记
Swarm和Whisper是什么鬼？
以太坊的智能合约smart contract实现了分布式逻辑，以太坊的Swarm实现了分布式存储，以太坊的Whisper实现了分布式消息，Whisper将实现智能合约间的消息互通，届时可以实现功能更加复杂的 whisper whisper是一种信息检索协议，它允许节点间直接以一种安全的形式互发信息，并对第三方组织窥探者隐藏发送者和接收者的信息。这是不依赖于一个中心服务器的通讯管理。你可能没怎么听到过 Whisper，不过它也是在以太坊生态系统中一项有趣的技术。它是 Dapps 之间交互的通信协议。你可以在这里看到关于它的更多内容: https://github.com/ethereum/wiki/wiki/Whisper
2.9K30发布于 2018-07-04
来自专栏崔哥的专栏
openai whisper 语音识别，语音翻译
安装 apt install ffmpeg pip install -U openai-whisper 使用指令 whisper video.mp4 whisper audio.flac audio.mp3 audio.wav --model medium whisper japanese.wav --language Japanese whisper chinese.mp4 --language Chinese --task translate whisper --help 代码中使用，以下是Python示例 import whisper model = whisper.load_model("base") ，如果前端要使用得通过接口，Whisper ASR Webservice帮我们提供了这样的接口，目前提供两个接口，一个音频语言识别和音频转文字（支持翻译和转录） Whisper ASR Webservice 除了支持Whisper，还支持faster-whisper；faster-whisper据说能够实现比 Whisper更快的转录功能，同时显存占用也比较小。
5.4K11编辑于 2024-03-08
Whisper 语音转文字免费软件！Whisper v0.2 超详细下载安装教程
Whisper v0.2 这款 Whisper 系列的语音转文字免费软件，本地能用、CPU 也能跑，下面按清单一步步来，保证你半小时内搞定从安装到转文字的全流程。 ✅ 完全免费，没任何套路作为 Whisper 家族的语音转文字免费软件，Whisper v0.2 不用注册账号，不用看广告攒积分，下载后双击就能用，不存在 “免费试用后收费” 的坑。二、Whisper v0.2 安装清单（3 步完成，不用懂技术）第 1 步：下载 Whisper 安装包1.下载Whisper语音转文字工具软件：https://pan.quark.cn/s/cfe4c423c6842 第 2 步：解压 Whisper 安装包1.回到桌面，找到刚下的 Whisper 压缩包；2.右键点击压缩包，选 “解压到当前文件夹”（不用改路径，自动生成带 Whisper 图标的文件夹）；3.打开文件夹，找到后缀 “.exe” 的 Whisper 主程序（图标有 Whisper 字样，很好认）。
3.1K01编辑于 2025-09-04
来自专栏AI进修生
最佳语音识别 Whisper-large-v3-turbo 上线，速度更快（本地安装 + Whisper-web）
刚刚，Openai whisper-large-v3-turbo 上线了 ... 在本文中，我们将介绍 whisper-large-v3-turbo 以及 whisper-web（一个直接在浏览器中进行ML语音识别的开源项目）。尽管近年来出现了许多音频和多模态模型，但Whisper 仍是生产级自动语音识别（ASR）的首选。与其前身 Whisper 大型版本 3 相比，Turbo 版在解码层数上从 32 降至 4，运行速度更快，尽管质量略有下降，但差别非常小。 whisper-large-v3-turbo [3] https://www.youtube.com/watch?
10.3K11编辑于 2024-12-02
来自专栏小轻论坛
高效音频转文本工具Whisper
大家好，我是站长可乐，今天给大家推荐的是音频转文本工具——Whisper，Whisper是由OpenAI开发的一个自动语音识别(ASR)开源系统。 OpenAI的技术文档介绍了如何基于Whisper模型调用语言转文本API来实现语言转写或将语言翻译成英文的功能。 Speech-to-text API 介绍文档 https://platform.openai.com/docs/guides/speech-to-text 这里我们先在下载好Whisper模型（下载地址请见文末下载地址给大家准备了下载地址和模型下载地址，关注本站公众号【小轻论坛】回复关键词“ Whisper ”即可获取下载。
1.5K10编辑于 2024-09-30
来自专栏CSDN博客
微调Whisper语音识别模型和加速推理
openai/whisper-tinyopenai/whisper-baseopenai/whisper-smallopenai/whisper-mediumopenai/whisper-largeopenai /whisper-large-v2源码地址：Whisper-Finetune使用环境：Anaconda 3Python 3.8Pytorch 1.13.1Ubuntu 18.04GPU A100-PCIE merge_lora.py：合并Whisper和Lora的模型。evaluation.py：评估使用微调后的模型或者Whisper原模型。第二个--model_path指定的是合并后的模型路径，同时也支持直接使用Whisper原模型，例如直接指定openai/whisper-large-v2。其他更多的参数请查看这个程序。如下命令，--model参数指定的是合并后的模型路径，同时也支持直接使用Whisper原模型，例如直接指定openai/whisper-large-v2。
5.3K20编辑于 2023-06-04
来自专栏数据库与编程
带小朋友体验语音识别大模型：Whisper
三、安装 Whisper !pip install requests beautifulsoup4 ! pip install git+https://github.com/openai/whisper.git import torch import sys device = torch.device from IPython.display import Markdown whisper_model = whisper.load_model(Model) if Model in whisper.available_models Whisper 语音模型非常准确的识别出了我们的语音内容。 Whisper是一种基于深度学习的语音识别模型，它是一种通用的语音识别模型，可以用于语音识别、语音翻译和语言识别等任务。它是通过收集来自多个数据源的多语言、多任务的数据进行训练的。
2.2K31编辑于 2023-09-01
基于faster whisper实时语音识别语音转文本
语音识别转文本相信很多人都用过，不管是手机自带，还是腾讯视频都附带有此功能，今天简单说下： faster whisper地址： https://github.com/SYSTRAN/faster-whisper target=https%3A//github.com/SYSTRAN/faster-whisper 实现功能：从麦克风获取声音进行实时语音识别转文本代码仅仅用了40多行即可实现实时语音转文本功能 fwm.start() while True: time.sleep(0.2) 视频演示地址： https://www.bilibili.com/video/BV1fQ4y1j7wb/ 模块： fast_whisper
89310编辑于 2025-12-16
来自专栏Dotnet Dancer
【.NET】使用Whisper.net实现录音转文本
废话不多说，直接上手，以下正文： 1、新建一个控制台项目，引用CommandLineParser和Whisper.net 2、新建Options实体类，用于提供使用模型的一些参数 public class 在线模型文件参考：模型地址： https://huggingface.co/sandrohanea/whisper.net/tree/main/classic 4、验证模型文件不存在，则下载 if ( language); } processor.DetectLanguage(samples, speedUp: true) 的speedUp说明：当speedUp为true时，使用whisper_pcm_to_mel_phase_vocoder_with_state 当speedUp为false时，使用whisper_pcm_to_mel_with_state方法进行处理。这个方法可能是一个更传统或基本的方法来从PCM数据转换到Mel频谱。
1.1K10编辑于 2024-08-13
基于faster whisper实时语音识别语音转文本
介绍： Faster-Whisper是一个基于OpenAI的Whisper模型的高效实现。它利用CTranslate2，一个专为Transformer模型设计的快速推理引擎，优化了内存使用效率。同时，Faster-Whisper还改进了原始的Whisper模型结构，包括减少模型的层数、减少参数量、简化模型结构等，从而减少了计算量和内存消耗，提高了推理速度。此外，Faster-Whisper还改进了推理算法、优化计算过程、减少冗余计算等，以提高模型的运行效率。 Faster-Whisper项目包括一个web网页版本和一个命令行版本，同时项目内部已经整合了VAD算法。 faster whisper地址： https://github.com/SYSTRAN/faster-whisper 实现功能：从麦克风获取声音进行实时语音识别转文本代码仅仅用了40多行即可实现实时语音转文本功能
2K11编辑于 2025-07-20
来自专栏分享学习
语音转字幕：Whisper模型的功能和使用
功能：多语言支持：Whisper模型支持99种不同语言的转录，这意味着无论音频是用哪种语言录制的，模型都能够将其识别并转录为文本。语音翻译：除了多语言转录外，Whisper模型还能够将识别的文本从原始语言翻译为英语。这使得它成为一个强大的跨语言交流工具。鲁棒性：Whisper模型对于口音、背景噪音和技术语言具有很好的鲁棒性，这意味着在各种不同的环境和条件下，模型都能够保持较高的识别准确率。模型架构：Whisper模型采用了一种简单的端到端方法，利用Transformer模型的编码器-解码器结构。效果与应用场景：Whisper模型的效果比市面上很多音频转文字的工具都要好，可以广泛应用于语音助手、语音识别和语音翻译等场景。
6K00编辑于 2024-05-25
来自专栏AI SPPECH
32_语音到文本：Whisper与LLM集成_深度解析
第1章：Whisper语音识别技术概述 1.1 Whisper模型简介与发展历程 OpenAI的Whisper作为一款开源的语音识别系统，在过去几年中经历了显著的演进。 1.3 Whisper与其他语音识别系统的对比在2025年的语音识别技术格局中，Whisper凭借其开源特性和技术优势占据了重要地位。与其他主流语音识别系统相比，Whisper具有以下独特优势：特性 Whisper (2025) 商业ASR服务开源竞品准确率标准场景98.7% 97-99% 95-97% 语言支持 100+语言第3章：Whisper与LLM集成的技术架构 3.1 集成架构设计原则 Whisper与LLM的集成需要遵循一系列关键设计原则，以确保系统的稳定性、性能和用户体验：模块化设计：将音频处理、语音识别、第5章：2025年Whisper与LLM集成的最新进展 5.1 WhisperLiveKit：全栈语音处理解决方案 2025年最引人注目的Whisper与LLM集成项目之一是WhisperLiveKit
1K10编辑于 2025-11-13
来自专栏MixLab科技+设计实验室
#whisper-to-stable-diffusion
在处理口音、背景噪声以及技术术语方面，Whisper 几乎达到了人类的水准。那么将 Whisper 与 Stable Diffusion 结合，可以直接完成语音生成图像的任务。用户可以语音输入一个短句，Whisper 会自动将语音转化为文本，接着，Stable Diffusion 会根据文本生成图像。图片来源：huggingface 第二步：检查语言输出，必要时进行更正图片来源：huggingface 第三步：等待1~10秒，直到有稳定的扩散结果图片来源：huggingface 简单概况一下，Whisper 不如现在就试试看: https://huggingface.co/spaces/fffiloni/whisper-to-stable-diffusion
72110编辑于 2023-01-11
来自专栏安装教程
Whisper 语音转文字免费软件超详细下载安装教程！Whisper v0.2 安装使用一步到位
一、Whisper v0.2 是什么？为何备受青睐？1。模型选择指南：想了解 Whisper 的 medium、small、large 等模型区别，选择最适合自己需求的模型，那就搜 “Whisper v0.2 模型选择免费 Whisper 工具”，依据不同场景下的模型特点介绍搜索 “Whisper v0.2 语音转文字保存结果 Whisper 工具”，学习将识别后的文字保存为 TXT 文件的方法，便于后续编辑使用。三、Whisper v0.2 具体安装步骤有哪些？ Whisper下载与解压1。Whisper下载安装包链接：https://pan.quark.cn/s/a85606c21aa32。启动软件：打开解压后的 Whisper 文件夹，找到后缀为 “.exe” 的主程序文件，这就是 Whisper v0.2 的启动程序，其图标一般具有 Whisper 软件的独特标识。
2.3K00编辑于 2025-09-23
来自专栏后场技术
指标存储: 我们如何从Graphite + Whisper迁移到Graphite + ClickHouse
在这篇文章中，我将告诉您我们如何组织在高工作负载下的Graphite + Whisper到Graphite + ClickHouse的迁移，关于期望和迁移项目的结果。在我详细介绍如何组织从Graphite + Whisper中存储指标到Graphite + ClickHouse的迁移之前，我想向您提供一些背景信息，说明这个决定的原因以及我们必须提出的Whisper的缺点很长一段时间 Graphite + Whisper的问题 1、磁盘子系统高负载在迁移时，我们每分钟收到大约150万个指标。在该指标流程中，我们的服务器的磁盘利用率约为30％。 2、缺乏复制和一致性最有可能的是，像使用或使用Graphite + Whisper的每个人一样，我们将相同的度量标准流程路由到多个Graphite服务器以实现弹性。 •要切换读数负载，请将平衡器设置中的端点从graphite-api（Graphite + Whisper API）重新配置为carbonapi。
2K21发布于 2020-09-03
Insanely Fast Whisper：开源社区让音频转录速度提升19倍
一个名为Insanely Fast Whisper的工具，将OpenAI Whisper的转录速度提升了19倍。原本需要31分钟处理的2.5小时音频，现在仅需98秒就能完成。技术核心：Flash Attention 2带来的质变 Insanely Fast Whisper采用Flash Attention 2技术，在保持模型权重与标准Whisper完全相同的前提下，实现了零质量损失的速度飞跃这意味着用户可以获得与原始Whisper相同的准确度，但处理时间大幅缩短。性能对比（Nvidia A100 - 80GB）：标准Whisper large-v3：31分钟处理2.5小时音频优化后large-v3：1分38秒 Distil-Whisper large-v2：对于需要处理大量音频的用户来说，Insanely Fast Whisper很值得一看。地址：https://github.com/Vaibhavs10/insanely-fast-whisper
6410编辑于 2026-06-23
来自专栏张善友的专栏
OpenAI的离线音频转文本模型 Whisper 的.NET封装项目
whisper介绍 Open AI在2022年9月21日开源了号称其英文语音辨识能力已达到人类水准的Whisper神经网络，且它亦支持其它98种语言的自动语音辨识。当然，各大云平台都提供语音识别服务，但是基本都是联网运行，个人隐私安全总是有隐患，而whisper完全不同，whisper完全在本地运行，无需联网，充分保障了个人隐私，且whisper识别准确率相当高。语言模型文件：https://huggingface.co/ggerganov/whisper.cpp 或者 https://github.com/ggerganov/whisper.cpp ggml- 这么好的一个模型在.NET 社区有很多封装的项目: 跨平台 Whisper.net: https://github.com/sandrohanea/whisper.net Windows 平台的Whisper ：https://github.com/Const-me/Whisper 下面我们体验一下这个开箱即用的工具Whisper，从https://github.com/Const-me/Whisper 下周最新的版本
1.8K10编辑于 2023-04-28

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

whisper(音转文)使用教程

Whisper 整体架构图

微调Whisper模型和加速推理

Swarm和Whisper是什么鬼？

openai whisper 语音识别，语音翻译

Whisper 语音转文字免费软件！Whisper v0.2 超详细下载安装教程

最佳语音识别 Whisper-large-v3-turbo 上线，速度更快（本地安装 + Whisper-web）

高效音频转文本工具Whisper

微调Whisper语音识别模型和加速推理

带小朋友体验语音识别大模型：Whisper

基于faster whisper实时语音识别语音转文本

【.NET】使用Whisper.net实现录音转文本

基于faster whisper实时语音识别语音转文本

语音转字幕：Whisper模型的功能和使用

32_语音到文本：Whisper与LLM集成_深度解析

#whisper-to-stable-diffusion

Whisper 语音转文字免费软件超详细下载安装教程！Whisper v0.2 安装使用一步到位

指标存储: 我们如何从Graphite + Whisper迁移到Graphite + ClickHouse

Insanely Fast Whisper：开源社区让音频转录速度提升19倍

OpenAI的离线音频转文本模型 Whisper 的.NET封装项目

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐