当前位置:首页 > 网络资源 > 视频剪辑

Constme-Whisper(离线语音识别) v1.12

思钱想厚2026年03月22日 22:21:13视频剪辑270

Constme-Whisper是OpenAI的Whisper自动语音识别ASR模型的衍生项目。

Constme-Whisper可以在Windows上使用,支持高性能GPGPU处理,可以利用GPU加速处理。

本体是个启动器,需要结合一个语言识别模型文件(ggml-tiny、ggml-small、ggml-base、ggml-medium、ggml-large)使用,模型越大,效果越好,但相对的速度也更慢。

软件特点

  • 基于DirectCompute的与供应商无关的GPGPU;该技术的另一个名称是“Direct3D 11 中的计算着色器”

  • 纯C++实现,除了基本的操作系统组件外,没有运行时依赖关系

  • 比OpenAI的实现快得多。

  • 混合 F16 / F32 精度:Windows 需要自 D3D 版本 10.0 起支持缓冲区R16_FLOAT

  • 内置性能探查器,用于测量单个计算着色器的执行时间

  • 内存使用率低

  • 用于音频处理的媒体基础,支持大多数音频和视频格式(Ogg Vorbis除外), 以及大多数在Windows上运行的音频捕获设备(除了一些专业设备,它们只实现ASIO API)。

  • 用于音频捕获的语音活动检测。

  • 易于使用的 COM 样式 API,nuget 上提供的惯用 C# 包装器

  • 提供预构建的二进制文件

软件截图

Constme-Whisper(离线语音识别) v1.12

更新日志

更新了文档和 GUI 中的模型源 URL
可靠性增强,麦克风捕获不太可能转换到“停滞”状态并丢弃音频

下载地址

需要不低于Win8.1的64位Windows

文件main.exe为命令行调用工具

https://github.com/Const-me/Whisper/

已高速(如有密码:3519)http://ct.ghpym.com/d/7369060-54955802-f48a55

已高速https://www.123pan.cn/s/HQeA-fK4Sh.html

https://pan.quark.cn/s/22b64875ef15


分享给朋友:

相关文章

Apowersoft Video Converter Studio v4.8.3 修改版

Apowersoft Video Converter Studio v4.8.3 修改版

Apowersoft Video Converter Studio 是香港 Apowersoft 公司出品的一款强大的、全面的视频转换软件,为您提供的可能性,快速,方便地转换之间的各种视频档案格式与高速和优良品质的输出。界面简洁、易于操作、音质无损集视频播放、编辑、转换、下载、录屏于一体的一站式服务。软件特色音视频格式无差别转换:视频转换王支持超多音视频格式间的转换。您可以通过设置诸如帧速率、分辨率、比特率、采样率等参数来定制视频。不同的音视频格式…

CyberLink PowerDirector(威力导演)v18.0.2028.0 修改版

CyberLink PowerDirector(威力导演)v18.0.2028.0 修改版

威力导演 17是多媒体创作软件领导厂商讯连科技近日宣布推出新一代影音创作软件。看准YouTuber和影音部落客等内容创作者之庞大需求,威力导演17大幅进化,提供「巢状影片编辑」、「影片预剪」等多种全新功能,可大幅提升内容创作者之工作效率。对于这些需要频繁创作影片内容的专业用户而言,影音剪辑作业流畅度会大幅影响内容更新频率。全新威力导演18提供「影片预剪」和「巢状影片编辑」等便利工具。通过「影片预剪」,影音创作者可快速选取、剪辑与分层管理数十分钟的长…

Gilisoft Video Editor 视频编辑软件 v12.1 绿色版

Gilisoft Video Editor 视频编辑软件 v12.1 绿色版

GiliSoft Video Editor是一款简单好用且功能强大的视频编辑软件。使您可以编辑像流行的iPod、iPhone、PSP、PS3游戏机等格式,也可以编辑如:AVI、MPEG、H.264、SWF、MOV、WMV等各种格式的视频文件。功能特色1、强大的视频截取功能,帮您考虑最全面的使用场景。支持从一个长视频中截取多个小视频。支持批量截取多个视频。GiliSoft视频编辑器的批量切割机可以帮助你减少多个视频文件在批处理模式下同时进行。支持从一…

美图秀秀v6.5.2.5 去广告版

美图秀秀v6.5.2.5 去广告版

美图是多年的老牌PS软件了,虽然说比不上Photoshop,不过胜在简单,用的人也多。美图秀秀是2008年10月8日由厦门美图科技有限公司研发、推出的一款免费图片处理的软件,有iPhone版、Android版、PC版、Windows Phone版、iPad版及网页版 ,致力于为全球用户提供专业智能的拍照、修图服务 。美图秀秀的图片特效、美容、拼图、场景、边框、饰品等功能,可以1分钟做出影楼级照片,还能一键分享到新浪微博、人人网、QQ空间等。2018…

AI配音专家 v2.0.0

AI配音专家 v2.0.0

一款采用阿里语音合成引擎的配音软件,效果好,种类齐全。软件里面有免费的Key,多人同时转换可能会失败,可以自己去申请一个key1、UI界面更新(相较于AI配音专家v1)2、阿里语音类型从40多种到现在的80种3、背景音乐直接在本地解压设置一下就OK了,不用那么麻烦4、内置了一些不同场景的示例文本5、内置阿里的免费key,也可以自定义key6、不限制文本字数7、很多人喜欢微软引擎的,预留的位置,待开发软件作者@bawangxx软件截图使用说明一、申请…

智能识别 v3.0

智能识别 v3.0

一款工具箱软件,拥有语音合成、文字识别和翻译、以及图像处理等功能。语音合成:有上百种音色,多音字也能自己设置,只需要加上中括号和等于符号,在等于符号后面写上拼音和声调就可以了,比如这样:1[=yao1] 。软件也提供了加背景音乐的选项,可以在设置里面找到。可以识别图片里的文字,识别速度也挺快,它会根据图片中的段落来分行,图片上是什么样的格式,转出来文字就是怎么样的,标点符号也能正常识别。可以给黑白图上色,转换风格,动漫化,去雾以及增加清晰度等一系列…

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。