基于 FunASR 和 Qwen2 构建的音视频转结构化笔记系统 能够快速提取音视频的内容,并且调用大模型进行整理,成为一份结构化的markdown笔记,方便快速阅读
一个用于将 Bilibili 视频转换为文本的工具。 这个项目通过一个简单的流程实现:下载视频、提取音频、分割音频,并使用 whisper 模型将语音转换为文本。 整个过程是自动的,只需输入 Bilibili 视频的 av 号即可。整个过程行云流水,一步到位。
一个免费的AI视频字幕生成器,可以为视频添加准确、可定制的字幕,支持99种不同的语言,无水印或费用。
Relayed是一款人工智能驱动的视频会议工具,旨在帮助团队克服远程工作、繁忙的日程安排和会议疲劳。它具有灵活的视频会议,异步对话,自动摘要,通过秘密链接和限制访问轻松共享,...
AI驱动的音频 增强语音通过消...
Speech Studio是一套用于构建和集成Azure认知服务语音服务功能到应用程序中的工具。它为创建项目提供了一种无需代码的方法,可以访问诸如实时语音到文本、自定义语音识别模型、发...
Otter.ai是一个自动的会议记录和笔记工具,帮助团队充分利用他们的会议。它可以加入Zoom、Microsoft Teams或谷歌Meet会议,以记录和分享笔记,突出关键要点,并直接将会议幻灯片添...
Nuance是一家语音识别、自然...
TTS语音向导是一种工具,允许用户通过微软Azure语音识别和TTS将语音转换为文本,然后再转换回语音。它还向VRChat发送OSC消息以在头像上显示文本。该工具有许多自定义选项,包括100...
FineVoice是一种人工智能数字语音解决方案,可以帮助用户增强声音,并实时改变声音。它配有实时变声器,无限的音频和声音效果,录音室质量的录音机,文本到语音,语音到文本。