云上资源共享站

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 41|回复: 0

使用 Whisper、React 和 Node 构建语音转文本 Web 应用程序

[复制链接]

1

主题

0

回帖

23

积分

新手上路

Rank: 1

积分
23
发表于 2024-1-9 19:04:43 | 显示全部楼层 |阅读模式
在本文中,我们将使用 OpenAI 的 Whisper 以及 React、Node.js 和 FFmpeg 构建一个语音转文本应用程序。该应用程序将获取用户输入,使用 OpenAI 的 Whisper API 将其合成为语音,并输出结果文本。Whisper 提供了我用过的最准确的语音到文本转录,即使对于非英语母语人士也是如此。 Play Next Unmute Current Time 0:11 / Duration 2:00 Fullscreen Backward Skip 10s Play Video Forward Skip 10s 目录 耳语介绍 OpenAI解释说,Whisper 是一种自动语音识别 (ASR) 系统,经过 680,000 小时从网络收集的多语言和多任务监督数据的训练。 文本比音频更容易搜索和存储。然而,将音频转录为文本可能非常费力。


像 Whisper 这样的 ASR 可以检测语音,并非常快速地将音频转录为文本,非常准确,这使其成为一种特别有用的工具。 先决条件 本文面向熟悉 JavaScript 并且对 React 和 Express 有基本了解的开发人员。 如果您想一起构建,则需要 API 密 印度手机号码列表 钥。您可以通过在 OpenAI 平台上注册帐户来获取。获得 API 密钥后,请确保其安全并且不要公开共享。 技术堆栈 我们将使用 Create React App (CRA) 构建此应用程序的前端。我们在前端要做的就是上传文件、选择时间边界、发出网络请求和管理一些状态。为了简单起见,我选择了 CRA。随意使用您喜欢的任何前端库,甚至是普通的旧 JS。代码应该大部分是可转移的。



对于后端,我们将使用 Node.js 和 Express,这样我们就可以坚持使用此应用程序的完整 JS 堆栈。您可以使用 Fastify 或任何其他替代方案来代替 Express,并且您仍然应该能够遵循。 注意:为了使本文重点关注主题,将链接到长代码块,以便我们可以专注于手头的实际任务。 设置项目 我们首先创建一个新文件夹,其中包含用于组织目的的项目的前端和后端。请随意选择您喜欢的任何其他结构 接下来,我们使用以下命令初始化一个新的 React 应用程序create-react-app: npx create-react-app frontend 导航到新frontend文件夹并安装以使用以下代码axios发出网络请求和文件上传 现在,让我们切换回主文件夹并创建backend文件夹 接下来,我们在目录中初始化一个新的 Node 应用程序backend。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|软件大全,热门软件,SEO ( 晋ICP备19004676号 )

GMT+8, 2024-5-20 02:37 , Processed in 1.054143 second(s), 20 queries .

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表