使用 Whisper、React 和 Node 构建语音转文本 Web 应用程序

kazi02 · 发表于 2024-1-9 19:04:43

在本文中，我们将使用 OpenAI 的 Whisper 以及 React、Node.js 和 FFmpeg 构建一个语音转文本应用程序。该应用程序将获取用户输入，使用 OpenAI 的 Whisper API 将其合成为语音，并输出结果文本。Whisper 提供了我用过的最准确的语音到文本转录，即使对于非英语母语人士也是如此。 Play Next Unmute Current Time 0:11 / Duration 2:00 Fullscreen Backward Skip 10s Play Video Forward Skip 10s 目录耳语介绍 OpenAI解释说，Whisper 是一种自动语音识别 (ASR) 系统，经过 680,000 小时从网络收集的多语言和多任务监督数据的训练。文本比音频更容易搜索和存储。然而，将音频转录为文本可能非常费力。

像 Whisper 这样的 ASR 可以检测语音，并非常快速地将音频转录为文本，非常准确，这使其成为一种特别有用的工具。先决条件本文面向熟悉 JavaScript 并且对 React 和 Express 有基本了解的开发人员。如果您想一起构建，则需要 API 密印度手机号码列表钥。您可以通过在 OpenAI 平台上注册帐户来获取。获得 API 密钥后，请确保其安全并且不要公开共享。技术堆栈我们将使用 Create React App (CRA) 构建此应用程序的前端。我们在前端要做的就是上传文件、选择时间边界、发出网络请求和管理一些状态。为了简单起见，我选择了 CRA。随意使用您喜欢的任何前端库，甚至是普通的旧 JS。代码应该大部分是可转移的。

对于后端，我们将使用 Node.js 和 Express，这样我们就可以坚持使用此应用程序的完整 JS 堆栈。您可以使用 Fastify 或任何其他替代方案来代替 Express，并且您仍然应该能够遵循。注意：为了使本文重点关注主题，将链接到长代码块，以便我们可以专注于手头的实际任务。设置项目我们首先创建一个新文件夹，其中包含用于组织目的的项目的前端和后端。请随意选择您喜欢的任何其他结构接下来，我们使用以下命令初始化一个新的 React 应用程序create-react-app： npx create-react-app frontend 导航到新frontend文件夹并安装以使用以下代码axios发出网络请求和文件上传现在，让我们切换回主文件夹并创建backend文件夹接下来，我们在目录中初始化一个新的 Node 应用程序backend。

		自动登录	找回密码
密码			立即注册

使用 Whisper、React 和 Node 构建语音转文本 Web 应用程序

浏览过的版块

客服中心

投诉建议