项目简介

声笔(Vocal Write)是一款面向“口语 → 书面”的轻量小工具,专注把口语化的语音快速转换为通顺流畅的文本。定位为快速、准确、易粘贴,不是通用写作助手应用。

主要功能

  • 实时语音识别:支持中英文语音实时转换为文字
  • 口语书面化转换:自动断句、规范标点,将口语表达转为更书面的表述
  • 轻量文本润色:在不改变原意的前提下做通顺处理
  • 快捷粘贴:一键复制/粘贴到目标应用,减少操作步骤
  • API 集成:支持腾讯云实时语音 API 和硅基流动大语言模型 API

技术栈

  • 前端:Next.js + React + TypeScript
  • 语音识别:腾讯云实时语音 API
  • 文本润色:硅基流动大语言模型 API
  • 桌面应用:Electron
  • 部署:Docker + Vercel

项目亮点

  1. 轻量开箱即用:聚焦“口语 → 通顺文本”,零学习成本
  2. 低延迟识别:基于腾讯云 API 的流式识别,响应迅速
  3. 保留原意的通顺化:不做大幅改写,仅做顺句成章
  4. 一键复制粘贴:快速将结果用于目标应用,提高效率

项目链接

开发心得

在实现过程中,我重点解决了“口语化表达如何快速转成通顺文本”的实际痛点:通过腾讯云的实时语音识别获取高准确率的转写结果,再结合硅基流动的模型做轻量通顺处理,既保留说话者原意,又显著提升可读性。

技术上采用 Next.js + TypeScript 构建简洁的前端与服务能力,Electron 将 Web 应用打包为桌面端,便于常态化使用与快捷粘贴场景。

接下来会继续提升通顺度与准确率、优化响应延迟,补充更便捷的复制/粘贴与快捷键支持,并探索离线识别能力,同时始终保持“小工具”定位。