项目简介
声笔(Vocal Write)是一款面向“口语 → 书面”的轻量小工具,专注把口语化的语音快速转换为通顺流畅的文本。定位为快速、准确、易粘贴,不是通用写作助手应用。
主要功能
- 实时语音识别:支持中英文语音实时转换为文字
- 口语书面化转换:自动断句、规范标点,将口语表达转为更书面的表述
- 轻量文本润色:在不改变原意的前提下做通顺处理
- 快捷粘贴:一键复制/粘贴到目标应用,减少操作步骤
- API 集成:支持腾讯云实时语音 API 和硅基流动大语言模型 API
技术栈
- 前端:Next.js + React + TypeScript
- 语音识别:腾讯云实时语音 API
- 文本润色:硅基流动大语言模型 API
- 桌面应用:Electron
- 部署:Docker + Vercel
项目亮点
- 轻量开箱即用:聚焦“口语 → 通顺文本”,零学习成本
- 低延迟识别:基于腾讯云 API 的流式识别,响应迅速
- 保留原意的通顺化:不做大幅改写,仅做顺句成章
- 一键复制粘贴:快速将结果用于目标应用,提高效率
项目链接
开发心得
在实现过程中,我重点解决了“口语化表达如何快速转成通顺文本”的实际痛点:通过腾讯云的实时语音识别获取高准确率的转写结果,再结合硅基流动的模型做轻量通顺处理,既保留说话者原意,又显著提升可读性。
技术上采用 Next.js + TypeScript 构建简洁的前端与服务能力,Electron 将 Web 应用打包为桌面端,便于常态化使用与快捷粘贴场景。
接下来会继续提升通顺度与准确率、优化响应延迟,补充更便捷的复制/粘贴与快捷键支持,并探索离线识别能力,同时始终保持“小工具”定位。