声笔 - Vocal Write | 阿犇的自留地

声笔 - Vocal Write

Jul 16, 2025

featured_image

项目简介

声笔（Vocal Write）是一款面向“口语 → 书面”的轻量小工具，专注把口语化的语音快速转换为通顺流畅的文本。定位为快速、准确、易粘贴，不是通用写作助手应用。

主要功能

实时语音识别：支持中英文语音实时转换为文字
口语书面化转换：自动断句、规范标点，将口语表达转为更书面的表述
轻量文本润色：在不改变原意的前提下做通顺处理
快捷粘贴：一键复制/粘贴到目标应用，减少操作步骤
API 集成：支持腾讯云实时语音 API 和硅基流动大语言模型 API

技术栈

前端：Next.js + React + TypeScript
语音识别：腾讯云实时语音 API
文本润色：硅基流动大语言模型 API
桌面应用：Electron
部署：Docker + Vercel

项目亮点

轻量开箱即用：聚焦“口语 → 通顺文本”，零学习成本
低延迟识别：基于腾讯云 API 的流式识别，响应迅速
保留原意的通顺化：不做大幅改写，仅做顺句成章
一键复制粘贴：快速将结果用于目标应用，提高效率

项目链接

开发心得

在实现过程中，我重点解决了“口语化表达如何快速转成通顺文本”的实际痛点：通过腾讯云的实时语音识别获取高准确率的转写结果，再结合硅基流动的模型做轻量通顺处理，既保留说话者原意，又显著提升可读性。

技术上采用 Next.js + TypeScript 构建简洁的前端与服务能力，Electron 将 Web 应用打包为桌面端，便于常态化使用与快捷粘贴场景。

接下来会继续提升通顺度与准确率、优化响应延迟，补充更便捷的复制/粘贴与快捷键支持，并探索离线识别能力，同时始终保持“小工具”定位。