积累,沉淀,吸收,转换
– Marshall Liu
ASR任务初体验
这篇继续是开发日志,正在开发一款iOS端的实时双语字幕APP,由于需要用到语音识别,了解了下语音识别任务的现状和主流方案,为后面方案选择做准备。 ...
关于AICoding的一些感想和后续的规划
最近要说最热最火的话题,那一定是 AI,而其中 AI 应用场景 AI Coding 也是发展迅速,大有替代程序员的势头。最近几个月一直在使用 AI Coding,心态上经历了最初的「完了,失业要提前了」,到「稳了,还能苟几年」。下面就分享一些使用上的感受,以及面对 AI Coding 这股后浪,这个号后面的一些规划。 ...
iOS音频捕获
这篇是iOS双语字幕软件的开发日志,目标是在iOS端实现,在观看视频时,实时对播放的内容进行识别和翻译,显示双语字幕,用于打破外语视频内容观看门槛。 ...
使用ORT进行语音降噪模型推理
在深度学习语音降噪模型的部署过程中,选择合适的推理引擎至关重要。ONNX Runtime(ORT)作为微软开源的跨平台推理引擎,在性能、兼容性和易用性方面表现出色,已成为许多生产环境的首选。本文将介绍为什么选择ORT,ORT的核心概念和使用流程,以及在使用ORT进行语音降噪推理时需要注意的关键事项,特别是针对时序模型(如GRU/LSTM)的隐状态管理。 ...
语音增强算法评估指南
语音增强算法评估指南 如今语音增强算法已成为智能设备、视频会议和助听器等应用的核心,它能从嘈杂环境中“拯救”清晰的语音信号,但如何判断一个算法的好坏?这就是评估的意义所在。今天,我们来聊聊语音增强算法的评估体系,通过一个国际挑战赛作为切入点,带你一步步了解关键指标和计算方法。无论你是初学者还是从业者,这篇文章都能帮你理清思路。 ...