一、产品市场
随着混合办公新常态的深化,企业对高效协作工具的需求激增,直接带动了智能会议设备的革新浪潮。当前,智能会议系统的全球市场已跨越百亿美元门槛,其发展焦点正从基础的音视频通信,转向集高保真录音、实时云端同步与智能数据管理于一体的融合性解决方案。

在实际会议场景中,挑战尤为具体:如何在开放式办公室或嘈杂环境中清晰剥离人声与背景噪声?怎样确保数小时的会议内容被完整、清晰地记录?以及如何让录音资料既能安全存储于设备本地,又能即时上传至云端供团队调取与分析?这些已成为提升会议效率的关键。
针对这些核心诉求,WT2605A芯片方案提供了专业级的应答。其出色的音频处理能力、长效的低功耗运行以及灵活的存储与连接扩展性,使其成为构建现代会议录音设备(如全向麦克风、会议音箱、录音笔)的理想核心。无论是企业日常例会、培训机构的教学留存,还是对可靠性要求极高的司法庭审记录,该方案都能提供稳定、清晰且易于管理的完整录音解决方案。
二、产品应用框图
基于外部MCU与WT2605A的UART协议交互架构,系统框图重构如下:

1)音频采集与处理链
输入级:支持麦克风输入,WT2605A-24SS通过ADC对麦克风信号进行采样、量化,并编码为数字音频数据。
处理单元:WT2605A独立完成ADC采样(16bit/44.1kHz)、环境噪声消除、MP3实时编码(CBR
128kbps),编码后数据流直接写入TF卡。
2)控制与通信链
指令交互:外部MCU通过UART发送标准指令控制WT2605A,包括录音启停、文件查询、数据块读取等操作。
数据传输:WT2605A响应MCU请求时,将TF卡中的音频文件以512字节/包的形式通过UART回传,数据流格式为[包头][长度][命令码][数据][CRC16]。
网络层:MCU接收数据包后,通过SPI接口连接网络???如ESP32-C3),封装为TCP/IP协议包上传至服务器,支持Base64编码或二进制直传。
3)电源与状态管理
供电设计:WT2605A与MCU采用独立LDO供电(3.3V/500mA),避免数字噪声干扰音频电路。
状态同步:MCU通过解析WT2605A的状态码(如0x01: 空闲、0x02: 录音中),驱动LED指示灯显示设备工作状态。
4)数据流详解
下行控制流:
MCU --UART指令 --> WT2605A(控制录音、读取操作)
上行控制流:
WT2605A --UART数据包 --> MCU --TCP/IP -->
云服务器
该架构实现硬件级解耦:WT2605A专注高精度音频处理,MCU负责协议转换与网络通信,二者通过标准化UART指令协同,降低系统耦合度与开发复杂度。
三、芯片介绍
WT2605Ax是一系列功能强大的高品质录音芯片,采用了高性能32位处理器、最高频率可达192MHz。具有低成本、低功耗、高可靠性、通用性强等特点,现有WT2605A8-24SS的封装芯片。带有地址播放、插播、单曲循环、所有曲目循环、随机播放、录音等功能,。32级音量可调、最大可以支持外挂128Mbit的Flash。
3.1产品特点
1)核心性能:
高性能32位处理器、最高频率可达192MHz。实时处理多路音频流。
WT2605A集成MP3/WAV编码器,支持8-48kHz采样率,比特率8-320kbps,录音音质达CD级。
音频输出方式默认为DAC输出,不可修改,硬件支持16bit DAC输出。
2)存储扩展:
WT2605A支持SPI-FLASH、TF卡、U盘三种存储介质,最大支持32GB容量,录音时长可达数百小时。
3)接口丰富:
WT2605A标准UART通信接口,默认波特率115200,支持通过串口命令设置波特率,便于与外部MCU通信。
4)低功耗优化:
WT2605A内置动态功耗调节机制,工作电流≤30mA,休眠模式下功耗低至uA级。
3.2芯片引脚描述

PIN-NO. | 名称 | 功能说明 |
1 | RX | UART_RX通信端口 |
2 | TX | UART_TX通信端口 |
3 | DAT/DM | 烧录脚/USB D- |
4 | CLK/DP | 烧录脚/USB D+ |
5 | P04 | BUSY输出脚 |
6 | P03 | IO口 |
7 | MICLDO | 麦克风电源,麦克风供电端 |
8 | MIC+ | 麦克风输入脚(+) |
9 | P00 | IO口 |
10 | DACVSS | DAC地 |
11 | VCM | 接一个105外部电容到地 |
12 | DAC | DAC音频输出 |
13 | P23/SDCLK/SPI_SO | SD卡时钟脚/Flash数据输出脚 |
14 | P22/SDCMD/SPI_CLK | SD卡片选脚/Flash时钟脚 |
15 | P20/SDDAT/SPI_CS | SD卡数据脚/Flash片选脚 |
16 | P21/SPI_SI | Flash数据输入脚 |
17 | VCC | 电源输入 |
18 | VOUT | 接106电容到地 |
19 | P17 | ADKEY |
20 | GND | GND |
21 | NG | NG |
22 | ANT | 蓝牙天线脚 |
23 | OSCI | 晶振OSCI |
24 | OSCO | 晶振OSCO |
四、功能介绍
1)指令化录音控制
精准操控:MCU通过UART指令直接控制录音启停,支持调节采样率、增益等级。
状态反?。篧T2605A实时返回硬件状态(如存储异常、低电量)。
2)文件存储与读取
无文件系统存储:录音文件按日期_时间.wav格式直接写入TF卡,规避FAT表风险。
指令驱动操作:MCU通过指令查询文件列表、分块读取数据(512字节/包),支持断点续传与安全擦除。
3)裸数据上传
协议精简:MCU将音频数据封装为自定义TCP帧(同步头+时间戳+数据+CRC),直传服务器。
自适应分片:根据网络质量动态切换数据块大小(512字节),确保传输稳定性。
4)低功耗与可靠性
二级休眠:工作模式(50mA)→深度休眠(2μA),按键唤醒。
核心优势:纯UART指令驱动,实现硬件级高可靠控制,适配低成本MCU开发,无软件依赖。
五、指令介绍
5.1协议命令格式
标准UART异步串口接口,属于3.3V
TTL电平接口。通讯数据格式是:起始位:1位;数据位:8位;奇偶位:无;停止位:1位。使用电脑串口调试助手,需要正确设置串口的参数,设置如图:
起始码 | 长度 | 命令码 | 参数 | 累加和校验 | 结束码 |
0X7E | 见下文 | 见下文 | 见下文 | 见下文 | 0XEF |
注意:“长度”是指长度+命令码+参数+校验和的长度,“累加和校验”是指长度+命令码+参数的累加和的低字节。
5.2协议指令
低功耗
参数为“00”时功耗小于2uA,指令唤醒时间为50ms以内。
注:芯片在RXD脚下降沿行唤醒,建议发送 0x00 0x00 进行唤醒。使用外挂Flash方案时,休眠功耗与外挂flash有关。
示例:发→◇7E 04 B8 00 BC EF □ (进入深度休眠)
设备剩余容量
查询当前设备剩余容量。
示例:发→◇7E 03 CE D1 EF □
收←◆7E 06 CE 01 E2 0E C5 EF (当前设备剩余容量123406kB)
录音品质
码率(BR)/采样率(SR)对应关系
采样率(SR) | 16000 | 32000 | 44100 | 48000 |
码率(BR) | 16kbps | / | / | / |
32kbps | 32kbps | 32kbps | 32kbps |
64kbps | 64kbps | 64kbps | 64kbps |
/ | 128kbps | 128kbps | 128kbps |
/ | / | 192kbps | 192kbps |
/ | / | 256kbps | 256kbps |
/ | / | 320kbps | 320kbps |
/ | / | 384kbps | 384kbps |
示例:发→◇7E 05 D4 01 01 DB EF □
表示录音采样率为32kHz,码率为32kbps
录音控制
示例:发→◇7E 05 D5 00 0A E4 EF □
收←◆7E 04 D5 00 D9 EF
文件管理
1)查询当前外设连接状态:
示例:发→◇7E 03 CA CD EF □
收←◆7E 04 CA 07 D5 EF (当前挂载盘符有U盘、TF卡、Flash)
0X07:无PC连接(BIT3=0),有U盘(BIT2=1),有TF卡(BIT1=1),有SPI-FLASH(BIT0=1)。
2)查询TF卡内音乐文件总数:
示例:发→◇7E 03 C5 C8 EF □
收←◆7E 05 C5 00 02 CC EF (TF卡内文件总数为2)
4)读取录音文件:
通过文件名读取文件数据,首先发送F4指令获取文件大小(3字节),再发送F3指令自动上传512 bytes数据,上传数据包含在7E 00 F3
...... XX EF中,其中......
为上传的一包数据,XX为累加和校验,是指0x00+0xF3+上传数据的累加和的低字节;上传数据期间需要每隔一段时间发送7E 03 F3 F6
EF,以保持上传数据的完整性,直至文件读取完毕。
示例:发→◇7E 0B F4 32 35 33 31 33 31 30 30 8E EF □(获取文件大小)
收←◆7E 06 F4 05 D8 40 17 EF(文件大小为383040 bytes)
发→◇7E 03 F3 F6 EF □(开始上传数据)
收←◆7E 00 F3 XX ...... XX EF(上传512 bytes数据)
发→◇7E 03 F3 F6 EF □(上传期间发送)
收←◆7E 00 F3 XX ...... XX EF (上传512 bytes数据)
收←◆..........................................
收←◆7E 04 F3 00 F7 EF(读取完毕时返码)
表示读取文件名为25313100的音频文件
5)删除指定文件:
可以指定根目录下的文件索引及文件名来删除指定的音频文件。
示例:发→◇7E 05 E2 00 01 E8 EF □ (删除索引值为1的文件)
发→◇7E 0B E3 32 35 33 31 33 31 30 30 7D EF □ (删除文件名为“25313100.MP3”的文件)
发→◇7E 03 E6 E9 EF □ (删除全部文件并格式化)
网络传输
波特率设置(921600,N,8,1),音频录制格式为MP3,外部单片机读取音频文件并上传服务器。
六、方案展示
6.1硬件架构设计
系统由外部单片机(MCU)与WT2605A芯片协同工作,硬件架构如下:

主控链路:
WT2605A负责音频采集、编码、存储至TF卡,仅通过UART协议与外部MCU通信。
外部MCU(如STM32F4系列)作为系统控制核心,通过UART发送指令读取录音文件,并通过Wi-Fi/以太网??樯洗练衿鳌?/p>
接口定义:
WT2605A与MCU之间采用UART(波特率921600bps,8N1格式),仅需连接TX、RX、GND三线。
MCU与网络???如ESP8266)通过SPI或UART通信,实现HTTP/MQTT协议封装。
6.2控制与上传流程
1)文件文件名获?。?/p>
获取根目录下的文件文件名。
2)文件内容读?。?/p>
可以指定根目录下的文件名来读取指定的音频文件。
3)数据上传服务器:
MCU接收数据块后,通过网络??榉庾拔狧TTP POST请求,按分片上传至服务器。
6.3典型应用案例
司法录音笔方案:
硬件配置:WT2605A + STM32F405 + 4G模组(移远EC200T),TF卡加密分区存储。
工作流程:
庭审结束后,法警通过按键触发MCU读取指定录音文件。
MCU逐包获取数据并加密(AES-256),通过4G网络上传至法院私有云。
上传完成后,MCU发送指令删除本地文件,确保数据唯一性。
6.4方案优势总结
通过UART协议实现外部MCU对WT2605A的精细化控制,系统具备以下特性:
高可靠性:纯硬件协议交互,避免API接口的软件层兼容性问题。
灵活组网:MCU可适配多种网络环境(Wi-Fi/4G/有线),满足不同场景部署需求。
强安全性:敏感操作(如文件删除)需MCU二次校验,防止误触发。
如果您的项目对音质有极致要求,可以考虑性能更强大的音频编解码芯片。需要达到专业录音或高保真回放级别,可以参考WT2000A芯片:
显著提升的信噪比(SNR):WT2000A芯片的DAC信噪比(SNR)为104dB,ADC信噪比(SNR)为95dB,优于WT2605A的96dB和90dB。更高的SNR意味着背景噪音更小,声音更纯净。
更高的分辨率与采样率:WT2000A芯片支持24-bit ADC,优于WT2605A的16-bit
ADC,能够记录和还原更丰富的音频细节和更宽广的动态范围。