我知道相互信任需要有一个过程文字转WAV音频