根据口头约定文字转WAV音频