所以……保守地说……五成文字转WAV音频