它会向路过的行人问一个问题文字转WAV音频