视频会议场景中,希望能够实时采集会议中各个角色的音频吗?

视频会议场景中,希望能够实时采集会议中各个角色的音频吗?这样做是为了后面将这些音频转成文字。