第二步,候选MCQ生成。 这需要在长视频中跨多个时间片段,进行信息分析和合成。 具体来说,研究人员以20分钟为间隔分割了视频,提取信息转化为结构化格式供大模型处理。最终一共开发了25个特定任务的prompts。 第三步,LLM优化与人工反馈。