Abstract not available.
指令粒度是语言引导具身人工智能中一个重要但控制不佳的变量。现有基准测试通常为每个任务配对单一静态指令,这使得难以研究当同一任务以不同详细程度描述时,智能体行为如何变化。我们引入了Mini-BEHAVIOR-Gran,这是一个用于指令粒度控制研究的新基准,它扩展了Mini-BEHAVIOR,为每个任务提供多种指令变体,涵盖从高层目标描述到逐步指导的范围。利用该基准,我们比较了四种跨任务粒度量化候选指标:词元数量、实体数量、动作动词数量和规划宽度,并发现宽度与智能体性能的相关性最为一致。使用宽度组织训练和评估进一步揭示了指令粒度与性能之间的非单调U型关系,在精细和粗粒度极端处均出现峰值。进一步分析表明,粗粒度性能反弹与浅层接地相关,即智能体学习视觉主导的策略。