任务的编码与表达形式,如何定义状态

  • 使用现有的表达方式?
  • 在不直接模仿的情况下,执行任务,通过特定的表达方式将任务进行编码
  • 应该选择符号的方式(symbolic)还是端到端?
    • auto encoder-decoder将state表征为相对独立的latent state start -> network(represented by latent state) -> goal
    • symbolic representation可以序列化,几个symbol通过组合成为一个序列,完成从start到goal的任务
  • 在习得了表征与skill的情况下,如何对skill进行融合?
    • Greedy,最简单的方法,可能会造成overfit?
    • 思路类似于scale-space filter
    • 如何平衡long skill和short skill?类似的,如何将Long horizon变为short horizon利于RL等方法?

符号表征

  • PDDL (Planning Domain Definition Language),PPDDL
  • Natural Language Planning
  • 拓扑Topological
  • Ontologies
    • 知识领域的?
    • Node2Vec结合随机游走random walk
    • 与PDDL相结合?Ontology Representation for PDDL Domain and Problem?(论文:ORPP—An Ontology for Skill-Based Robotic Process Planning in Agile Manufacturing)
  • Aspect Graph
    • 从视觉的方面
  • Labanotation 非接触任务抽取运动关键帧
  • Closure Theory 用于Grasp skill
  • KKT条件(Kuhn-Tucker Theory / Karush-Kuhn-Tucker Conditions) 非线性最优化方法 用于Manipulation skill
    • face contact relation,例如”pick” breaks the face contact