Acho incrível que os modelos de robótica da @physical_int consigam funcionar, dado que têm apenas um comprimento de contexto de 1 segundo. Enquanto o robô se move por uma sala e limpa uma mesa, ele só vê o timestamp atual das imagens das câmaras (mais a descrição textual da sua tarefa). Perguntei ao @svlevine como é que este modelo consegue funcionar. Se um humano tivesse que executar um plano que durasse muitos minutos para realizar uma tarefa física, mas tivesse a memória reiniciada a cada segundo, não haveria maneira de conseguir. Mas de alguma forma, saber apenas em que estado o mundo está literalmente neste momento é tudo o que você precisa saber para manter um plano razoavelmente complicado em andamento? A resposta do Sergey menciona o Paradoxo de Morevac, e achei isso bastante interessante. Episódio completo amanhã!