Une technique d’apprentissage automatique est utilisée pour permettre à des équipes de robots de travailler ensemble et d’accomplir des tâches : Détails

Avatar photo

Des chercheurs ont mis au point une méthode qui permet à plusieurs agents de travailler ensemble grâce à l’intelligence artificielle (IA). La méthode fait appel à un type d’IA appelé apprentissage par renforcement multi-agents. Les agents individuels tels que les drones et les robots peuvent souvent travailler ensemble, collaborer et accomplir une tâche lorsque les lignes de communication sont ouvertes. Toutefois, la communication entre eux peut être entravée en l’absence du matériel adéquat ou en cas de blocage des signaux. La nouvelle technique utilise l’IA pour combler cette lacune en identifiant l’agent individuel lorsqu’il contribue à l’objectif de l’équipe.

“C’est plus facile lorsque les agents peuvent se parler entre eux. Mais nous voulions le faire d’une manière décentralisée, c’est-à-dire qu’ils ne se parlent pas entre eux. Nous nous sommes également concentrés sur les situations où les différents rôles ou tâches des agents ne sont pas évidents”, a déclaré Huy Tran, ingénieur aérospatial à l’Université de l’Illinois Urbana-Champaign.

Selon Tran, le problème est complexe car il n’est pas clair ce qu’un agent doit faire par rapport à un autre agent. Il a ajouté que le défi consistait à accomplir une tâche ensemble sur une certaine période de temps. Pour résoudre ce problème, Tran et ses collègues ont utilisé l’apprentissage automatique et créé une fonction d’utilité qui informe l’agent lorsqu’il contribue aux efforts de l’équipe.

Tran a expliqué que dans le cas d’un but d’équipe, il est difficile de déterminer qui a contribué à la victoire. La technique d’apprentissage automatique comble cette lacune en identifiant l’agent individuel lorsqu’il contribue à l’objectif de l’équipe. “Si l’on se place sur le plan sportif, un joueur de football peut marquer, mais nous voulons aussi connaître les actions des autres coéquipiers qui ont conduit au but, comme les passes décisives. Il est difficile de comprendre ces effets différés”, a-t-il ajouté.

Tran a démontré la nouvelle technique dans une vidéo.

L’algorithme utilisé dans cette technique peut également aider à repérer l’agent lorsqu’il travaille mais ne contribue pas à l’objectif. Ce n’est pas quelque chose que le robot a choisi de faire mal, mais simplement quelque chose qui n’est pas nécessaire, a expliqué Tran.

Le chercheur a souligné que l’algorithme peut être utilisé dans de nombreuses situations réelles telles que des robots travaillant ensemble dans un entrepôt, la surveillance militaire, le contrôle des feux de circulation ou la coordination des livraisons par des véhicules autonomes, entre autres.


Related Posts