JOURNAL ARTICLE

Normative Compliance in Lexicographic Multi-Objective Reinforcement Learning Agents

Abstract

Autonome, auf maschinellem Lernen basierte KI-Agenten haben begonnen, Teil unseres Alltags zu werden, von selbstfahrenden Autos bis hin zu Chatbots als persönliche Assistenten. Viele dieser Agenten werden mit Hilfe von Reinforcement Learning trainiert, wobei ein System von Belohnungen oder Bestrafungen eingesetzt wird, um bestimmte Verhaltensweisen zu fördern oder zu unterbinden. In jüngster Zeit hat der rasche Fortschritt in diesen Bereichen Sicherheitsbedenken aufgeworfen, sodass manche Experten sogar einen vorübergehenden Entwicklungsstopp forderten. Wenn wir KI-Agenten in unsere Gesellschaft integrieren wollen, sollten wir sicherstellen, dass sie ethischen, rechtlichen und sozialen Normen unterliegen, ähnlich wie Menschen. Diese Arbeit befasst sich mit der Frage, wie wir sicherstellen können, dass Agenten, die mit Reinforcement Learning trainiert wurden, Normen einhalten, ohne an Nutzen zu verlieren. Unser Ansatz erweitert bestehende Techniken mit Algorithmen für lexikographische Mehrzielprobleme. Bei diesen sind die Ziele nach Priorität geordnet und werden unter der Bedingung optimiert, dass vorherige Ziele bereits optimiert wurden. Mit einem externen Theorembeweiser für deontische Logik - die Logik der Verpflichtungen und Erlaubnisse - bestrafen wir den Agenten für die Verletzung von Normen. Indem er zunächst diese normativen Strafen minimiert und dann seine anderen Ziele optimiert, lernt der Agent, sein Ziel zu erreichen und dabei eine Vielzahl von Normen einzuhalten. Wir evaluieren diesen Ansatz experimentell, indem wir ihn mit verschiedenen Agenten testen, die das Arcade-Spiel Pac-Man spielen. In einer vereinfachten Version des Spiels lernten die Agenten, die Normen nicht zu verletzen und gewannen die meisten ihrer Testspiele. Sie waren jedoch nicht in der Lage, das gleiche Leistungsniveau in einer komplexeren Umgebung zu erreichen.

Keywords:
Reinforcement learning Normative Corollary

Metrics

0
Cited By
0.00
FWCI (Field Weighted Citation Impact)
0
Refs
0.27
Citation Normalized Percentile
Is in top 1%
Is in top 10%

Topics

Reinforcement Learning in Robotics
Physical Sciences →  Computer Science →  Artificial Intelligence
Multi-Agent Systems and Negotiation
Physical Sciences →  Computer Science →  Artificial Intelligence
Language and cultural evolution
Social Sciences →  Social Sciences →  Cultural Studies

Related Documents

JOURNAL ARTICLE

Lexicographic Multi-Objective Reinforcement Learning

Yinbo SunLintao MaYu LiuShijun Wang

Journal:   Proceedings of the Thirty-First International Joint Conference on Artificial Intelligence Year: 2022 Pages: 3430-3436
JOURNAL ARTICLE

Reinforcement Learning Guided by Provable Normative Compliance

Emery A. Neufeld

Journal:   Proceedings of the 14th International Conference on Agents and Artificial Intelligence Year: 2022 Pages: 444-453
JOURNAL ARTICLE

Norm Compliance for Reinforcement Learning Agents

Neufeld, Emeric Alexander

Journal:   reposiTUm (TU Wien) Year: 2023
© 2026 ScienceGate Book Chapters — All rights reserved.