Amelie Schuster, Maria Woda

Kann KI Strafrichter ersetzen?

A. Einleitung

Der KI-Einsatz gewinnt zunehmend auch im Bereich des Strafrechts an Bedeutung. Ein Regierungsentwurf vom 29.04.2026 enthält erste Rechtsgrundlagen für KI-gestützte Ermittlungsinstrumente bei der Strafverfolgung.1

Im Strafverfahren hingegen bestehen noch keine Entwürfe für unterstützenden oder gar ersetzenden Einsatz von KI. Laut Bundesjustizministerin Stefanie Hubig (SPD) werden Entscheidungen weiterhin „immer von Menschen […], nicht von KI-Agenten“ getroffen werden.2

Dennoch drängt sich die Frage auf, ob künftig auch richterliche Entscheidungsprozesse Prüfungsgegenstand von KI-Systemen sein könnten, nicht nur in unterstützender Funktion.

Der Beitrag untersucht hierzu einige ausgewählte technische und rechtliche Grenzen des richterersetzenden Einsatzes von KI innerhalb der Strafjustiz.

B. KI im Strafverfahren

I. Verständnis- und Formalisierungsproblematiken

Um Gerichtsurteile zu fällen, muss KI fähig sein, Rechtssprache technisch abzubilden. KI kann dabei die Semantik, also die Bedeutung der Sprache nicht im eigentlichen Sinne verstehen, da dies das Erfassen von Wahrheitsbedingungen und damit die gedankliche Vorstellung entsprechender Situationen voraussetzt.3

Das zeigt sich an folgendem Beispiel bei lernbasierten KIs: Gefragt, ob man aus einer Tasse, deren Oberseite verschlossen, Boden aber entfernt wurde, trinken könne, kamen verschiedene KIs nicht auf die Idee, dass man sie einfach umdrehen könnte.4

Ihr fehlt offenbar also ein Verständnis dafür, wie eine Tasse überhaupt funktioniert. Für das inzwischen bekannte Problem wurden den KI-Systemen zwar passende Antworten vorgegeben, jedoch nur für diesen konkreten Fall.

KI-Systeme müssen stattdessen mit einer bloßen Simulation der Semantik zurechtkommen. Diese ist durch zwei Methoden möglich. Erstens gibt es die lernbasierten Modelle (wie Sprachmodelle), die nach statistischer Methode durch einen Abgleich mit ähnlich gelagerten Fallgruppen generieren, was sich aus semantischer Perspektive wahrscheinlich ergeben würde.5 Zweitens gibt es regelbasierte KIs, die so funktionieren, dass man ihnen für jeden Fall Einzelregeln gibt, die semantische Relationen enthalten (wie dass Rot eine Farbe ist, dass also, wenn ein Gegenstand rot ist, man auch folgern kann, dass er farbig ist).6

Es ergeben sich hier folgende Schwierigkeiten.

1. Fehlendes Verständnis

Aufgrund der Tatsache, dass lernbasierte Systeme keine vollständig vorgegebenen Prüfungsregeln benötigen, eignen sie sich besser für einen breiteren Einsatz.

Allerdings verfügen sie, wie des Becherbeispiel zeigt, nicht über ein wirkliches Verständnis physikalischer Vorgänge. Sie verfügen also auch über kein echtes Ursache-Wirkungs-Verständnis.

Problematisch wird dies insbesondere bei der essentiellen Prüfung der Kausalität, wo schon kleine Unterschiede zu vorherigen Fällen das Tatbestandsmerkmal entfallen lassen können.7 Ein lernbasiertes System könnte zwar bei vielen Fällen eine richtige juristische Bewertung generieren. Es bleibt jedoch unklar, ob ein Zusammenhang nur zufällig ist oder tatsächlich kausal besteht; lernbasierten KIs fehlt insoweit eine wertende Ursachenanalyse.8

2. Formalisierung: Eindeutige und abschließende Begriffe

Das Hauptproblem regelbasierter Systeme hingegen ist ihre Abhängigkeit von vordefinierten Regeln. Daraus folgt, dass sie nur Delikte mit eindeutigen und abschließend definierten, also formalisierten Begriffen prüfen können.

Zunächst ist zu beachten, dass viele Rechtsnormen – im Strafrecht in besonderem Maße – wertungsabhängige Tatbestandsmerkmale enthalten, etwa die „Herabwürdigung“ in § 185 StGB oder das „öffentliche Interesse“ in § 153 StPO bei der Strafverfolgung.

Zur genaueren Betrachtung dieses Problems bietet sich die zentrale Zurechnungsnorm des Strafrechts § 46 StGB an.9 Bei ihrer Anwendung erfolgt eine Gesamtbewertung der Tat, unter anderem anhand ihrer Schwere, der Beweggründe, der Tatfolgen, dem Nachtatverhalten und dem Vorleben des Täters.10 Zugleich verlangt die Norm eine Abwägung dieser Kriterien untereinander, deren Gewichtung jeweils von ihrer konkreten Ausprägung im Einzelfall abhängt.11

Bei regelbasierten Systemen scheint es schwer durchführbar, diese Kriterien abschließend zu definieren. Hierfür müsste man alle möglichen Szenarien im Vorhinein kennen und dem System die richtige Anwendung dieser vorgeben. Vielseits wird argumentiert, dass Normen zu vielgestaltig und tatsächliche Lebenssachverhalte zu facettenreich sind, um eine vollständige ex-ante Festlegung der Bewertung zur ermöglichen.12

Hinsichtlich der Gewichtung im Einzelfall wäre es technisch denkbar, einzelnen Kriterien Punktwerte zuzuordnen. Es ist jedoch stark zweifelhaft, ob eine solche Art der Gewichtung wünschenswert ist. Eine nuancierte Gesamtwürdigung, wie sie durch den Richter erfolgt, dürfte sich kaum vollständig in ein schematisches Berechnungssystem übertragen lassen. Unter anderem wird deswegen die grundsätzliche Möglichkeit der formelhaften Abbildung der Strafzumessung nach § 46 StGB teilweise stark in Frage gestellt.13 Zudem kann das Verfahrensverhalten des Angeklagten strafzumessungsrelevant sein, was einen Systemeinsatz ohne Richter fernliegend erscheinen lässt.14

Da die Bewertungskriterien sehr vielfältig und Wertungsfragen angesichts wandelbarer gesellschaftlicher Wertvorstellung weder abschließend begründbar noch festliegend sind, wirken sie der Verfahrensmethodik regelbasierter KIs entzogen, eine größere ersetzende Einsetzung dieser scheint mithin ausgeschlossen.15

Bei lernbasierten Systemen bestünde indes die bereits erwähnte Verständnisproblematik. Ferner ist zu beachten, dass durch den bloßen Vergleich mit vorherigen Fällen der Fall typisiert und eine individualisierte Bewertung, somit die materielle Einzelfallgerechtigkeit, nicht mehr gewährleistet würde.16

II. Rechtliche Grenzen

Die Übertragung richterlicher Entscheidungen auf automatisierte Systeme setzt voraus, dass deren Ergebnisse mit Gesetz und Recht vereinbar bleiben (Art. 20 Abs. 3 GG).17

Hier prallen technische Möglichkeiten und rechtliche Anforderungen aufeinander. Es ergeben sich zahlreich rechtliche Bedenken, auf die im Folgenden ausschnitthaft eingegangen werden.

1. Anspruch auf rechtliches Gehör (Art. 103 Abs. 1 GG)

Dem bloßen Äußerungsrecht kann das KI-System formal gerecht werden, denn aus teleologischer Sicht ist es unerheblich, ob ein Mensch oder ein System Informationen vernimmt. Zu einem vollumfänglichen Gehörsrecht gehört aber auch das Berücksichtigungsrecht hinsichtlich des Vorgebrachten und die damit einhergehende Begründungspflicht.18 Werden abschließende Listen von Fragen gestellt oder nur bestimmte Kriterien berücksichtigt, würde das rechtliche Gehör entwertet werden. Ausführungen außerhalb des Katalogs würden nicht in die Berechnung einfließen und folglich nicht gehört werden.19 Es müsste also Freitextfelder geben, damit freie Äußerungen nicht durch starre Formulargrenzen ausgeschlossen werden. Um dem Berücksichtigungsrecht und der Begründungspflicht hinreichend zu genügen, müssen die Systeme zusätzlich in der Lage sein, die Argumente zu werten, abzuwägen und dies zu begründen.20

Hier geraten sie an technische Grenzen. Lernbasierte Systeme sind (noch) nicht in der Lage, unbekannte Fallgestaltungen und Informationen hinreichend zu verarbeiten und zu begründen. Sie arbeiten auf Grundlage von Wahrscheinlichkeiten, nicht rechtlich abstrakter Regeln.21 Ein Fall, der nicht anhand der Trainingsdaten gelöst werden kann, würde also mit den jeweils wahrscheinlichsten, nicht unbedingt richtigen „Gedanken“ gelöst werden. In komplexeren oder atypischen Gestaltungen ist der strafrichterersetzender KI-Einsatz mit Art. 103 Abs. 1 GG daher ausgeschlossen und ein menschlicher Richter erforderlich. Bei regelbasierten Systemen besteht die Formalisierungsproblematik.

2. Recht auf einen gesetzlichen Richter Art. 101 Abs. 1 S. 2 GG

Um den strafrichterersetzenden KI-Einsatz und das Recht auf einen gesetzlichen Richter nach Art. 101 Abs. 1 S. 2 GG vereinen zu können, bräuchte es auf formeller Ebene neue abstrakt-generelle Zuständigkeitsregelungen, die einem System bestimmte Streitsachen zuweisen.

Setzt man bei dem Recht auf einen gesetzlichen Richter voraus, dass Richter natürliche Personen sein müssen, ist ein KI-Entscheidungsträger nicht zu legitimieren. Diese Menschlichkeitsanforderung hat sprachlich-historischen Hintergrund. Eine Begründung lässt sich daraus allerdings nicht – auch nicht aus Systematik oder Zweck – entnehmen.22 Lässt man von der Menschlichkeitsanforderung ab, entfiele ein subjektives Recht auf einen zwingend menschlichen Richter für den (Teil-)Bereich der KI-automatisierten Rechtsprechung.23 Spätestens an den Qualifikationsmerkmalen wie der sachlichen und persönlichen Unabhängigkeit sowie Unparteilichkeit und Unbefangenheit im Sinne des Art. 97 GG scheitert es aber, denn diese müssten trotzdem von entsprechenden Systemen erfüllt sein.24 Dahingehend bestehen bei lernbasierten KI-Systemen Bedenken, die noch nicht zufriedenstellend gelöst sind.25 Ein entscheidungsersetzender Einsatz bleibt daher höchstens für einfach gelagerte Fälle ohne Richtervorbehalt denkbar.26

3. Prozessmaximen

Neben verfassungsrechtlichen Grenzen erschwert auch die Wahrung von Prozessmaximen den entscheidungsersetzenden Einsatz von KI. So verbietet der Untersuchungsgrundsatz nach § 244 Abs. 2 StPO die Delegation der Aufklärungspflicht. Außerdem dürfen algorithmische Ergebnisse nicht ungeprüft übernommen werden, da sonst die freie Beweiswürdigung gem. § 261 StPO und die Selbstständigkeit des Urteils nicht gewahrt ist.27

Gesamtheitlich besteht bei der Anwendung lernbasierter Systeme die „Black-Box- Problematik“; Systeme, die lediglich Ergebnisse produzieren, Bearbeitungs- und Rechnungsweg aber nicht nachvollziehbar begründen und transparent offenlegen, lassen sich nicht mit den Anforderungen an das Recht auf ein faires Verfahren (Art. 6 Abs. 1 EMRK, Art. 2 Abs. 1 i.V.m. Art. 20 Abs. 3 GG) vereinbaren.28 Ansätze der explainable AI bestehen zwar, sind bislang jedoch nicht ausreichend entwickelt.29

C. Zusammenfassung

Somit steht fest, dass der KI-Einsatz mit vielen grundlegenden technischen und rechtlichen Hürden konfrontiert ist.

Manche lassen sich durch Gesetzesänderungen lösen. So könnten automatisierte KI-Urteile unter dem Zustimmungsvorbehalt des Angeklagten stehen, der damit eigenverantwortlich auf sein Recht auf den menschlichen Richter verzichtet.30 Auch könnte die Strafzumessung bei bestimmten Delikten anhand fester Tabellen statt durch richterliche Abwägung erfolgen.

Ein Beispiel ist der Schweizer Art. 91 SVG zur Trunkenheit im Verkehr, dessen Prüfung Gegenstand eines MPI-Projekts zur Entwicklung eines KI-Systems für autonome Strafbefehle ist.31 Beim deutschen Pendant, § 316 StGB, erfolgt die Strafzumessung nach § 46 StGB und wirft damit die genannten Probleme auf, die vor einem Einsatz in deutschen Strafverfahren erst überwunden werden müssten.

Unter der Voraussetzung, dass man sich de lege ferenda mancher wertungsabhängigen Begriffe entledigt, könnten bestimmte Delikte regelbasiert erfasst werden. Aufgrund der Vielzahl möglicher Fallkonstellationen müsste jedoch gewährleistet sein, dass ein regelbasiertes System die Bearbeitung eines Falles verweigern könnte, wenn der Regelsatz nicht mehr ausreicht, um ein passendes Urteil zu fällen. Die technischen Probleme bei lernbasierten Systemen sind in ihre Funktionsweise eingebaut und lassen sich nicht einfach beheben.32 Zu betonen ist, dass ein Fehler von einem KI-System meist länger unerkannt bleibt und bei massenhafter Einsetzung zu gravierenden Folgen führen kann.33

Auch ist ein entscheidungsersetzender Einsatz aus rechtlicher Perspektive ausgeschlossen. Unterstützende Systeme sind allerdings rechtlich zu legitimieren, solange sichergestellt ist, dass algorithmische Erzeugnisse richterlich kontrollier- und korrigierbar sind.34

Schlussendlich können nach dem aktuellen Stand der Technik die rechtlichen Grenzen in absehbarer Zeit nicht überwunden werden. Unterstützende KI-Modelle erscheinen hingegen unter menschlicher Verantwortung realistisch.

 

1 RegE S. 1 https://beck-link.de/ay25r.

2 BMJV, Pressemitteilung Nr. 33/2026, 29.04.2026, auf: https://www.bmjv.de/SharedDocs/Pressemitteilungen/DE/2026/0429_digitale_Ermittlungsmassnahmen.html, abgerufen am 12.05.2026.

3Tugendhat, Vorlesungen zur Einführung in die sprachanalytische Philosophie, 1. Aufl. 1976, S. 258ff.

4 Labla.org – Ai news, What question can’t AI answer? A test for AI with a welded mug, 22.08.2025, auf: https://www.labla.org/ai/what-question-cant-ai-answer-a-test-for-ai-with-a-welded-mug/ abgerufen am 15.05.2026.

5Löser et al., Große Sprachmodelle. Whitepaper von der Plattform Lernende Systeme, 2023, DOI: 10.48669/pls_2023-3, S. 20.

6Löser et al., Große Sprachmodelle. Whitepaper von der Plattform Lernende Systeme, 2023, DOI: 10.48669/pls_2023-3, S. 20.

7Kment/Borchert, Künstliche Intelligenz und Algorithmen in der Rechtsanwendung, 1. Aufl. 2022, Rn. 82.

8Kment/Borchert, Künstliche Intelligenz und Algorithmen in der Rechtsanwendung, Rn. 82f.

9Maier, in: MüKo-StGB, 5. Aufl. 2025, § 46 Rn. 1.

10Detter, NStZ 2018, 386.

11Heger, in: Lackner/Kühl/Heger StGB, 31. Aufl. 2025, § 46 Rn. 47.

12La Diega, Against the Dehumanisation of Decision-making, Journal of Intellectual Property, Information Technology and E-commerce Law 2018, 3, 6.

13Graichen, Die Automatisierung der Justiz, 1, Aufl. 2022, S. 230.

14Kinzig, TK-StGB, 31. Aufl. 2025, § 46 Rn. 41.

15Rüthers, Die heimliche Revolution vom Rechtsstaat zum Richterstaat, 2. Aufl. 2016, S. 50.

16Graichen, Die Automatisierung der Justiz, S. 231.

17Guckelberger, Öffentliche Verwaltung im Zeitalter der Digitalisierung, 1. Aufl. 2019, S. 367.

18Gless, Künstliche Intelligenz in der Gerichtsbarkeit, ZSR/RDS Band 142 (2023) I Heft 5, 429, 436.

19Valerius, „Legal Tech“ im Strafverfahren?, ZStW 133 (2021), 152, 164.

20Gold/Reuß/del Rio Hecklau u.a., Forschungsprojekt Künstliche Intelligenz und richterliche Entscheidungsfindung, 2025, S. 230.

21 Gless/ Wohlers, Subsumtionsautomat 2.0- Künstliche Intelligenz statt menschlicher Richter? in: Böse/ Schumann/ Toepel (Hrsg.), Festschrift für Urs Kindhäuser zum 70. Geburtstag, Nomos Verlag 2019, 147, 159 f.; Gless, Künstliche Intelligenz in der Gerichtsbarkeit, ZSR/RDS Band 142 (2023) I Heft 5, 429, 457.

22Gold et al., Forschungsprojekt Künstliche Intelligenz und richterliche Entscheidungsfindung, 2025, S. 162 ff.

23 Wolff, Algorithmen als Richter, DOI: 10.25353/ubtr-xxxx-cefc-98c1, S. 180.

24Gold et al., Forschungsprojekt Künstliche Intelligenz und richterliche Entscheidungsfindung, 2025, S. 220.

25 Gless/ Wohlers, Subsumtionsautomat 2.0- Künstliche Intelligenz statt menschlicher Richter? in: Böse/ Schumann/ Toepel (Hrsg.), Festschrift für Urs Kindhäuser zum 70. Geburtstag, Nomos Verlag 2019, 147, 162 f.

26 Näher dazu: Riehm, Automatisierte rechtliche Entscheidungsfindung – kommt der RoboJudge?, DOI: 10.17875/gup2023-2374, S. 15.

27Valerius, „Legal Tech“ im Strafverfahren?, ZStW 133 (2021), 152, 159 ff.

28Gold et al., Forschungsprojekt Künstliche Intelligenz und richterliche Entscheidungsfindung, 2025, S. 237.

29Gless/Avedisian, Künstliche Intelligenz in der Strafrechtspflege, 1. Aufl. 2026, S. 155.

30Rostalski et al., Künstliche Intelligenz und Recht. Whitepaper von der Plattform Lernende Systeme, 2024, DOI: 10.48669/pls_2024-6, S. 28.

31 Max-Planck-Institute, Algorithmic Profiling and Automated Decision-Making in Criminal Justice, auf: https://csl.mpg.de/en/max-planck-fellow-group/algorithmic-profiling-automated-decision-making-in-criminal-justice, abgerufen am 26.05.2026.

32 Newest AI, 24.09.2025, OpenAI admits AI hallucinations are mathematically inevitable, not just engineering flaws, auf: OpenAI: AI Hallucinations Are Mathematically Inevitable – Newest AI, abgerufen am 26.05.2026.

33Rostalski et al., Künstliche Intelligenz und Recht. Whitepaper von der Plattform Lernende Systeme, 2024, DOI: 10.48669/pls_2024-6, S. 21; The Guardian, Revealed: divorce software error hits thousands of settlements, 17.11.2015, auf: https://www.theguardian.com/law/2015/dec/17/revealed-divorce-software-error-to-hit-thousands-of-settlements, abgerufen am 29.05.2026.

34Greco, Richterliche Macht ohne richterliche Verantwortung: Warum es den Roboter- Richter nicht geben darf, RW- Heft 1 2020, 30, 43; Gless, Künstliche Intelligenz in der Gerichtsbarkeit, ZSR/RDS Band 142 (2023) I Heft 5, S. 451.

Autorinnen und Autoren

  • Amelie Schuster
    Amelie Schuster studiert Rechtswissenschaften an der Universität Freiburg mit dem Schwerpunkt Strafrechtliche Sozialkontrolle. Sie arbeitete als studentische Hilfskraft in der Max Planck Fellow Group „Algorithmic Profiling and Automated Decision-Making in Criminal Justice“ am Max- Planck-Institut zur Erforschung von Kriminalität, Sicherheit und Recht.
  • Maria Woda
    Maria Woda studiert Rechtswissenschaften an der Universität Freiburg mit dem Schwerpunkt Deutsches, Europäisches und Internationales Öffentliches Recht. Sie arbeitete als studentische Hilfskraft in der Max Planck Fellow Group „Algorithmic Profiling and Automated Decision-Making in Criminal Justice“ am Max- Planck-Institut zur Erforschung von Kriminalität, Sicherheit und Recht.

WiJ

  • Raimund Weyand

    Wichtige Entscheidungen zum Insolvenzstrafrecht

    Insolvenz, Bankrott, Bilanz

  • Sebastian Wolf , Sophia Blum

    Wirtschaftsstrafrecht und Künstliche Intelligenz

    EDV, IT, geistiges Eigentum und Schutzrechte

  • Folker Bittmann , Philipp Rhein , Carl von Alten

    WisteV-Stellungnahme zum Referentenentwurf des BMF für ein „Gesetz für mehr Gerechtigkeit durch die Stärkung der Zollverwaltung und die Bekämpfung der Finanzkriminalität“

    Steuerstrafsachen, Zoll- und Verbrauchssteuerstrafsachen