In der Übersicht
Es gibt bereits vielversprechende Proofs-of-Concepts, dass Reinforcement Learning gewinnbringend für das quantitative Risiko-Management von Derivaten eingesetzt werden kann. An ausgewählten Beispielen wurde aufgezeigt, dass Hedging im Bezug auf Minimierung eines Risikomasses modell-unabhängig und sogar unter Berücksichtigung von Transaktionskosten erlernt werden kann. Ausgehend von diesem Meilenstein beabsichtigen wir die Entwicklung eines flexiblen, skalierbaren und effizienten Reinforcement-Learning-Algorithmus.
- Flexibel bedeutet eine dynamische Lösung, die sich einfach auf verschiedene Anwendungszwecke konfigurien lässt.
- Skalierbar bedeutet eine Lösung mit einer realistischen Anzahl an Investitionsmöglichkeiten und Risikofaktoren.
- Effizient bedeutet, dass der Lernalgorithmus auf einem handelsüblichen Rechner in wenigen Minuten konvergiert.