Propozycja wykorzystania uczenia przez wzmocnienie
w celu optymalizowania podejmowania decyzji w zakresie przeciwdziałania
praniu pieniędzy oraz finansowania terroryzmu (część 1)
Uczenie przez wzmocnienie stanowi propozycję do rozwiązywania problemów identyfikacji
i weryfikacji klientów instytucji obowiązanych, którzy mogą być powiązani z procederem prania pieniędzy
czy finansowaniem terroryzmu. Może to mieć zastosowanie zarówno na poziomie czynności weryfikacyjnych,
jak i na poziomie monitoringu klienta danej instytucji. Model uczenia przez wzmocnienie pozwala na
uzyskiwanie rezultatów akcji agenta jako nie tylko konsekwencji jego uczenia, lecz także podejmowania
własnych decyzji zmierzających do uzyskania jak największej nagrody. Wsparciem tego typu działań jest
dostarczanie danych technicznych, a także współpraca z czynnikiem ludzkim w ramach uczenia się ze
wzmocnieniem na podstawie informacji zwrotnej od ludzi. Oprócz samej idei włączenia tego typu modelu
myślenia maszynowego na poziom analityki instytucji obowiązanej pozostaje także uzyskiwanie za jego
pośrednictwem rezultatów w postaci predykcyjnego wykrywania zagrożenia związanego z możliwością
legalizowania środków przestępczych i inwestowania ich w działalność terrorystyczną.
REFERENCJE(32)
1.
Alexander, J., 2018. Learning from humans: what is inverse reinforcement learning? The Gradient, https://thegradient.pub/learni... (dostęp: 10.09.2023).
Canhoto, A.I., 2021. Leveraging machine learning in the global fight against money laundering and terrorism financing: An affordances perspective, Journal of Business Research, nr 131.
DRF, 2023. What are the best practices for designing reward functions in reinforcement learning for robotics?, https://www.linkedin.com/advic... (dostęp: 5.09.2023).
Epsilon-greedy algorithm, 2023. What are the benefits and drawbacks of using a decaying epsilon strategy in epsilon-greedy algorithm?, https://www.linkedin.com/advic... (dostęp: 12.09.2023).
Foffano, D., Russo, A., Proutiere, A., 2023. Conformal Off-Policy Evaluation in Markov Decision Processes, https://arxiv.org/pdf/2304.025... (dostęp: 12.09.2023).
Łakomska, D., 2023. Algorytm epsilona-chciwego: prosta i wydajna metoda eksploracji i eksploatacji, https://mundurowe.info/wiadomo... (dostęp: 12.09.2023).
Obwieszczenie MF – obwieszczenie Ministra Finansów z dnia 14 lipca 2023 r. w sprawie ogłoszenia jednolitego tekstu rozporządzenia Ministra Finansów, Funduszy i Polityki Regionalnej w sprawie wykazu krajowych stanowisk i funkcji publicznych będących eksponowanymi stanowiskami politycznymi (Dz.U. 2023 poz. 1632).
Ouyang, L., Wu, J., Jiang, X. et al., 2022. Training language models to follow instructions with human feedback, https://cdn.openai.com/papers/... (dostęp: 18.08.2023).
Paluszyński, W., 2007 (wykonał J. Kędzierski). Algorytm uczenia ze wzmocnieniem dla małego robota mobilnego klasy (2,0). Metody i algorytmy sztucznej inteligencji, https://kcir.pwr.edu.pl/~witol... (dostęp: 4.09.2023).
Rak, A., 2013. Zastosowanie algorytmów uczenia przez wzmacnianie w układzie wyznaczania trajektorii zadanej manewrującego statku, Zeszyty Naukowe Akademii Morskiej w Gdyni, nr 78.
Rozporządzenie MFFP – rozporządzenie Ministra Finansów, Funduszy i Polityki Regionalnej z dnia 27 lipca 2021 r. w sprawie wykazu krajowych stanowisk i funkcji publicznych będących eksponowanymi stanowiskami politycznymi (Dz.U. 2021 poz. 381).
Szostek, D., Bar, G., Prabucki, R.T., Nowakowski, M., 2022. Zastosowanie sztucznej inteligencji w bankowości – szanse oraz zagrożenia. Analiza prawno-regulacyjna wpływu technologii uczenia maszynowego i pokrewnych na obowiązki sektora bankowego z zakresu zapewnienia zgodności (compliance) oraz zarządzania ryzykiem, https://us.edu.pl/wp-content/u... (dostęp: 2.08.2023).
van Keulen, I., 2021. Hiding Money Laundering with an Intelligent Multi-Agent System Simulation, Master’s Thesis Artificial Intelligence Department of Artificial Intelligence University of Groningen, The Netherlands, https://fse.studenttheses.ub.r... (dostęp: 9.09.2023).
Przetwarzamy dane osobowe zbierane podczas odwiedzania serwisu. Realizacja funkcji pozyskiwania informacji o użytkownikach i ich zachowaniu odbywa się poprzez dobrowolnie wprowadzone w formularzach informacje oraz zapisywanie w urządzeniach końcowych plików cookies (tzw. ciasteczka). Dane, w tym pliki cookies, wykorzystywane są w celu realizacji usług, zapewnienia wygodnego korzystania ze strony oraz w celu monitorowania ruchu zgodnie z Polityką prywatności. Dane są także zbierane i przetwarzane przez narzędzie Google Analytics (więcej).
Możesz zmienić ustawienia cookies w swojej przeglądarce. Ograniczenie stosowania plików cookies w konfiguracji przeglądarki może wpłynąć na niektóre funkcjonalności dostępne na stronie.