はじめに 以前QiitaにCounterfactual Regret Minimaization(CFR)の基礎 - QiitaというCFRの提案論文の概要をまとめた記事を書いたが、今回は理解を深めるために、実際にkuhnpokerというミニ版のポーカーでCFR計算を実装しナッシュ均衡戦略を求めた。 実装の…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。