Вторник, 31 Октября 2023

Изучил минимакс алгоритм. Смысл такой же как и в оне степ лук эхэд, только в данном случае мы просчитываем больше вариантов, смотря в глубину. Мы считаем что противник выберет наилучший для него ход, с наибольшим счетом, и в итоге выбираем наш ход, где например на глубине 3 ходя вперед мы будем в наилучшей позиции, а противник в наихудшей.

minimax

Код можно увидеть тут в Википедии

Начал изучать Deep Reinforcement learning