Поначалу комп одолел человека в шахматы и го, позже пришел за покером. Да, искусственный ум умеет блефовать

Глобальная серия покера Покер

Покер – одна из самых сложных игр для искусственного ума. В отличие от шахмат либо шашек, это игра с неполной информацией – комп не может буквально знать, какие карты на руках у оппонента, он может лишь догадываться. Не считая того, в покере нередко блефуют, что трудно поддается математическому анализу. В конце концов, в покер играет, обычно, несколько человек с различными стратегиями – чтоб выигрывать, нужно быть удачным против каждой.

Искусственный ум уже год как совладал с данной нам задачей. Вообщем, колебаний в том, что это произойдет, не было по последней мере с 2015 года, когда AI лишь начал собственный путь к покорению покера. Это не повод для печалься – да, покер стал «решенной» игрой, но зато, как и в шахматах, исследование компьютерных стратегий обогатит игру и, может быть, приведет к пересмотру даже тех вещей, которые числятся аксиоматическими.

Поведаем обо всем по порядку, но поначалу напомним, что играться в покер с {живыми} людьми идеальнее всего в покер-руме GGпокерок. На данный момент там идет мини-WSOP – серия турниров Good Game Series Of Poker для микролимитчиков, вполне повторяющая WSOP, лишь с маленькими бай-инами и высочайшими призовыми.

Содержание статьи

1 1-ая победа: Cepheus
2 И опять человек потерпел поражение: Libratus отомстил за Claudico
3 И здесь пришел Pluribus

1-ая победа: Cepheus

Сконструировать таковой искусственный ум, который бы стабильно обыгрывал людей в их возлюбленные игры – одна из самых сложных задач современности, потому логично, что ей занимаются в главном ученые. Программку Cepheus, нареченную или в честь персонажа греческой мифологии Кефея, или в честь созвездия (а быстрее всего – в честь обоих), разработали еще в 2014 году специалисты из института в Альберте.

Результаты их работы были размещены в Science: через 70 дней обучения Cepheus стал так отлично играться в хедз-ап (=один на один) пот-лимит (=с фиксированными ставками) покер, что мог обыгрывать хоть какого специалиста. Наиболее того, он выбирал такие ходы, которые исключали, что человек, даже если будет играться с Cepheus всю жизнь, сумеет достигнуть уровня компа. «Мы не говорим, что он будет выигрывать средства каждую раздачу. Но на дистанции комп не может проиграть – будет ничья либо победа AI», – радовался один из разрабов Cepheus Майкл Боулинг.

Тогда чудилось, что это еще не конец. В конце концов, покер с лимитированными ставками не так популярен, как анлимитный, к тому же понятно, что вариантов применить блеф там намного меньше. Потому победа Cepheus не оказала огромного воздействия на покерный мир, а ученые начали создавать таковой комп, который бы умел играться в анлимитные игры.

И опять человек потерпел поражение: Libratus отомстил за Claudico

В 2016-м вышло принципиальное событие не из мира покера, опосля которого сделалось понятно, что победа в анлимитной игре – вопросец времени. В 2016-м комп AlphaGo одолел в го наилучшего игрока планетки Ли Седоля.

Изюминка той победы в том, что комп не перебирал композиции, а обучался «мыслить». Позже в улучшенные AI системы AlphaGo совершенно не стали загружать партии с людьми – искусственный ум обучался лишь на партиях с самим собой (крайняя версия AlphaGo обыграла ту, против которой сражался Ли Седоль, со счетом 100:0).

Сразу с сиим происходила работа над «решением» покера. Более значимых результатов достигнули в Институте Карнеги Меллон. Поначалу там сделали Claudico, который в 2015 году сразился с 4-мя специалистами в хедз-ап покер и проиграл – три из 4 экспертов обыграли искусственный ум на дистанции в 80 тыщ раздач, на время подтвердив, что компу не дается блеф.

За Claudico отомстил Libratus, разработка такого же института. В 2017 году он сразился также против 4 экспертов, сейчас количество раздач было увеличено до 120 тыщ, это заняло 20 дней. Уже сначала сделалось понятно, что профи соревнуются не с Libratus, а меж собой – кто проиграет меньше всех. Комп просто обыграл всех четырех, зарабатывая по 14,7 огромных блайнда за 100 раздач.

Сейчас ученым предстояло самое сложное: допустить комп до покера, в каком играет больше 2-ух человек. AI был должен не только лишь научиться держать в голове несколько стратегий различных оппонентов, да и разыгрывать мультипоты – когда до вскрытия могут дойти сходу несколько человек.

И здесь пришел Pluribus

Новейшую разработку институт Карнеги Меллон делал вкупе с Facebook. В 2019 году Pluribus сыграл два матча: в одном он сражался с пятью специалистами, в другом – мастера сражались с пятью копиями AI, которые не передавали информацию друг дружке. Другими словами, Pluribus решил одолеть самый пользующийся популярностью тип покера.

За 12 дней комп сыграл 10 тыщ раздач и оказался успешен в обеих дисциплинах – покерные игроки не могли подобрать ключ к искусственному уму ни в одиночку, ни когда все были за столом. Pluribus повсевременно менял стратегии, не давая способности различить паттерны в его действиях. Не считая того, он делал шаги, которые в покере числятся минусовыми и ассоциируются с действиями новичков. А именно, дискуссировались его нередкие «донк-беты»: комп играл пассивно, а когда на столе появлялась последующая карта, вдруг ставил в оппонента, который ранее был агрессором (обычно, такие ставки числятся показателем блефа и просто раскусываются даже непрофессиональными игроками).

Из объяснений проф игроков мы знаем, что все AI играют не только лишь непредсказуемо, да и весьма жестко: чтоб инспектировать их блефы либо полублефы, игрокам нужно жертвовать значимым количеством фишек. Не считая того, в его модель было заложено, чтоб Pluribus в главном концентрировался на последующих 2-3 шагах, а не на длительной стратегии – и это отдало нежданно отличные результаты.

«Можно с уверенностью сказать, что он играет на сверхчеловеческом уровне. И это уже не обменяется», – уверен один из разрабов Pluribus Ноам Браун.

***

На теоретическом уровне еще остались виды покера, в каких искусственному уму предстоит обосновать свою состоятельность – к примеру, в огромных турнирах, где стратегию нужно адаптировать к неизменному повышению неотклонимых ставок. Тем не наименее, уже на данный момент можно сказать, что покер стал «решенной» игрой.

Создатели Pluribus не планируют зарабатывать на покере: их модель закончила обновляться, и можно надежды, что по последней мере некое время такие AI не выйдут из стенок научных лабораторий и не уничтожат онлайн-покер. Сами ученые считают, что похожие на Pluribus системы понадобятся в кибербезопасности, в денежных переговорах, для предотвращения злодеяний либо будут помогать компам в беспилотных карах – в общем, всюду, где приходится сталкиваться с решением задач с неполной информацией.

Ну а игрокам в покер остается лишь учить раздачи Pluribus и остальных AI и подмечать в их что-то, что сделает их схожим на суперкомпьютер. Также соревноваться в онлайн и офлайн-турнирах по типу WSOP, Мировой серии покера для {живых} людей (искусственному уму вход запрещен), которая в этом году проходила в покер-руме GGпокерок. За время серии общий призовой фонд превысил несколько 10-ов миллионов баксов.

Источник: sports.ru

спорт и здоровье