Скрыть объявление

Если у вас возникают проблемы с пополнением баланса по карте, то пробуйте через СБП . Он еще и выгоднее (без комиссии банка).


СБП - это система быстрых платежей - перевод по номеру телефона без комиссии

Скрыть объявление

Вплетайте уют в свои дни: сегодня День Вязания!

В честь праздника — акция на раздел «Хобби и рукоделие»

Подробности ТУТ

Скрыть объявление

На короткое время в нашем  канале  рассказываем где достать редкие курсы

Закрыто

Глубокое обучение с подкреплением на Python. OpenAI Gym и TensorFlow для профи (Судхарсан Равичанди)

Тема в разделе "Курсы по программированию"

Цена:
900 руб
Взнос:
141 руб
Организатор:
Рамос47

Список участников складчины:

1. Рамос47 2. qscary 3. sanekius
  1. Рамос47 Организатор складчин

    Глубокое обучение с подкреплением на Python. OpenAI Gym и TensorFlow для профи (Судхарсан Равичанди)

    [​IMG]
    Глубокое обучение с подкреплением (Reinforcement Learning) — самое популярное и перспективное направление искусственного интеллекта.
    Практическое изучение RL на Python поможет освоить не только базовые, но и передовые алгоритмы глубокого обучения с подкреплением.

    Вы начнете с основных принципов обучения с подкреплением, OpenAI Gym и TensorFlow, познакомьтесь с марковскими цепями, методом Монте-Карло и динамическим программированием, так что «страшные» аббревиатуры DQN, DRQN, A3C, PPO и TRPO вскоре перестанут вас пугать. Вы узнаете об агентах, которые учатся на человеческих предпочтениях, DQfD, HER и многих других последних достижениях RL.
    Прочитав книгу, вы приобретете знания и опыт, необходимые для реализации обучения с подкреплением и глубокого обучения с подкреплением в реальных проектах, и войдете в мир искусственного интеллекта.

    В этой книге вы:
    • Познакомитесь с основами методов, алгоритмов и элементов RL
    • Обучите агента с помощью OpenAI Gym и Tensorflow
    • Освоите марковские процессы принятия решений, оптимальность Беллмана и обучение TD
    • Научитесь решать проблемы многоруких бандитов
    • Овладеете алгоритмами глубокого обучения, такими как RNN, LSTM и CNN
    • Создадите интеллектуальных агентов с помощью алгоритма DRQN, которые смогут играть в Doom
    • С помощью DDPG научите агентов играть в Lunar Lander
    • Отправите агента на автогонки, используя метод DQN
    Скрытый текст. Доступен только зарегистрированным пользователям.Нажмите, чтобы раскрыть...
     
  2. Похожие складчины
    Загрузка...
Наверх