回覆列表
  • 1 # 論智

    現在強化學習越來越火,比如OpenAI在ICLR 2018上總共提交了7篇論文,其中4篇都是關於強化學習的。相應地,主流的人工智慧深度學習框架,都有相關的強化學習庫。

    TensorFlow

    有TensorForce庫,基於TensorFlow構建,提供了強化學習的API,支援:

    A3CTRPONAFsDQNDouble-DQNN-step DQNVPGActor-Critic模型DQFDPPO

    TensorForce的GitHub頁面:github.com/reinforceio/tensorforce

    PyTorch

    pytorch-rl庫,基於PyTorch構建,支援:

    DQNDouble-DQNDueling DQNA3CACER

    pytorch-rl的GitHub頁面:github.com/jingweiz/pytorch-rl

    另外還有一個DeepRL庫,也是基於PyTorch構建的,支援:

    (Double/Dueling) DQNCategorical DQNQuantile Regression DQNA2CN-Step Q-LearningDDPGPPOOCAction Conditional Video Prediction

    DeepRL的GitHub頁面:github.com/ShangtongZhang/DeepRL

    MXNet

    MXNet的官方樣例(`example/reinforcement-learning`)包含以下強化學習演算法的實現:

    A3CDDPGDQN並行Actor-Critic模型

  • 中秋節和大豐收的關聯?
  • 2018考研有什麼好的複習建議?