手機站首頁散文詩歌雜文隨筆日記小小說

散文網(wǎng) » 筆記 »全部筆記 » 【莫煩Python】強化學習 Reinforcement Learning

【莫煩Python】強化學習 Reinforcement Learning

2023-02-05 20:25 作者:嘻嘻000001 0人讀過 | 我要投稿

幾種算法

不斷嘗試達到目標

import numpy as np

import pandas as pd

class qlearning_table:

def__init__(self,actions,learning_rate=0.01,reward_decay=0.9,e_greedy=0.9)

self.actions=actions

self.lr=learning_rate

self.gamma=reward_decay

self.epsilon=e_greedy

self.q_table=pd.DataFrame(columns=self.actions)

def choose_action(self,observation):

self.check_state_exist(observation)

#choose action selection

np.random.uniform()<self.epsilon:

#choose best action

state_action=self.q_table.ix[observation,:]

state_action=state_action.reindex(np.random.permutation(state_action.index))

action=state_action.argmax()

else:

action=np.random.choice(self.action)

return action

def learn(self,s,a,r,s_):

self.check_state_exist(s_)

q_predict=self.q_table.ix[s,a]

if s_ !='terminal':

q_target=r+self.gamma*self.q_table

else:

q_target=r#next state is terminal

self.q_table.ix[s,a]+=self.lr*(q_target-q_predict)#update

def check_state_exist(self,state):

if state not in self.q_table.append(

pd.Series(

[0]*len(self.action),

index=self.q_table.columns,

name=state,))

def check_state_exist(self,state):

標簽：

【莫煩Python】強化學習 Reinforcement Learning的評論 (共條)

愛情散文傷感散文哲理散文優(yōu)美生活隨筆親情唯美句子傷感的句子現(xiàn)代詩歌空間日志經典語句愛情句子作文大全

无码av一区二区三区无码,在线观看老湿视频福利,日韩经典三级片,成人色网站欧美大片在线观看

【莫煩Python】強化學習 Reinforcement Learning

【莫煩Python】強化學習 Reinforcement Learning的評論 (共條)

你可能也喜歡這些文章

最新發(fā)布的文章

无码av一区二区三区无码,在线观看老湿视频福利,日韩经典三级片,成 人色 网 站 欧美大片在线观看

【莫煩Python】強化學習 Reinforcement Learning

本文作者的其他文章

【莫煩Python】強化學習 Reinforcement Learning的評論 (共 條)

你可能也喜歡這些文章

最新發(fā)布的文章

无码av一区二区三区无码,在线观看老湿视频福利,日韩经典三级片,成人色网站欧美大片在线观看

【莫煩Python】強化學習 Reinforcement Learning的評論 (共條)