scope_rl.policy.head.OnlineHead#

class scope_rl.policy.head.OnlineHead(base_policy, name)[source]#

Class to enable online interaction.

Bases: scope_rl.policy.BaseHead

Imported as: scope_rl.policy.OnlineHead

Note

This class aims to make a d3rlpy’s policy an instance of BaseHead.

Note

To ensure API compatibility with d3rlpy, BaseHead inherits d3rlpy.algos.QLearningAlgoBase. This base class also has additional methods including fit, predict, and predict_value. Please also refer to the following documentation for the methods that are not described in this API reference.

Parameters:

base_policy (QLearningAlgoBase) – Reinforcement learning (RL) policy.
name (str) – Name of the policy.

Methods

`calc_action_choice_probability`(x)	Only for API consistency.
`calc_pscore_given_action`(x, action)	Only for API consistency.
`sample_action_and_output_pscore`(x)	Only for API consistency.

sample_action_and_output_pscore(x)[source]#

Only for API consistency.

calc_action_choice_probability(x)[source]#

Only for API consistency.

calc_pscore_given_action(x, action)[source]#

Only for API consistency.

Methods,