Index

A | B | C | D | E | F | G | L | M | N | O | P | R | S | T | U | V | W

A

add() (scope_rl.utils.MultipleInputDict method), [1]
- (scope_rl.utils.MultipleLoggedDataset method), [1]

B

BasicEnv (class in basicgym.envs.synthetic), [1]
basicgym.envs.simulator.base
- module
basicgym.envs.simulator.function
- module
basicgym.envs.synthetic
- module
Bidder (class in rtbgym.envs.simulator.bidder), [1]
build_and_fit_FQE() (scope_rl.ope.input.CreateOPEInput method), [1]
build_and_fit_state_action_dual_model() (scope_rl.ope.input.CreateOPEInput method), [1]
build_and_fit_state_action_value_model() (scope_rl.ope.input.CreateOPEInput method), [1]
build_and_fit_state_action_weight_model() (scope_rl.ope.input.CreateOPEInput method), [1]
build_and_fit_state_dual_model() (scope_rl.ope.input.CreateOPEInput method), [1]
build_and_fit_state_value_model() (scope_rl.ope.input.CreateOPEInput method), [1]
build_and_fit_state_weight_model() (scope_rl.ope.input.CreateOPEInput method), [1]

C

D

E

F

fit() (scope_rl.ope.weight_value_learning.augmented_lagrangian_learning_continuous.ContinuousDiceStateActionWightValueLearning method), [1]

G

get() (scope_rl.utils.MultipleInputDict method), [1]
- (scope_rl.utils.MultipleLoggedDataset method), [1]

L

M

N

n_eval_policies (scope_rl.utils.MultipleInputDict property), [1]

O

P

R

RECEnv (class in recgym.envs.rec), [1]
recgym.envs.rec
- module
recgym.envs.simulator.base
- module
recgym.envs.simulator.function
- module
reset() (basicgym.envs.synthetic.BasicEnv method), [1]
reward_function() (recgym.envs.simulator.base.BaseUserModel method), [1]
- (recgym.envs.simulator.function.UserModel method), [1]
RewardFunction (class in basicgym.envs.simulator.function), [1]
rollout_policy_online() (in module scope_rl.ope.online), [1]
RTBEnv (class in rtbgym.envs.rtb), [1]
rtbgym.envs.rtb
- module

rtbgym.envs.simulator.base
- module
rtbgym.envs.simulator.bidder
- module
rtbgym.envs.simulator.function
- module
rtbgym.envs.simulator.rtb_synthetic
- module
rtbgym.envs.wrapper_rtb
- module
rtbgym.utils
- module
RTBSyntheticSimulator (class in rtbgym.envs.simulator.rtb_synthetic), [1]
RTBSyntheticSimulator.ClickThroughRate (class in rtbgym.envs.simulator.rtb_synthetic), [1]
RTBSyntheticSimulator.ConversionRate (class in rtbgym.envs.simulator.rtb_synthetic), [1]
RTBSyntheticSimulator.WinningPriceDistribution (class in rtbgym.envs.simulator.rtb_synthetic), [1]

S

sample() (rtbgym.utils.NormalDistribution method), [1]
sample_action_and_output_pscore() (scope_rl.policy.head.BaseHead method), [1]
- (scope_rl.policy.head.ContinuousEvalHead method), [1]
- (scope_rl.policy.head.EpsilonGreedyHead method), [1]
- (scope_rl.policy.head.GaussianHead method), [1]
- (scope_rl.policy.head.OnlineHead method), [1]
- (scope_rl.policy.head.SoftmaxHead method), [1]
- (scope_rl.policy.head.TruncatedGaussianHead method), [1]
sample_action_and_output_pscore_online() (scope_rl.policy.head.BaseHead method), [1]
sample_action_online() (scope_rl.policy.head.BaseHead method), [1]
sample_outcome() (rtbgym.envs.simulator.base.BaseClickAndConversionRate method), [1]
- (rtbgym.envs.simulator.base.BaseWinningPriceDistribution method), [1]
- (rtbgym.envs.simulator.function.ClickThroughRate method), [1]
- (rtbgym.envs.simulator.function.ConversionRate method), [1]
- (rtbgym.envs.simulator.function.WinningPriceDistribution method), [1]
- (rtbgym.envs.simulator.rtb_synthetic.RTBSyntheticSimulator.ClickThroughRate method), [1]
- (rtbgym.envs.simulator.rtb_synthetic.RTBSyntheticSimulator.ConversionRate method), [1]
- (rtbgym.envs.simulator.rtb_synthetic.RTBSyntheticSimulator.WinningPriceDistribution method), [1]
sample_reward() (basicgym.envs.simulator.base.BaseRewardFunction method), [1]
- (basicgym.envs.simulator.function.RewardFunction method)
save() (scope_rl.ope.weight_value_learning.augmented_lagrangian_learning_continuous.ContinuousDiceStateActionWightValueLearning method), [1]
- (scope_rl.ope.weight_value_learning.augmented_lagrangian_learning_continuous.ContinuousDiceStateWightValueLearning method), [1]
- (scope_rl.ope.weight_value_learning.augmented_lagrangian_learning_discrete.DiscreteDiceStateActionWightValueLearning method), [1]
- (scope_rl.ope.weight_value_learning.augmented_lagrangian_learning_discrete.DiscreteDiceStateWightValueLearning method), [1]
- (scope_rl.ope.weight_value_learning.base.BaseWeightValueLearner method), [1]
- (scope_rl.ope.weight_value_learning.minimax_value_learning_continuous.ContinuousMinimaxStateActionValueLearning method), [1]
- (scope_rl.ope.weight_value_learning.minimax_value_learning_continuous.ContinuousMinimaxStateValueLearning method), [1]
- (scope_rl.ope.weight_value_learning.minimax_value_learning_discrete.DiscreteMinimaxStateActionValueLearning method), [1]
- (scope_rl.ope.weight_value_learning.minimax_value_learning_discrete.DiscreteMinimaxStateValueLearning method), [1]
- (scope_rl.ope.weight_value_learning.minimax_weight_learning_continuous.ContinuousMinimaxStateActionWeightLearning method), [1]
- (scope_rl.ope.weight_value_learning.minimax_weight_learning_continuous.ContinuousMinimaxStateWeightLearning method), [1]
- (scope_rl.ope.weight_value_learning.minimax_weight_learning_discrete.DiscreteMinimaxStateActionWeightLearning method), [1]
- (scope_rl.ope.weight_value_learning.minimax_weight_learning_discrete.DiscreteMinimaxStateWeightLearning method), [1]
scope_rl.dataset.base
- module
scope_rl.dataset.synthetic
- module
scope_rl.ope.continuous.basic_estimators
- module
scope_rl.ope.continuous.cumulative_distribution_estimators
- module
scope_rl.ope.continuous.marginal_estimators
- module
scope_rl.ope.discrete.basic_estimators
- module
scope_rl.ope.discrete.cumulative_distribution_estimators
- module
scope_rl.ope.discrete.marginal_estimators
- module
scope_rl.ope.estimators_base
- module
scope_rl.ope.input
- module
scope_rl.ope.online
- module
scope_rl.ope.ope
- module
scope_rl.ope.ops
- module
scope_rl.ope.weight_value_learning.augmented_lagrangian_learning_continuous
- module

scope_rl.ope.weight_value_learning.augmented_lagrangian_learning_discrete
- module
scope_rl.ope.weight_value_learning.base
- module
scope_rl.ope.weight_value_learning.function
- module
scope_rl.ope.weight_value_learning.minimax_value_learning_continuous
- module
scope_rl.ope.weight_value_learning.minimax_value_learning_discrete
- module
scope_rl.ope.weight_value_learning.minimax_weight_learning_continuous
- module
scope_rl.ope.weight_value_learning.minimax_weight_learning_discrete
- module
scope_rl.policy.head
- module
scope_rl.policy.orl
- module
scope_rl.utils
- module
select_by_conditional_value_at_risk() (scope_rl.ope.ops.OffPolicySelection method), [1]
select_by_lower_quartile() (scope_rl.ope.ops.OffPolicySelection method), [1]
select_by_policy_value() (scope_rl.ope.ops.OffPolicySelection method), [1]
select_by_policy_value_lower_bound() (scope_rl.ope.ops.OffPolicySelection method), [1]
select_by_policy_value_via_cumulative_distribution_ope() (scope_rl.ope.ops.OffPolicySelection method), [1]
SelfNormalizedDR (class in scope_rl.ope.continuous.basic_estimators), [1]
- (class in scope_rl.ope.discrete.basic_estimators), [1]
SelfNormalizedPDIS (class in scope_rl.ope.continuous.basic_estimators), [1]
- (class in scope_rl.ope.discrete.basic_estimators), [1]
SelfNormalizedTIS (class in scope_rl.ope.continuous.basic_estimators), [1]
- (class in scope_rl.ope.discrete.basic_estimators), [1]
sigmoid() (in module rtbgym.utils), [1]
SoftmaxHead (class in scope_rl.policy.head), [1]
StateActionMarginalDR (class in scope_rl.ope.continuous.marginal_estimators), [1]
- (class in scope_rl.ope.discrete.marginal_estimators), [1]
StateActionMarginalIS (class in scope_rl.ope.continuous.marginal_estimators), [1]
- (class in scope_rl.ope.discrete.marginal_estimators), [1]
StateActionMarginalSNDR (class in scope_rl.ope.continuous.marginal_estimators), [1]
- (class in scope_rl.ope.discrete.marginal_estimators), [1]
StateActionMarginalSNIS (class in scope_rl.ope.continuous.marginal_estimators), [1]
- (class in scope_rl.ope.discrete.marginal_estimators), [1]
StateMarginalDM (class in scope_rl.ope.continuous.marginal_estimators), [1]
- (class in scope_rl.ope.discrete.marginal_estimators), [1]
StateMarginalDR (class in scope_rl.ope.continuous.marginal_estimators), [1]
- (class in scope_rl.ope.discrete.marginal_estimators), [1]
StateMarginalIS (class in scope_rl.ope.continuous.marginal_estimators), [1]
- (class in scope_rl.ope.discrete.marginal_estimators), [1]
StateMarginalSNDR (class in scope_rl.ope.continuous.marginal_estimators), [1]
- (class in scope_rl.ope.discrete.marginal_estimators), [1]
StateMarginalSNIS (class in scope_rl.ope.continuous.marginal_estimators), [1]
- (class in scope_rl.ope.discrete.marginal_estimators), [1]
StateTransitionFunction (class in basicgym.envs.simulator.function), [1]
StateWeightFunction (class in scope_rl.ope.weight_value_learning.function), [1]
step() (basicgym.envs.simulator.base.BaseStateTransitionFunction method), [1]
- (basicgym.envs.simulator.function.StateTransitionFunction method), [1]
- (basicgym.envs.synthetic.BasicEnv method), [1]
- (recgym.envs.rec.RECEnv method), [1]
- (rtbgym.envs.rtb.RTBEnv method), [1]
- (rtbgym.envs.wrapper_rtb.CustomizedRTBEnv method), [1]
summarize_off_policy_estimates() (scope_rl.ope.ope.OffPolicyEvaluation method), [1]
SyntheticDataset (class in scope_rl.dataset.synthetic), [1]

T

U

V

W

WinningPriceDistribution (class in rtbgym.envs.simulator.function), [1]