offlax.cql#

Functions

sample(trajectories, rng, batch_size)

Classes

CQLDiscrete(rng, actor, critic, state_dims, …)

Implementation of Conservative Q Learning (CQL) algorithm.

class offlax.cql.CQLDiscrete(rng, actor, critic, state_dims, action_dims, gamma, tau)[source]#

Bases: object

Implementation of Conservative Q Learning (CQL) algorithm.

Parameters

get_search_metric()[source]#

Returns the search metric for hyperparameter tuning

Offlax Docs