AdEMAMix

class bitsandbytes.optim.AdEMAMix

( params: typing.Iterable[torch.nn.parameter.Parameter]lr: float = 0.001betas: typing.Tuple[float, float, float] = (0.9, 0.999, 0.9999)alpha: float = 5.0t_alpha: typing.Optional[int] = Nonet_beta3: typing.Optional[int] = Noneeps: float = 1e-08weight_decay: float = 0.01optim_bits: typing.Literal[8, 32] = 32min_8bit_size: int = 4096is_paged: bool = False )

init

< source >

( params: typing.Iterable[torch.nn.parameter.Parameter]lr: float = 0.001betas: typing.Tuple[float, float, float] = (0.9, 0.999, 0.9999)alpha: float = 5.0t_alpha: typing.Optional[int] = Nonet_beta3: typing.Optional[int] = Noneeps: float = 1e-08weight_decay: float = 0.01optim_bits: typing.Literal[8, 32] = 32min_8bit_size: int = 4096is_paged: bool = False )

class bitsandbytes.optim.AdEMAMix8bit

< source >

( params: typing.Iterable[torch.nn.parameter.Parameter]lr: float = 0.001betas: typing.Tuple[float, float, float] = (0.9, 0.999, 0.9999)alpha: float = 5.0t_alpha: typing.Optional[int] = Nonet_beta3: typing.Optional[int] = Noneeps: float = 1e-08weight_decay: float = 0.01min_8bit_size: int = 4096is_paged: bool = False )

init

< source >

( params: typing.Iterable[torch.nn.parameter.Parameter]lr: float = 0.001betas: typing.Tuple[float, float, float] = (0.9, 0.999, 0.9999)alpha: float = 5.0t_alpha: typing.Optional[int] = Nonet_beta3: typing.Optional[int] = Noneeps: float = 1e-08weight_decay: float = 0.01min_8bit_size: int = 4096is_paged: bool = False )

class bitsandbytes.optim.AdEMAMix32bit

< source >

( params: typing.Iterable[torch.nn.parameter.Parameter]lr: float = 0.001betas: typing.Tuple[float, float, float] = (0.9, 0.999, 0.9999)alpha: float = 5.0t_alpha: typing.Optional[int] = Nonet_beta3: typing.Optional[int] = Noneeps: float = 1e-08weight_decay: float = 0.01min_8bit_size: int = 4096is_paged: bool = False )

init

< source >

( params: typing.Iterable[torch.nn.parameter.Parameter]lr: float = 0.001betas: typing.Tuple[float, float, float] = (0.9, 0.999, 0.9999)alpha: float = 5.0t_alpha: typing.Optional[int] = Nonet_beta3: typing.Optional[int] = Noneeps: float = 1e-08weight_decay: float = 0.01min_8bit_size: int = 4096is_paged: bool = False )

class bitsandbytes.optim.PagedAdEMAMix

< source >

( params: typing.Iterable[torch.nn.parameter.Parameter]lr: float = 0.001betas: typing.Tuple[float, float, float] = (0.9, 0.999, 0.9999)alpha: float = 5.0t_alpha: typing.Optional[int] = Nonet_beta3: typing.Optional[int] = Noneeps: float = 1e-08weight_decay: float = 0.01optim_bits: typing.Literal[8, 32] = 32min_8bit_size: int = 4096 )

init

< source >

( params: typing.Iterable[torch.nn.parameter.Parameter]lr: float = 0.001betas: typing.Tuple[float, float, float] = (0.9, 0.999, 0.9999)alpha: float = 5.0t_alpha: typing.Optional[int] = Nonet_beta3: typing.Optional[int] = Noneeps: float = 1e-08weight_decay: float = 0.01optim_bits: typing.Literal[8, 32] = 32min_8bit_size: int = 4096 )

class bitsandbytes.optim.PagedAdEMAMix8bit

< source >

( params: typing.Iterable[torch.nn.parameter.Parameter]lr: float = 0.001betas: typing.Tuple[float, float, float] = (0.9, 0.999, 0.9999)alpha: float = 5.0t_alpha: typing.Optional[int] = Nonet_beta3: typing.Optional[int] = Noneeps: float = 1e-08weight_decay: float = 0.01min_8bit_size: int = 4096 )

init

< source >

( params: typing.Iterable[torch.nn.parameter.Parameter]lr: float = 0.001betas: typing.Tuple[float, float, float] = (0.9, 0.999, 0.9999)alpha: float = 5.0t_alpha: typing.Optional[int] = Nonet_beta3: typing.Optional[int] = Noneeps: float = 1e-08weight_decay: float = 0.01min_8bit_size: int = 4096 )

class bitsandbytes.optim.PagedAdEMAMix32bit

< source >

( params: typing.Iterable[torch.nn.parameter.Parameter]lr: float = 0.001betas: typing.Tuple[float, float, float] = (0.9, 0.999, 0.9999)alpha: float = 5.0t_alpha: typing.Optional[int] = Nonet_beta3: typing.Optional[int] = Noneeps: float = 1e-08weight_decay: float = 0.01min_8bit_size: int = 4096 )

init

< source >

( params: typing.Iterable[torch.nn.parameter.Parameter]lr: float = 0.001betas: typing.Tuple[float, float, float] = (0.9, 0.999, 0.9999)alpha: float = 5.0t_alpha: typing.Optional[int] = Nonet_beta3: typing.Optional[int] = Noneeps: float = 1e-08weight_decay: float = 0.01min_8bit_size: int = 4096 )

Bitsandbytes

AdEMAMix

AdEMAMix

class bitsandbytes.optim.AdEMAMix

__init__

AdEMAMix8bit

class bitsandbytes.optim.AdEMAMix8bit

__init__

AdEMAMix32bit

class bitsandbytes.optim.AdEMAMix32bit

__init__

PagedAdEMAMix

class bitsandbytes.optim.PagedAdEMAMix

__init__

PagedAdEMAMix8bit

class bitsandbytes.optim.PagedAdEMAMix8bit

__init__

PagedAdEMAMix32bit

class bitsandbytes.optim.PagedAdEMAMix32bit

__init__

init

init

init

init

init

init