Interface LoadModelConfig

interface LoadModelConfig {
    cache_type_k?:
        | "f32"
        | "f16"
        | "q8_0"
        | "q5_1"
        | "q5_0"
        | "q4_1"
        | "q4_0";
    cache_type_v?: "f32"
    | "f16"
    | "q8_0"
    | "q5_1"
    | "q5_0"
    | "q4_1"
    | "q4_0";
    embeddings?: boolean;
    n_batch?: number;
    n_ctx?: number;
    n_threads?: number;
    offload_kqv?: boolean;
    pooling_type?:
        | "LLAMA_POOLING_TYPE_UNSPECIFIED"
        | "LLAMA_POOLING_TYPE_NONE"
        | "LLAMA_POOLING_TYPE_MEAN"
        | "LLAMA_POOLING_TYPE_CLS";
    rope_freq_base?: number;
    rope_freq_scale?: number;
    rope_scaling_type?: | "LLAMA_ROPE_SCALING_TYPE_UNSPECIFIED"
    | "LLAMA_ROPE_SCALING_TYPE_NONE"
    | "LLAMA_ROPE_SCALING_TYPE_LINEAR"
    | "LLAMA_ROPE_SCALING_TYPE_YARN";
    seed?: number;
    yarn_attn_factor?: number;
    yarn_beta_fast?: number;
    yarn_beta_slow?: number;
    yarn_ext_factor?: number;
    yarn_orig_ctx?: number;
}

Index

Properties

cache_type_k? cache_type_v? embeddings? n_batch? n_ctx? n_threads? offload_kqv? pooling_type? rope_freq_base? rope_freq_scale? rope_scaling_type? seed? yarn_attn_factor? yarn_beta_fast? yarn_beta_slow? yarn_ext_factor? yarn_orig_ctx?

Properties

`Optional`cache_type_k

cache_type_k?: "f32" | "f16" | "q8_0" | "q5_1" | "q5_0" | "q4_1" | "q4_0"

`Optional`cache_type_v

cache_type_v?: "f32" | "f16" | "q8_0" | "q5_1" | "q5_0" | "q4_1" | "q4_0"

`Optional`embeddings

embeddings?: boolean

`Optional`n_batch

n_batch?: number

`Optional`n_ctx

n_ctx?: number

`Optional`n_threads

n_threads?: number

`Optional`offload_kqv

offload_kqv?: boolean

`Optional`pooling_type

pooling_type?:
    | "LLAMA_POOLING_TYPE_UNSPECIFIED"
    | "LLAMA_POOLING_TYPE_NONE"
    | "LLAMA_POOLING_TYPE_MEAN"
    | "LLAMA_POOLING_TYPE_CLS"

`Optional`rope_freq_base

rope_freq_base?: number

`Optional`rope_freq_scale

rope_freq_scale?: number

`Optional`rope_scaling_type

rope_scaling_type?:
    | "LLAMA_ROPE_SCALING_TYPE_UNSPECIFIED"
    | "LLAMA_ROPE_SCALING_TYPE_NONE"
    | "LLAMA_ROPE_SCALING_TYPE_LINEAR"
    | "LLAMA_ROPE_SCALING_TYPE_YARN"

`Optional`seed

seed?: number

`Optional`yarn_attn_factor

yarn_attn_factor?: number

`Optional`yarn_beta_fast

yarn_beta_fast?: number

`Optional`yarn_beta_slow

yarn_beta_slow?: number

`Optional`yarn_ext_factor

yarn_ext_factor?: number

`Optional`yarn_orig_ctx

yarn_orig_ctx?: number

Interface LoadModelConfig

Index

Properties

Properties

`Optional`cache_type_k

`Optional`cache_type_v

`Optional`embeddings

`Optional`n_batch

`Optional`n_ctx

`Optional`n_threads

`Optional`offload_kqv

`Optional`pooling_type

`Optional`rope_freq_base

`Optional`rope_freq_scale

`Optional`rope_scaling_type

`Optional`seed

`Optional`yarn_attn_factor

`Optional`yarn_beta_fast

`Optional`yarn_beta_slow

`Optional`yarn_ext_factor

`Optional`yarn_orig_ctx

Settings

On This Page

Interface LoadModelConfig

Index

Properties

Properties

Optionalcache_type_k

Optionalcache_type_v

Optionalembeddings

Optionaln_batch

Optionaln_ctx

Optionaln_threads

Optionaloffload_kqv

Optionalpooling_type

Optionalrope_freq_base

Optionalrope_freq_scale

Optionalrope_scaling_type

Optionalseed

Optionalyarn_attn_factor

Optionalyarn_beta_fast

Optionalyarn_beta_slow

Optionalyarn_ext_factor

Optionalyarn_orig_ctx

Settings

On This Page

`Optional`cache_type_k

`Optional`cache_type_v

`Optional`embeddings

`Optional`n_batch

`Optional`n_ctx

`Optional`n_threads

`Optional`offload_kqv

`Optional`pooling_type

`Optional`rope_freq_base

`Optional`rope_freq_scale

`Optional`rope_scaling_type

`Optional`seed

`Optional`yarn_attn_factor

`Optional`yarn_beta_fast

`Optional`yarn_beta_slow

`Optional`yarn_ext_factor

`Optional`yarn_orig_ctx