Added support for overriding tensor buffer types #2007

zpin · 2025-04-29T14:15:51Z

Equivalent to the -ot llama.cpp argument:

{"--override-tensor", "-ot"}, "<tensor name pattern>=<buffer type>,...",

Can be passed as an optionlal string to the Llama class using the new override_tensor parameter. Same format as the argument above.

Provides more control over how memory is used, letting you selectively place specific tensors on different devices, especially helpful when running large MOE models.

zpin added 2 commits April 29, 2025 16:01

Added support for overriding tensor buffer types

b13e0bc

Only apply override_tensor when non-empty

a5523bd

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Added support for overriding tensor buffer types #2007

Added support for overriding tensor buffer types #2007

zpin commented Apr 29, 2025

Added support for overriding tensor buffer types #2007

Are you sure you want to change the base?

Added support for overriding tensor buffer types #2007

Conversation

zpin commented Apr 29, 2025