The Future is Sparse

Embedding Compression for Scalable Retrieval in Recommender Systems

Recommender systems embeddings are growing. Sparsity is here to help.

Our learnable sparse compression algorithm, CompresSAE, achieves a superior compression-retrieval accuracy trade-off, outperforming equally sized Matryoshka embeddings and approaching uncompressed embedding performance with 12× fewer parameters.

Model Architecture (CompresSAE)

CompresSAE is a sparse autoencoder (SAE) that maps dense embeddings into high-dimensional, sparsely activated vectors optimized for fast similarity search.

Two inference modes allow a trade-off between latency and accuracy: fast retrieval computes similarity in the sparse compressed space, while high-accuracy retrieval uses similarity in the dense reconstructed space.

See model.py for implementation.

License

MIT License

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
assets		assets
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
model.py		model.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

The Future is Sparse

Embedding Compression for Scalable Retrieval in Recommender Systems

Model Architecture (CompresSAE)

License

About

Uh oh!

Releases

Packages

Contributors 2

Uh oh!

Languages

License

recombee/CompresSAE

Folders and files

Latest commit

History

Repository files navigation

The Future is Sparse

Embedding Compression for Scalable Retrieval in Recommender Systems

Model Architecture (CompresSAE)

License

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

Packages