qwen3 tokenizer convert fail #21242

pass-lin · 2025-05-02T15:55:38Z

I'm adding Qwen3's implementation to Keras_hub, and now I'm encountering a problem.

The tokenizer of qwen3 and qwen2 is the same. But we can't convert it directly with keras_hub. What's the reason for this? How can we solve it?

from keras_hub.tokenizers import Qwen2Tokenizer
Qwen2Tokenizer.from_preset("hf://Qwen/Qwen2.5-0.5B")
’‘’
<QwenTokenizer name=qwen_tokenizer_5, built=False>
‘’‘
Qwen2Tokenizer.from_preset("hf://Qwen/Qwen2.5-0.6B")
'''
InvalidArgumentError: {{function_node __wrapped__LookupTableImportV2_device_/job:localhost/replica:0/task:0/device:CPU:0}} Expected shape [151387,2] for value, got [151387] [Op:LookupTableImportV2] name:
'''

We can't achieve qwen3 without solving this problem.

github-actions bot assigned mehtamansi29 May 2, 2025

pass-lin closed this as completed May 2, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

qwen3 tokenizer convert fail #21242

qwen3 tokenizer convert fail #21242

pass-lin commented May 2, 2025 •

edited

Loading

qwen3 tokenizer convert fail #21242

qwen3 tokenizer convert fail #21242

Comments

pass-lin commented May 2, 2025 • edited Loading

pass-lin commented May 2, 2025 •

edited

Loading