Temporary fix for is_cross_encoder

noooop · noooop · commit 2d11141cf3ee · 2025-06-20T10:02:37.000+08:00
diff --git a/examples/offline_inference/convert_model_to_seq_cls.py b/examples/offline_inference/convert_model_to_seq_cls.py
@@ -13,15 +13,14 @@
 # python convert_model_to_seq_cls.py --model_name Qwen/Qwen3-Reranker-0.6B --classifier_from_tokens '["no", "yes"]' --method from_2_way_softmax --path ./Qwen3-Reranker-0.6B-seq-cls
 # for BAAI/bge-reranker-v2-gemma
 # python convert_model_to_seq_cls.py --model_name BAAI/bge-reranker-v2-gemma --classifier_from_tokens '["Yes"]' --method no_post_processing --path ./bge-reranker-v2-gemma-seq-cls
+# Caution: "Yes" and "yes" are two different tokens
 
 
 def from_2_way_softmax(
     causal_lm, seq_cls_model, tokenizer, classifier_from_tokens, device
 ):
     # for Qwen3-Reranker
     # Adapted from https://huggingface.co/Qwen/Qwen3-Reranker-0.6B/discussions/3
-    assert len(classifier_from_tokens) == 2
-
     lm_head_weights = causal_lm.lm_head.weight
 
     a = tokenizer.convert_tokens_to_ids(classifier_from_tokens[0])
@@ -62,13 +61,22 @@ def converting(
 ):
     assert method in method_map
 
+    if method == "from_2_way_softmax":
+        assert len(classifier_from_tokens) == 2
+        num_labels = 1
+    else:
+        num_labels = len(classifier_from_tokens)
+
     tokenizer = transformers.AutoTokenizer.from_pretrained(model_name)
     causal_lm = transformers.AutoModelForCausalLM.from_pretrained(
         model_name, device_map=device
     )
 
     seq_cls_model = transformers.AutoModelForSequenceClassification.from_pretrained(
-        model_name, num_labels=1, ignore_mismatched_sizes=True, device_map=device
+        model_name,
+        num_labels=num_labels,
+        ignore_mismatched_sizes=True,
+        device_map=device,
     )
 
     method_map[method](
diff --git a/vllm/config.py b/vllm/config.py
@@ -1400,7 +1400,9 @@ def is_multimodal_model(self) -> bool:
 
     @property
     def is_cross_encoder(self) -> bool:
-        return self.registry.is_cross_encoder_model(self.architectures)
+        # Temporary solution, See #19675
+        return (self.registry.is_cross_encoder_model(self.architectures) or
+                "forsequenceclassification" in self.architectures[0].lower())
 
     @property
     def use_mla(self) -> bool:
diff --git a/vllm/model_executor/models/registry.py b/vllm/model_executor/models/registry.py
@@ -510,8 +510,7 @@ def is_cross_encoder_model(
         architectures: Union[str, list[str]],
     ) -> bool:
         model_cls, _ = self.inspect_model_cls(architectures)
-        #return model_cls.supports_cross_encoding
-        return True
+        return model_cls.supports_cross_encoding
 
     def is_multimodal_model(
         self,