Merge pull request #4915 from zhyhang/feat/some-ehance-202504

sestinj · web-flow · commit ddafcab796c4 · 2025-04-02T19:10:24.000-07:00
add google gemini-2.5-pro-exp-03-25 and others; lift siliconflow to reranker model provider
diff --git a/core/context/allRerankers.ts b/core/context/allRerankers.ts
@@ -3,6 +3,7 @@ import Cohere from "../llm/llms/Cohere";
 import FreeTrial from "../llm/llms/FreeTrial";
 import HuggingFaceTEI from "../llm/llms/HuggingFaceTEI";
 import { LLMReranker } from "../llm/llms/llm";
+import SiliconFlow from "../llm/llms/SiliconFlow";
 import ContinueProxy from "../llm/llms/stubs/ContinueProxy";
 import Voyage from "../llm/llms/Voyage";
 import WatsonX from "../llm/llms/WatsonX";
@@ -16,4 +17,5 @@ export const AllRerankers: { [key: string]: any } = {
   "free-trial": FreeTrial,
   "huggingface-tei": HuggingFaceTEI,
   "continue-proxy": ContinueProxy,
+  siliconflow: SiliconFlow,
 };
diff --git a/core/llm/llms/SiliconFlow.ts b/core/llm/llms/SiliconFlow.ts
@@ -1,4 +1,4 @@
-import { CompletionOptions, LLMOptions } from "../../index.js";
+import { Chunk, CompletionOptions, LLMOptions } from "../../index.js";
 import { streamSse } from "../stream.js";
 import { osModelsEditPrompt } from "../templates/edit.js";
 
@@ -52,6 +52,41 @@ class SiliconFlow extends OpenAI {
       yield chunk.choices[0].text;
     }
   }
+
+  async rerank(query: string, chunks: Chunk[]): Promise<number[]> {
+    if (!query || query.trim() === "") {
+      console.warn("[SiliconFlow] rerank: query is empty");
+      return [];
+    }
+    
+    if (!chunks || chunks.length === 0) {
+      console.warn("[SiliconFlow] rerank: chunks is empty");
+      return [];
+    }
+
+    const endpoint = new URL("rerank", this.apiBase);
+    const resp = await this.fetch(endpoint, {
+      method: "POST",
+      headers: {
+        "Content-Type": "application/json",
+        Accept: "application/json",
+        Authorization: `Bearer ${this.apiKey}`,
+      },
+      body: JSON.stringify({
+        model: this.model,
+        query,
+        documents: chunks.map((chunk) => chunk.content),
+      }),
+    });
+
+    if (!resp.ok) {
+      throw new Error(await resp.text());
+    }
+
+    const data = (await resp.json()) as any;
+    const results = data.results.sort((a: any, b: any) => a.index - b.index);
+    return results.map((result: any) => result.relevance_score);
+  }
 }
 
 export default SiliconFlow;
diff --git a/extensions/vscode/config_schema.json b/extensions/vscode/config_schema.json
@@ -956,7 +956,10 @@
                   "gemini-2.0-flash",
                   "gemini-2.0-flash-thinking-exp-01-21",
                   "gemini-2.0-pro-exp-02-05",
-                  "gemini-2.0-flash-lite-preview-02-05"
+                  "gemini-2.0-flash-lite-preview-02-05",
+                  "gemini-2.0-flash-lite",
+                  "gemini-2.0-flash-exp-image-generation",
+                  "gemini-2.5-pro-exp-03-25"
                 ]
               }
             }
@@ -2886,7 +2889,8 @@
                 "watsonx",
                 "llm",
                 "free-trial",
-                "huggingface-tei"
+                "huggingface-tei",
+                "siliconflow"
               ]
             },
             "params": {
@@ -3053,6 +3057,40 @@
                   "required": ["truncation_direction"]
                 }
               }
+            },
+            {
+              "if": {
+                "properties": {
+                  "name": {
+                    "enum": ["siliconflow"]
+                  }
+                },
+                "required": ["name"]
+              },
+              "then": {
+                "properties": {
+                  "params": {
+                    "type": "object",
+                    "properties": {
+                      "model": {
+                        "enum": [
+                          "BAAI/bge-reranker-v2-m3",
+                          "netease-youdao/bce-reranker-base_v1",
+                          "Pro/BAAI/bge-reranker-v2-m3"
+                        ],
+                        "default": "BAAI/bge-reranker-v2-m3"
+                      },
+                      "apiBase": {
+                        "type": "string"
+                      },
+                      "apiKey": {
+                        "type": "string"
+                      }
+                    },
+                    "required": ["apiKey"]
+                  }
+                }
+              }
             }
           ]
         },
diff --git a/gui/src/pages/AddNewModel/configs/models.ts b/gui/src/pages/AddNewModel/configs/models.ts
@@ -887,6 +887,48 @@ export const models: { [key: string]: ModelPackage } = {
     providerOptions: ["gemini"],
     isOpenSource: false,
   },
+  gemini20FlashLite: {
+    title: "Gemini 2.0 Flash Lite",
+    description:
+      "A more efficient version of Gemini 2.0 Flash optimized for faster responses and lower resource usage.",
+    params: {
+      title: "Gemini 2.0 Flash Lite",
+      model: "gemini-2.0-flash-lite",
+      contextLength: 1_048_576,
+      apiKey: "<API_KEY>",
+    },
+    icon: "gemini.png",
+    providerOptions: ["gemini"],
+    isOpenSource: false,
+  },
+  gemini20FlashImageGeneration: {
+    title: "Gemini 2.0 Flash Image Generation",
+    description:
+      "A version of Gemini 2.0 Flash optimized for image generation capabilities.",
+    params: {
+      title: "Gemini 2.0 Flash Image Generation",
+      model: "gemini-2.0-flash-exp-image-generation",
+      contextLength: 32_768,
+      apiKey: "<API_KEY>",
+    },
+    icon: "gemini.png",
+    providerOptions: ["gemini"],
+    isOpenSource: false,
+  },
+  gemini25ProExp: {
+    title: "Gemini 2.5 Pro Experimental",
+    description:
+      "Experimental version of Gemini 2.5 Pro with enhanced capabilities and larger output limits.",
+    params: {
+      title: "Gemini 2.5 Pro Experimental",
+      model: "gemini-2.5-pro-exp-03-25",
+      contextLength: 1_048_576,
+      apiKey: "<API_KEY>",
+    },
+    icon: "gemini.png",
+    providerOptions: ["gemini"],
+    isOpenSource: false,
+  },
   commandR: {
     title: "Command R",
     description:
diff --git a/gui/src/pages/AddNewModel/configs/providers.ts b/gui/src/pages/AddNewModel/configs/providers.ts
@@ -495,6 +495,9 @@ Select the \`GPT-4o\` model below to complete your provider configuration, but n
     ],
     packages: [
       models.gemini20Flash,
+      models.gemini20FlashLite,
+      models.gemini20FlashImageGeneration,
+      models.gemini25ProExp,
       models.gemini15Pro,
       models.geminiPro,
       models.gemini15Flash,
diff --git a/packages/llm-info/src/providers/gemini.ts b/packages/llm-info/src/providers/gemini.ts
@@ -11,6 +11,33 @@ export const Gemini: ModelProvider = {
       regex: /gemini-2\.0-flash/i,
       recommendedFor: ["chat"]
     },
+    {
+      model: "gemini-2.0-flash-lite",
+      displayName: "Gemini 2.0 Flash Lite",
+      contextLength: 1048576,
+      maxCompletionTokens: 8192,
+      mediaTypes: AllMediaTypes,
+      regex: /gemini-2\.0-flash-lite/i,
+      recommendedFor: ["chat"]
+    },
+    {
+      model: "gemini-2.0-flash-exp-image-generation",
+      displayName: "Gemini 2.0 Flash Image Generation",
+      contextLength: 32768,
+      maxCompletionTokens: 8192,
+      mediaTypes: AllMediaTypes,
+      regex: /gemini-2\.0-flash-exp-image-generation/i,
+      recommendedFor: ["chat"]
+    },
+    {
+      model: "gemini-2.5-pro-exp-03-25",
+      displayName: "Gemini 2.5 Pro Exp",
+      contextLength: 1048576,
+      maxCompletionTokens: 65536,
+      mediaTypes: AllMediaTypes,
+      regex: /gemini-2\.5-pro-exp-03-25/i,
+      recommendedFor: ["chat"]
+    },
     {
       model: "gemini-1.5-flash",
       displayName: "Gemini 1.5 Flash",
diff --git a/packages/llm-info/src/providers/vertexai.ts b/packages/llm-info/src/providers/vertexai.ts
@@ -11,6 +11,33 @@ export const Gemini: ModelProvider = {
       regex: /gemini-2\.0-flash/i,
       recommendedFor: ["chat"]
     },
+    {
+      model: "gemini-2.0-flash-lite",
+      displayName: "Gemini 2.0 Flash Lite",
+      contextLength: 1048576,
+      maxCompletionTokens: 8192,
+      mediaTypes: AllMediaTypes,
+      regex: /gemini-2\.0-flash-lite/i,
+      recommendedFor: ["chat"]
+    },
+    {
+      model: "gemini-2.0-flash-exp-image-generation",
+      displayName: "Gemini 2.0 Flash Image Generation",
+      contextLength: 32768,
+      maxCompletionTokens: 8192,
+      mediaTypes: AllMediaTypes,
+      regex: /gemini-2\.0-flash-exp-image-generation/i,
+      recommendedFor: ["chat"]
+    },
+    {
+      model: "gemini-2.5-pro-exp-03-25",
+      displayName: "Gemini 2.5 Pro Exp",
+      contextLength: 1048576,
+      maxCompletionTokens: 65536,
+      mediaTypes: AllMediaTypes,
+      regex: /gemini-2\.5-pro-exp-03-25/i,
+      recommendedFor: ["chat"]
+    },
     {
       model: "gemini-1.5-flash",
       displayName: "Gemini 1.5 Flash",