Update api response

2024-06-07 10:58:44 +08:00
parent 5f84cef13a
commit 6ef7641a0d
2 changed files with 35 additions and 3 deletions
--- a/src/api/models/bedrock.py
+++ b/src/api/models/bedrock.py
@@ -2,6 +2,7 @@ import base64
 import json
 import logging
 import re
+import time
 from abc import ABC
 from typing import AsyncIterable, Iterable, Literal

@@ -403,12 +404,14 @@ class BedrockModel(BaseChatModel):
                    message.tool_calls = [
                        ToolCall(
                            id=tool["toolUseId"],
+                            type="function",
                            function=ResponseFunction(
                                name=tool["name"],
                                arguments=json.dumps(tool["input"]),
                            ),
                        )
                    ]
+                    message.content = None
        else:
            message.content = content[0]["text"]

@@ -417,8 +420,10 @@ class BedrockModel(BaseChatModel):
            model=model,
            choices=[
                Choice(
+                    index=0,
                    message=message,
-                    finish_reason=finish_reason,
+                    finish_reason=self._convert_finish_reason(finish_reason),
+                    logprobs=None,
                )
            ],
            usage=Usage(
@@ -427,6 +432,9 @@ class BedrockModel(BaseChatModel):
                total_tokens=input_tokens + output_tokens,
            ),
        )
+        response.system_fingerprint = "fp"
+        response.object = "chat.completion"
+        response.created = int(time.time())
        return response

    def _create_response_stream(
@@ -455,6 +463,7 @@ class BedrockModel(BaseChatModel):
                message = ChatResponseMessage(
                    tool_calls=[
                        ToolCall(
+                            type="function",
                            id=delta["toolUse"]["toolUseId"],
                            function=ResponseFunction(
                                name=delta["toolUse"]["name"],
@@ -475,6 +484,7 @@ class BedrockModel(BaseChatModel):
                message = ChatResponseMessage(
                    tool_calls=[
                        ToolCall(
+                            type="function",
                            function=ResponseFunction(
                                arguments=delta["toolUse"]["input"],
                            )
@@ -509,7 +519,7 @@ class BedrockModel(BaseChatModel):
                        index=0,
                        delta=message,
                        logprobs=None,
-                        finish_reason=finish_reason,
+                        finish_reason=self._convert_finish_reason(finish_reason),
                    )
                ],
                usage=usage,
@@ -615,6 +625,28 @@ class BedrockModel(BaseChatModel):
            }
        }

+    def _convert_finish_reason(self, finish_reason: str | None) -> str | None:
+        """
+        Below is a list of finish reason according to OpenAI doc:
+
+        - stop: if the model hit a natural stop point or a provided stop sequence,
+        - length: if the maximum number of tokens specified in the request was reached,
+        - content_filter: if content was omitted due to a flag from our content filters,
+        - tool_calls: if the model called a tool
+        """
+        if finish_reason:
+            finish_reason_mapping = {
+                "tool_use": "tool_calls",
+                "finished": "stop",
+                "end_turn": "stop",
+                "max_tokens": "length",
+                "stop_sequence": "stop",
+                "complete": "stop",
+                "content_filtered": "content_filter"
+            }
+            return finish_reason_mapping.get(finish_reason.lower(), finish_reason.lower())
+        return None
+

 class BedrockEmbeddingsModel(BaseEmbeddingsModel, ABC):
    accept = "application/json"
--- a/src/api/routers/chat.py
+++ b/src/api/routers/chat.py
@@ -15,7 +15,7 @@ router = APIRouter(
 )


-@router.post("/completions", response_model=ChatResponse | ChatStreamResponse, response_model_exclude_none=True)
+@router.post("/completions", response_model=ChatResponse | ChatStreamResponse, response_model_exclude_unset=True)
 async def chat_completions(
        chat_request: Annotated[
            ChatRequest,