智谱 AI：GLM-4V-Plus 视频理解模型-Tesla

智谱 AI：GLM-4V-Plus 视频理解模型

Administrator

2025-02-12 / 0 评论 / 0 点赞 / 37 阅读 / 0 字

02/12

在视频长度较小时，支持原生的高分辨率视频；在视频长度较长时，使用更小的分辨率，有效地捕捉模型的时间和空间中的信息。更新后的模型，支持2小时的长视频理解能力和更加精细的短视频理解能力。

提供了视频描述生成、视频事件分割、视频分类、视频打标签、视频事件分析等多种能力，覆盖了新媒体，广告，安全审查，工业制造等场景

https://mp.weixinbridge.com/mp/wapredirect?url=https%3A%2F%2Fbigmodel.cn%2Fdev%2Fhowuse%2Fglm-realtime&action=appmsg_redirect&uin=MTIxNDQ0ODA2MA%3D%3D&biz=MzkyMzc0NTA3Nw==&mid=2247485191&idx=2&type=1&scene=0

	GLM-4V-Plus-0111	GLM-4V-PLUS	InternVL2.5-78B	Qwen2-VL-72B	Gemini-1.5-Pro	GPT-4o
MVBench	77.2	71.2	76.4	73.6	52.6	47.8
VideoMME w/o subs	70.8	59.1	72.1	71.2	75.0	71.9
VideoMME w/ subs	76.3	68.2	74	77.8	81.3	77.2
MotionBench 动作级别视频理解	62.82	58.0	61	57	51	33
LVBench 长视频理解	48.7	38.3	44	41.3	33.1	30.8

from zhipuai import ZhipuAI

client = ZhipuAI(api_key="YOUR API KEY") # Fill in your own APIKey
response = client.chat.completions.create(
    model="glm-4v-plus",  # Fill in the model name to be called
    messages=[
      {
        "role": "user",
        "content": [
          {
            "type": "video_url",
            "video_url": {
                "url" : "https://sfile.chatglm.cn/testpath/video/b844f8f1-5df9-556c-a515-3d3bfaa736e8_0.mp4"
            }
          },
          {
            "type": "text",
            "text": "Please describe this video in detail"
          }
        ]
      }
    ]
)
print(response.choices[0].message)

目录CONTENT

智谱 AI：GLM-4V-Plus 视频理解模型

评论区