目 录CONTENT

文章目录

智谱 AI:GLM-4V-Plus 视频理解模型

Administrator
2025-02-12 / 0 评论 / 0 点赞 / 3 阅读 / 0 字

在视频长度较小时,支持原生的高分辨率视频;在视频长度较长时,使用更小的分辨率,有效地捕捉模型的时间和空间中的信息。更新后的模型,支持2小时的长视频理解能力和更加精细的短视频理解能力。

提供了视频描述生成、视频事件分割、视频分类、视频打标签、视频事件分析等多种能力,覆盖了新媒体,广告,安全审查,工业制造等场景


GLM-4V-Plus-0111

GLM-4V-PLUS

InternVL2.5-78B

Qwen2-VL-72B

Gemini-1.5-Pro

GPT-4o

MVBench

77.2

71.2

76.4

73.6

52.6

47.8

VideoMME w/o subs

70.8

59.1

72.1

71.2

75.0

71.9

VideoMME w/ subs

76.3

68.2

74

77.8

81.3

77.2

MotionBench
动作级别视频理解

62.82

58.0

61

57

51

33

LVBench
长视频理解

48.7

38.3

44

41.3

33.1

30.8

from zhipuai import ZhipuAI

client = ZhipuAI(api_key="YOUR API KEY") # Fill in your own APIKey
response = client.chat.completions.create(
    model="glm-4v-plus",  # Fill in the model name to be called
    messages=[
      {
        "role": "user",
        "content": [
          {
            "type": "video_url",
            "video_url": {
                "url" : "https://sfile.chatglm.cn/testpath/video/b844f8f1-5df9-556c-a515-3d3bfaa736e8_0.mp4"
            }
          },
          {
            "type": "text",
            "text": "Please describe this video in detail"
          }
        ]
      }
    ]
)
print(response.choices[0].message)

0
  1. 支付宝打赏

    qrcode alipay
  2. 微信打赏

    qrcode weixin

评论区