一个综合性的大模型中文评估基准

评论交流1

登录后可发布评论哦~
    avatar
    谭福
    2026-02-21

    CMMLU作为面向中文场景的大模型评估基准,覆盖学科广、题型丰富,为中文能力评测提供了扎实的参考框架,期待未来在数据更新与细粒度分析上持续精进。