中文通用大模型基准SuperCLUE测评揭示AI与人类差距

2025-10-26 分类：趣站分享阅读(22) 评论(0)

该测评体系专注于对中文场景下的通用智能模型进行多维度的能力评估

值得关注的是，在当前评估体系中，人类智能仍保持着明显优势，尚未有模型能够全面超越人类的综合表现。该测评通过系统化的测试方法，持续追踪中文大模型的发展轨迹，为行业提供客观的参照标准。

https://github.com/CLUEbenchmark/SuperCLUE