工具介绍:OpenBench是一个开源、跨平台的大语言模型评估工具,支持20+基准任务,兼容 Groq、OpenAI、Anthropic、Google Gemini、Ollama 等模型平台。所有操作通过命令行完成,适合快速、标准化地评估 LLM 表现。
数据统计
数据评估
关于OpenBench特别声明
本站注册卡提供的OpenBench都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由注册卡实际控制,在2025年8月17日 上午1:27收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,注册卡不承担任何责任。