LOADING
工具介绍:OpenBench是一个开源、跨平台的大语言模型评估工具,支持20+基准任务,兼容 Groq、OpenAI、Anthropic、Google Gemini、Ollama 等模型平台。所有操作通过命令行完成,适合快速、标准化地评估 LLM 表现。