【[43星]ComplexFuncBench:复杂函数调用的终极测试基准!它能解

爱生活爱珂珂 2025-01-26 14:30:06

【[43星]ComplexFuncBench:复杂函数调用的终极测试基准!它能解决复杂场景下函数调用的评估难题,帮助开发者优化模型性能。亮点:1. 包含1000个复杂函数调用样本,覆盖多步调用、参数推理等场景;2. 支持长参数(超500 tokens)和128k长文本上下文;3. 提供自动化评估框架,快速验证模型效果】

'Complex Function Calling Benchmark: Exploring Multi-Step and Constrained Function Calling under Long-Context Scenario'

GitHub: github.com/THUDM/ComplexFuncBench

0 阅读:1
爱生活爱珂珂

爱生活爱珂珂

感谢大家的关注