Agentic AI Library

Curated Open Source Library

Start Here Library Glossary About the CreatorRoadmap Provide Feedback

Resource

Loading…

Agentic AI LibraryOpen Source · Last Reviewed 2026-06-07

Library About the Creator Roadmap PrivacyProvide Feedback LinkedIn Author Portfolio

All Rights Reserved @2026 Georgi Naydenov

Home/Library/SWE-bench: Can Language Models Resolve Real-World GitHub Issues?

Papers & Research

SWE-bench: Can Language Models Resolve Real-World GitHub Issues?

Details

Publisher: Princeton / SWE-bench
Domain: Research & Learning
Category: Papers & Research
Type Group: Benchmarks & Datasets
Type: Paper / Benchmark
Best For: Research
Skill Level: Advanced
Access: Free
Topic: Coding-agent benchmark

Related in Papers & Research

Adapting the Interface, Not the Model: Runtime Harness Adaptation for Deterministic LLM AgentsTianshi Xu, Huifeng Wen, Meng Li
Awesome Code as Agent Harness PapersYennNing
A Survey of Context Engineering for Large Language ModelsLingrui Mei et al.
Language-Induced Priors for Domain AdaptationQiyuan Chen, Jiayu Zhou, Raed Al Kontar
Contexting as Recommendation: Evolutionary Collaborative Filtering for Context EngineeringJiachen Zhu et al.
AutoCodeBench: Large Language Models are Automatic Code Benchmark GeneratorsHunyuan Team, Tencent

Open ResourceBack to library