“benchmark”

이 키워드와 관련된 논문 · GitHub · 뉴스를 한곳에 모았습니다.

논문 12

OpenAlex자연어·LLM인용 1.4K
대규모 언어 모델의 발전과 활용에 대한 종합적 조사A Survey of Large Language Models
OpenAlexML 방법론인용 344
하우스홀더 반사로 유니터리 행렬을 매개변수화한 순수 RNN으로 장기 시퀀스 모델링Axiom: A Householder-Parameterized Pure Unitary RNN for Long-Range Sequence Modeling
Semantic Scholar자연어·LLM인용 1.6K
지속적 수집으로 오염 없는 코드 LLM 평가 벤치마크LiveCodeBench: Holistic and Contamination Free Evaluation of Large Language Models for Code
Semantic Scholar멀티모달인용 558
강화학습으로 멀티모달 대규모 언어모델의 추론 능력 향상Vision-R1: Incentivizing Reasoning Capability in Multimodal Large Language Models
Semantic Scholar자연어·LLM인용 553
LLM의 수학적 추론 능력 한계를 밝힌 GSM-Symbolic 벤치마크GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models
OpenAlex에이전트인용 3K
관찰 가능한 세계 설계로 LLM 시스템 신뢰성을 높이는 컴파일러 이론Affordance-Compiled Intelligence: Observable-Only Cognitive Impedance Matching for No-Meta LLM-Integrated Systems
Semantic Scholar자연어·LLM인용 975
대규모 언어 모델의 종합적 개요와 발전 방향Large Language Models: A Survey
Semantic Scholar자연어·LLM인용 952
코드 생성을 위한 대규모 언어 모델의 종합적 조사A Survey on Large Language Models for Code Generation
Semantic Scholar멀티모달인용 580
멀티모달 거대 언어 모델의 공간 지능 평가 및 인지 맵 생성 기법Thinking in Space: How Multimodal Large Language Models See, Remember, and Recall Spaces
OpenAlexML 방법론인용 50
분할 CIFAR-100에서 시냅스 판별 기반 클래스 점진 학습을 위한 감성 SNN 확장Maya-Viveka: Viveka-Gated Synaptic Discrimination for Class-Incremental Learning in Affective Spiking Neural Networks
OpenAlexML 방법론인용 49
통증 유사 가소성과 분리적 감쇠로 지속 학습하는 SNNMaya-CL: Nociceptive Metaplasticity and Vairagya-Governed Heterosynaptic Decay for Continual Learning in Spiking Neural Networks
OpenAlex기타인용 49
cl-metrics: A Stateless Python Library for Continual Learning Evaluation with SNN Energy-Aware Extensions

GitHub 3