Trendar

“benchmark”

이 키워드와 관련된 논문 · GitHub · 뉴스를 한곳에 모았습니다.

논문 12

전체 →
  1. OpenAlex자연어·LLM인용 1.4K
    대규모 언어 모델의 발전과 활용에 대한 종합적 조사A Survey of Large Language Models
  2. OpenAlexML 방법론인용 344
    하우스홀더 반사로 유니터리 행렬을 매개변수화한 순수 RNN으로 장기 시퀀스 모델링Axiom: A Householder-Parameterized Pure Unitary RNN for Long-Range Sequence Modeling
  3. Semantic Scholar자연어·LLM인용 1.6K
    지속적 수집으로 오염 없는 코드 LLM 평가 벤치마크LiveCodeBench: Holistic and Contamination Free Evaluation of Large Language Models for Code
  4. Semantic Scholar멀티모달인용 558
    강화학습으로 멀티모달 대규모 언어모델의 추론 능력 향상Vision-R1: Incentivizing Reasoning Capability in Multimodal Large Language Models
  5. Semantic Scholar자연어·LLM인용 553
    LLM의 수학적 추론 능력 한계를 밝힌 GSM-Symbolic 벤치마크GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models
  6. OpenAlex에이전트인용 3K
    관찰 가능한 세계 설계로 LLM 시스템 신뢰성을 높이는 컴파일러 이론Affordance-Compiled Intelligence: Observable-Only Cognitive Impedance Matching for No-Meta LLM-Integrated Systems
  7. Semantic Scholar자연어·LLM인용 975
    대규모 언어 모델의 종합적 개요와 발전 방향Large Language Models: A Survey
  8. Semantic Scholar자연어·LLM인용 952
    코드 생성을 위한 대규모 언어 모델의 종합적 조사A Survey on Large Language Models for Code Generation
  9. Semantic Scholar멀티모달인용 580
    멀티모달 거대 언어 모델의 공간 지능 평가 및 인지 맵 생성 기법Thinking in Space: How Multimodal Large Language Models See, Remember, and Recall Spaces
  10. OpenAlexML 방법론인용 50
    분할 CIFAR-100에서 시냅스 판별 기반 클래스 점진 학습을 위한 감성 SNN 확장Maya-Viveka: Viveka-Gated Synaptic Discrimination for Class-Incremental Learning in Affective Spiking Neural Networks
  11. OpenAlexML 방법론인용 49
    통증 유사 가소성과 분리적 감쇠로 지속 학습하는 SNNMaya-CL: Nociceptive Metaplasticity and Vairagya-Governed Heterosynaptic Decay for Continual Learning in Spiking Neural Networks
  12. OpenAlex기타인용 49
    cl-metrics: A Stateless Python Library for Continual Learning Evaluation with SNN Energy-Aware Extensions

GitHub 3

전체 →
  1. 에이전트TypeScript22.1K
    AI 코딩 에이전트에 지속적 메모리를 제공하는 오픈소스 라이브러리rohitg00/agentmemory
  2. AI인프라Python3.9K
    내 하드웨어에 맞는 최고의 로컬 LLM을 찾아주는 도구Andyyyy64/whichllm
  3. 에이전트Python55.2K
    로컬 우선 AI 메모리 시스템, 장기 대화 맥락 유지에 특화MemPalace/mempalace