프론티어 AI
추적 지표

추상추론 점수 (ARC-AGI)

ARC-AGI-1 점수 — 사람에겐 쉽지만(~85%) AI엔 오래 어려웠던 퍼즐. 2024년 12월 OpenAI o3가 76~88%에 도달해, 이 시험에서 암기를 넘어선 첫 AI가 됐습니다. ARC-AGI-2는 더 어려운 후속으로 프론티어 모델도 아직 낮은 점수입니다. (제3자 벤치마크이며 우리 점수가 아닙니다.)

88%달성 · 2024년 12월 ~85% (human)ARC-AGI-1에서의 평균 인간 성능 — AI가 2024년 말 넘어선 기준선.
트래커에서 보기
  1. 88 % 2024년 12월 OpenAI 보도 · 2024-12
  2. 0 % 2020년 보도 · 2024-12

관련 글