해설 2026년 4월 10일
우리가 ‘AGI’를 점수 매기지 않는 이유
범용 지능에 합의된 시험이 없기에 단일 ‘AGI %’는 데이터로 포장한 우리의 의견일 뿐입니다. 대신 객관적·제3자 숫자를 추적합니다: 학습 컴퓨트, 공개 벤치마크 점수, 투자.
ARC-AGI-1 점수 — 사람에겐 쉽지만(~85%) AI엔 오래 어려웠던 퍼즐. 2024년 12월 OpenAI o3가 76~88%에 도달해, 이 시험에서 암기를 넘어선 첫 AI가 됐습니다. ARC-AGI-2는 더 어려운 후속으로 프론티어 모델도 아직 낮은 점수입니다. (제3자 벤치마크이며 우리 점수가 아닙니다.)
범용 지능에 합의된 시험이 없기에 단일 ‘AGI %’는 데이터로 포장한 우리의 의견일 뿐입니다. 대신 객관적·제3자 숫자를 추적합니다: 학습 컴퓨트, 공개 벤치마크 점수, 투자.
이 필터에 해당하는 발행물이 아직 없습니다.