AI는 왜 ‘세차장’ 테스트를 못풀었을까? (조직의 진짜 신호는 맥락에 있다.)

AI는 왜 '세차장' 테스트를 못풀었을까? 숫자가 아닌 맥락, '눈치'로 조직의 진짜 신호를 읽는 HR의 역할이 곧 인간만의 고유한 역량입니다.

조직문화Tech HR리더십시니어리더임원CEO

루나

루나Mar 16, 2026

304415

AI는 왜 ‘세차장’ 테스트를 못풀었을까?

최근 GeekNews에서 AI의 ‘세차장 테스트’에 대한 흥미로운 아티클을 읽었습니다.
질문은 단순합니다.
“세차장이 50m 떨어져 있다면 걸어갈까, 운전할까?”

이 실험이 화제가 된 이유는, 많은 AI 모델이 이 간단한 문제에 대한 답변을 대다수가 틀렸기 때문입니다. 세차를 하려면 무엇보다 차가 세차장에 가 있어야 한다는 게 우리한테는 너무 쉬운 질문인데, 많은 AI 모델은 “가까우니 걸어간다”고 답했다는 거죠.

GeekNews에 소개된 실험 요약에 따르면, 53개 주요 AI 모델 중 42개가 1차 테스트에서 오답을 냈고, 10회 반복 테스트에서도 100% 일관되게 정답을 낸 모델은 5개뿐이었습니다.
이 실험은 AI의 단순 추론 한계라기보다, 문맥 없이 표면 신호만 읽을 때 발생하는 오류와 컨텍스트 엔지니어링의 중요성을 보여주는 사례로 해석되고 있습니다.
AI가 가장 눈에 띄는 정보에는 쉽게 반응하지만 정작 중요한 맥락은 놓칠 수 있다는 것이죠.

어마어마한 문제들을 해결하는 AI가 정작 이 문제를 잘 못풀었다고?
그 사소한 틈에, 인간만이 가질 수 있는 역량, HR이 가져야 하는 역량을 비집고 들어가보고 싶었습니다.

조직은 숫자로 움직이는 것처럼 보이지만, 실제로는 숫자 바깥의 맥락에 의해 흔들립니다. 숫자 너머의 맥락에 복잡한 ‘사람’이라는 존재가 있기 때문이죠.

KPI달성률, 회의 참여율, 연차 사용 일수, 피드백 횟수 등 많은 숫자가 있지만, 결국 그 숫자의 진의를 알기 위해서는 맥락을 살펴야 합니다. 회의에서 말수가 줄었다고 해서 모두 번아웃인 것도 아니고, 반대로 성과가 잘 유지되고 있다고 해서 팀이 건강하다는 뜻도 아닌 것처럼요.

AI 세차장 테스트처럼 표면적 입력 신호만 보면 “50m니까 걷자”는 답처럼 그럴듯하지만, 팀의 실제 상황을 설명하는 핵심은 늘 다른 곳에 숨어 있을 확률이 높습니다. 사람의 문제는 대부분 결과보다 먼저 상태로 나타나고, 상태는 늘 맥락 속에서 존재하기 때문입니다.

AI시대, 아직 인간의 고유한 몫인 일은 무엇이 있을까?

이미 많은 분들이 AI 시대 대체 불가능한 인간 역량에 대한 훌륭한 인사이트를 말씀해주시는 것에 더해, 이 사례를 들어 좀 더 보태보고 싶은 마음이 생겼습니다.

AI가 잘하는 일은 분명합니다. 대량의 데이터를 빠르게 요약하고, 반복되는 패턴을 포착하고, 문서나 회의 내용을 정리하는 데 탁월합니다. 이제는 에이전트를 두고 자동화하거나 새로운 워크플로우를 만들어볼 수 있게 되었습니다. 하지만 ‘문제’를 무엇으로 정의하느냐는 여전히 우리의 몫이고, 현실에서는 조직의 중요한 판단이 패턴만으로 내려지지 않는다는 데 있습니다.

갑자기 평상 시와 다른 근태 데이터, 회의 참여율, 재직증명서 발급과 같은 신호들이 이직 신호일 수도 있고, 피로 누적일 수도 있고, 관계적 거리감의 시작일 수도 있고, 단지 프로젝트 마감 주간의 일시적 압박일 수도 있습니다. 겉으로 드러난 행동은 비슷해도, 그 행동을 만들어낸 이유는 전혀 다를 수 있습니다. 그래서 조직에서는 “무슨 일이 일어났는가”보다 “왜 이런 패턴이 나타나는가”를 한 발 더 빠르게 읽는 역량이 더 중요하다고 믿습니다.

맥락을 읽는 힘

여기서 인간의 역할이 선명해집니다.
AI 시대에 인간만이 할 수 있는 일이 단순히 ‘감성적 공감’에만 머물지 않습니다. 더 본질적인 역량은 어쩌면, ‘상황을 해석하는 힘’, 다시 말해 맥락을 읽는 감각일 거라 믿습니다.

누가 정말 도움이 필요한지, 지금 개입해야 하는지 기다려야 하는지, 이 변화가 위험 신호인지 자연스러운 변동인지 구분하는 힘 말입니다. 이건 단순히 데이터를 많이 보는 능력도 아니고, 경험만으로 버티는 직감도 아닙니다. 서로 다른 신호를 연결하고, 시간의 흐름 안에서 의미를 읽고, 관계와 환경까지 함께 고려하는 고차원의 판단입니다.

실제로 AI가 업무에 깊숙이 들어올수록 인간의 역할이 줄어들기보다, 재정의되고 있다는 이야기는 이제 익숙하기까지 합니다. 마이크로소프트의 2025 Work Trend Index에서는 인간과 AI 에이전트가 함께 일하는 구조가 확산되면서, 모든 구성원이 AI를 만들고 위임하고 관리하는 이른바 ‘에이전트 보스’ 역할을 갖게 될 것이라고 봤습니다. (2026년, 이미 너무 빠르게 그 세상으로 들어왔습니다.)
그렇다면 앞으로 중요한 것은 AI를 단순히 사용하는 능력보다, AI가 낸 결과를 어떤 맥락에서 해석하고 어떻게 조직 안에 적용할 것인가를 판단하는 능력이지 않을까요.

HR의 역할도 여기서 달라집니다. 이제 HR은 데이터를 모으는 사람에 머물기 어렵습니다.
이미 수많은 툴이 데이터를 수집하고, 요약하고, 시각화합니다. 진짜 차이는 그 다음입니다. 어떤 신호가 단순 변동이고, 어떤 신호가 이탈의 전조인지, 어떤 팀에서는 피로가 누적되고 있고 어떤 팀에서는 심리적 안전감이 낮아지고 있는지, 그리고 지금 조직에 필요한 개입은 공지 하나인지, 리더 대화인지, 혹은 아무것도 하지 않고 지켜보는 일인지 해석해야 합니다.
HR은 제도 운영자가 아니라 사람의 상태를 조직 언어로 번역하는 맥락 해석자가 되면 AI는 훌륭한 보조자가 될 수 있습니다.

그거, ‘눈치’인거죠?

그러니까, HR은 전체 조직을 막연히 관리하는 대신, 어느 지점에 더 세심한 관찰과 개입이 필요한지 감지할 수 있어야 하고, 중요한 것은 현상을 과도하게 해석하는 것이 아니라, 상태와 맥락이 함께 보이는 구조를 만드는 이 어려운 역할을 해야 한다는 건데, 더 쉽게 이야기하면 ‘눈치’이지 않을까요.
‘눈치’라는 감각은 어쩌면 아직 인간만이 진화 과정 중 획득한 초고도화진 지능이지 않을까 하는 생각도 합니다.

우리의 경쟁력이 더 많은 정보를 아는 것에 있는 것이 아니라, 무엇이 진짜 신호인지, 어떤 맥락에서 읽어야 하는지 판단하는 데 있고, 그러려면 신호를 먼저 알아야 하고, 구성원과 연결되어야 한다는 의미입니다.
무엇이 진짜 신호인지 구별하는 인간의 맥락 판단력(‘눈치’)은 구성원에 대한 ‘이해’가 없다면, 발현되지 어려운 영역이기 때문입니다.

결국, 다정함, 사랑.

정리하자면, 세차장을 가야하는데 가까우니 ‘걸어가라’는 AI의 답변은 맥락없이 출력된 대단히 합리적인 결과일 겁니다.

이제 HR의 경쟁력은 많은 데이터로 ‘합리성’을 확보하는 데 있지 않고, 그 데이터 사이에 숨어 있는 사람의 상태와 관계의 흐름과 맥락을 읽어내는 데 있습니다.

조직의 진짜 리스크는 성과지표가 무너진 뒤에 발견되지 않습니다.

그보다 먼저, 말의 톤이 달라지고, 참여의 방식이 달라지고, 에너지의 결이 달라지고, 연결의 온도가 달라지는 미세한 변화들이 존재합니다. 그리고 바로 그 미세한 변화의 맥락을 언제 읽고 개입하느냐에 따라 리텐션이 달라집니다.

그래서 돌고 돌아, 조직을 건강하게 만드는 힘은 결국 사람을 숫자 너머로 이해하려는 시선과 마음이 가장 근간에 있지 않을까요.

그 다정함이, 그 ‘사랑’이, 사람을 진심으로 이해하고 싶고, 돕고자 하는 그 마음이 신호를 구별하는 인간의 맥락 판단력을 활용해서 빠르게 방안을 만들고, 해결까지 연결할 수 있을테니까요.

루나

Be You, Be Present.

기능이 아닌 ‘존재’로 함께하는 사람과 조직을 지향합니다. 다정함의 과학을 믿고, 체계와 기술보다 연결과 숨결에 더 관심이 있습니다. HRer에서 창업가로 길을 옮겼지만, 목적지는 늘 같습니다 — '사람' 중심 일터.

댓글이 없습니다. 첫 댓글을 남겨보세요.

(주)오프피스트 | 대표이사 윤용운

서울특별시 서초구 사임당로8길 13, 4층 402-엘179호(서초동, 제일빌딩)

사업자등록번호: 347-87-03493 |

통신판매업신고번호: 제2025-서울서초-2362호

전화: 02-6339-1015 | 이메일: help@offpiste.ai

About

개인정보 처리방침