최근 뮤지컬 ‘시카고’에서 복화술이 화제였다. 관객들은 배우 록시의 입에서 나오는 말에 집중하지만, 실제로 말을 하면서 그의 몸을 조종하는 사람은 그 배우의 옆에 앉은 또 다른 배우 빌리다. 입을 벌리지 않고 말하면서 마치 자신이 말하지 않는 것처럼 보이는 이 기술을 보며 관객들의 놀라움과 재미가 극대화된다. 과연 여기서 누가 진짜 주인공일까? 말을 대신하는 복화술사 빌리일까? 아니면 그의 손에 조종당하면서 무대 중앙에서 연기하는 배우 록시일까?
(출처: SBS뉴스)
최근 영국의 한 설문조사에 따르면, 대학생의 92%가 AI를 학습에 활용한다고 답했다. 메일 작성, 강의 요약, 자료 조사, 과제 작성까지 AI는 이미 대학 생활의 모든 영역에 스며들었다. 예를 들어, NotebookLM은 어려운 논문을 팟캐스트처럼 풀어서 들려주고, Genspark는 복잡한 개념을 슬라이드로 만들어 이해를 돕는다. ChatGPT 출시 이후 미국 대학생들의 에세이 평균 수준이 급격히 상승했다는 연구 결과도 있다. 결과적으로 AI는 대학생들에게 도움이 되는 방향으로 활용되는 것처럼 보인다.
하지만, 학생들은 점점 AI의 도움을 받는 것에 익숙해지고, 자연스럽게 과의존(overreliance)하게 되면서, 비판적 사고가 줄어든다는 우려도 나온다. 최근 한 연구에서는 학생들에게 동일한 문제를 두 번 풀게 했는데, 첫 번째는 AI 도움을 받고, 두 번째는 혼자 풀게 했다. AI의 도움을 받았을 때 평균 점수는 85점이었지만, 혼자 풀었을 때는 60점으로 떨어졌다. 더 놀라운 것은, 학생들 대부분이 자신의 실제 실력을 과대평가하고 있었다는 점이다. AI가 자신의 능력이 된 것처럼 착각한 것이다. 뮤지컬 ‘시카고’에서도 록시는 빌리가 만든 대사를 읽으며, 자신이 정말 그렇게 말하고 있다고 믿기 시작한다. 강의실에서도 학생들은 AI가 생성한 문장을 자신의 생각이라 착각하기 시작한다.
이것은 교육의 공동화(空洞化)로 이어진다. 학습의 목적은 사라지고, 평가의 의미는 퇴색된다. AI를 '잘' 쓰는 학생이 좋은 점수를 받고, 그 과정에서 실제로 무엇을 배웠는지는 중요하지 않게 된다. AI 과의존에 대한 초기 대학의 입장은 "학생들이 AI를 사용하는가?"를 탐지하는 기술로 쉽게 해결책을 찾을 수 있을 것 같아 보였다. 하지만, 마치 쫓고 쫓기는 경찰과 도둑처럼 이러한 AI 탐지도구가 발달하자, 학생들은 인간답게 쓰기 (humanize) 기능을 가진 또 다른 AI 도구들로 탐지 회피방법을 찾기 시작했다. 어떤 학생들은, 의도적으로 문장 길이를 다양하게 조절하고, 때로는 일부러 오타를 넣기까지 했다. 아이러니하게도, AI를 써서 좋은 글을 쓰는 것보다 AI를 쓴 흔적을 지우는 데 더 많은 시간을 쓰는 상황도 벌어졌다. 원래 교육의 본질에서 점점 멀어지는 이러한 웃픈(웃기면서도 슬픈) 행태로 인해 전 세계의 대학에서는 근본적인 질문을 던지기 시작했다.
대학에서는 크게 두 가지 방식으로 평가의 변화를 추구하고 있는데, 첫번째는 대화를 통해 평가(conversation-based) 하는 구술시험 방식이다. 영국 런던 소재 대학인 UCL(University College London)에서 최근 이 방식을 학부 과정에 평가방식으로 도입하고 있다. 원래는 박사 학위 논문 심사에 주로 사용되었는데, 논문을 제출하면 교수가 해당 주제에 대해 깊게 질문하며 토론하는 방식이다. 2~3 번 정도 질문을 하고 대화가 이어지면, 피평가자의 이해도와 깊이를 알 수 있다고 한다. 학생들은 AI가 생성한 문장을 실시간으로 따라읽을 수도 없다. 즉, 학생은 자신이 정말로 그 내용을 이해했을 때만 답할 수 있다. 제대로 진행된 구술 시험은 학생의 커뮤니케이션 능력을 평가할 뿐 아니라, 개별 지식 기반, 지식 통합 능력, 사고 과정을 유연하게 탐색할 수 있는 훌륭한 도구가 된다.
둘째는, 과정(process)과 맥락(context)을 평가한다. 결과물만 평가하면 AI가 생성했는지 학생이 작성했는지 알 수 없다. 하지만 '과정'은 거짓말하지 않는다. MIT를 포함한 여러 대학들은 '프로세스 포트폴리오(Process Portfolio)' 평가 방식을 도입하고 있다. 최종 제출물이 아니라, 그것이 만들어지는 전 과정을 제출하도록 하는 것이다. AI는 답을 줄 수 있지만, 그 답에 이르기까지의 고민, 막힘, 돌파의 순간을 경험하지 못한다. 대학들은 이제 '대본에 없는 질문'을 던지기 시작했다. 그리고 학생들에게 자신의 목소리로 답하도록 요구하고 있다.
위 내용은 대학에서 벌어지는 일들이지만, 이것은 비단 대학만의 문제가 아니다. 대학이 평가 방식을 바꾸고 있다면, 그 변화는 곧 기업의 채용 시장과 연결된다. 대학은 단순히 지식을 전수하는 곳이 아니라, 기업이 원하는 인재를 양성하는 '예비 인력 양성소'이기 때문이다. 대학에서 단순히 AI의 말을 그대로 따라하는 ‘앵무새’와 AI가 낸 답을 검증할 수 있는 사람을 구별하기 시작했다면 이제 기업도 비슷한 고민을 할 필요가 있지 않을까 ?
2025년 4월, 팔란티어(Palantir)는 파격적인 채용 공고를 냈다. "대학을 건너뛰어라(Skip College)." 를 컨셉으로 해서 대학에 재학 중이 아닌 고졸자라면 인턴십에 누구든 지원할 수 있는 프로그램이다. 지식이 아니라 실행, 학위가 아니라 문제 해결 능력을 핵심이라는 메세지를 글로벌 채용 시장에 명확하게 던졌다. 하지만 여기서 중요한 것은, 기업에서 찾는 사람도 결국 “AI를 잘 쓰는 사람"이 아니라 "AI로 문제해결을 하는 사람"*이라는 점이다. 여기서 문제해결의 전제는 비판적 사고를 할 수 있는 사람이다. 기업은 이제 새로운 스크리닝 방식을 고민하기 시작했다. 앞으로 서류심사에서, 면접에서 포트폴리오 결과물을 보는 것만으로는 부족할지도 모른다. 대학이 구술시험과 과정평가를 도입한 것처럼, 기업도 비판적 사고와 심층 질문을 던질 필요가 있다. AI는 결과물을 만들 수 있지만, 그 과정에서 어떻게 AI를 검증했는지가 오히려 핵심 역량이 될 수 있다. 최근 스탠포드 대학에서 발표한 보고서에도 주니어 개발자 채용이 글로벌하게 점점 줄어들고 있다고 밝혔는데, 그 이유는 AI가 그들을 대체해서가 아니다. AI와 똑같은 결과물을 내는 사람은 굳이 채용할 이유가 없기 때문이라는 사실을 알아야 한다.
맥킨지는 AI 시대를 "인간과 기계의 협업(human-machine collaboration)" 시대로 정의한다. AI 에이전트와 직원이 하나의 협력체가 되어 일하는 것이 이제 일상이 되었다. 스탠포드-MIT의 한 연구는 '센타우로스(Centaur)' 개념을 제시한다. 그리스 신화의 반인반마처럼, 인간의 지성과 AI의 계산 능력이 결합된 형태다. 체스에서 인간 그랜드마스터와 AI가 협업했을 때 가장 강력했던 것처럼, 업무에서도 인간과 AI의 최적 협업 지점을 찾는 것이다. 조직 내 인간이 보유한 도메인 지식은 여전히 대체될 수 없는 것으로 여겨진다. AI는 방대한 데이터를 학습했지만, 조직의 특수한 맥락, 고객의 미묘한 니즈, 조직 문화의 암묵적 규칙을 모른다. 한 금융회사 실무자는 이렇게 말했다. "ChatGPT는 완벽한 투자 보고서를 작성합니다. 하지만 우리 고객이 '리스크'라는 단어를 싫어한다는 걸 모르죠. 그걸 '불확실성 관리'로 바꿔야 한다는 건 10년 경력자만 아는 겁니다."
대학에서의 AI 가이드라인이 존재함에도 불구하고 학생들에게 물어봤을 때 자세하게 인식하고 있는 학생들은 많지 않다. 규제 중심의 추상적인 규칙들이 실제 상황에 어떻게 적용해야 할지 실무자 조차도 확실하지 않다. "적절하게 사용하세요"라는 일반적인 말은 지침이 아니라 회피다. 기업도 마찬가지 함정에 빠져 있다. "AI 사용 시 보안 주의"는 있지만, "어떤 업무에 AI를 써도 되고, 어떤 업무에는 쓰면 안 되는지" 명확한 구분이 없다. 결과적으로 직원들은 ‘알아서’, ‘눈치껏’’ 죄책감을 느끼면서도 몰래 사용하거나, 아예 쓰지 않고 비효율을 감수한다. 가이드라인은 맥락별로 구체화되어야 하고, 어떻게 ai를 활용했는지 투명해야 하고, 어떻게 ai의 결과를 검증했는지 명시할 수 있어야 한다. 최근 AI 거버넌스 연구에서 주목받는 방식 중 하나가 'AI 협업 기록(AI Collaboration Log)' 개념이다. 프로젝트에서 AI를 어떻게 활용했는지, 어떤 부분을 수정했는지 기록하게 하는 것이다. 이 방식을 적용한 조직들의 경험 데이터를 보면, 단순한 관리 도구를 넘어 학습 메커니즘으로 작동한다는 점이 흥미롭다. 기록 행위 자체가 메타인지를 촉진하여, 직원들이 AI의 역할과 한계를 더 명확히 이해하게 되고, 결과적으로 AI를 더 전략적으로 활용하게 된다. 나아가 조직 차원에서는 AI 활용 베스트 프랙티스가 자연스럽게 축적되는 효과를 얻게 된다.
대학의 목적과 기업의 목적이 다르다는 반론이 있을 수 있다. 대학은 '학습'이 목표지만, 기업은 '성과'가 목표이기 때문이다. 하지만 이는 '단기 성과'와 '장기 역량'을 분리해서 생각하는 오류다. AI를 무비판적으로 받아들이면서 문제를 해결해 나가면 당장의 과제는 금방 해결할 수 있을지 모른다. 하지만 직원의 역량 개발의 관점에서 시간이 흐르고, AI가 없으면 아무것도 할 수 없는 앵무새가 되어 있을지도 모른다. 반면 AI를 협업 도구로 삼아 자신의 사고를 확장하는 직원은 다르다. 그는 AI가 주는 초안을 비판적으로 검토하고, 맥락에 맞게 수정하고, 새로운 통찰을 더할 것이다. AI와 똑같은 결과를 내는 사람을 채용할 것인가, AI를 자신만의 방식으로 활용하는 사람을 채용할 것인가. 그리고 그 선택은 곧 당신의 조직이 장기적으로 경쟁력을 유지할 수 있는지를 결정할 것이다.
복화술 공연이 끝나면, 관객들은 배우에게 박수를 보낸다. 말하는 흉내를 내던 록시보다는, 옆에서 복화술을 하던 빌리에게 더 큰 박수가 간다. 입모양을 움직이지 않지만 실제 목소리를 내는 사람을 모든 관중들은 알고 있기 때문이다. AI 시대에도 마찬가지다. 당신의 면접장에는 누가 앉아 있는가? 빌리인가, 록시인가? 당신의 조직에는 누가 일하고 있는가? 자신의 목소리를 가진 사람인가, AI의 목소리를 빌린 앵무새인가? AI는 이제 선택이 아니라 전제다. 하지만 그 전제 위에서 우리는 선택해야 한다. AI에게 대체될 사람을 키울 것인가, AI를 활용할 사람을 키울 것인가.
앵무새가 아닌 ‘사람’을 찾는 것, 육성하는 것이 앞으로의 인재전쟁에서 중요해질 것이다.