
25년 11월 버블을 활용한 재무 데이터 기반 HR AI 에이전트(www.hrstats.co.kr)를 공개한적이 있다. 본 프로그램은 분석에 필요한 데이터(e.g 매출액, 영업이익, 인건비, 임차료 등)를 나열하고 각 데이터의 조합을 통해 분석 Tools (e.g 인적자원투자수익율, 노동소득분배율, 인당 인건비 등)을 활용하여 개별 기업의 데이터 분석 그리고 업종(산업) 데이터를 비교하여 GPT-4o API 연결로 진단결과를 보여주었다.
본 프로그램이 갖는 의미는 ① 재무 데이터로 비교가능한 Tools을 제공한다는 점 ② 산업과의 비교가 가능하다는 점 ③ 기업과 산업 데이터의 비교를 통해 진단결과를 자동으로 도출된다는 점이다. 다만 이 프로그램을 구현하면서 늘 아쉬웠던 부분은 진단결과를 내가 원하는 방향이 반영되는 것이 아니라 API로 연결한 GPT의 입맛대로 나오는 점이다. 이 부분에서 프로그램의 높은 효용성을 담보 받지못했고 절반의 완성이라는 생각을 지울 순 없었다.
강의에도 자주 사용하는 가트너(Gartner)의 '데이터 분석 성숙도 모델(Data Analytics Maturity Model)'에 따르면 기존 HR Stats는 2단계 진단적 분석 수준이었으나 생성형 AI의 가변성으로 인해 진단의 일관성과 신뢰성 확보에 한계가 있었다. 그래서 올해에는 3단계 예측적 분석과 4단계인 처방적 분석을 실현하는 목표를 세웠고 그 목표의 일환으로 내가 가지고 있고 활용하는 데이터를 랜덤포레스트 기법을 활용하여 인력구조를 진단하고 이에 맞는 전략을 처방하는 의사결정 모델을 구현하고자 한다. 이를 위해 GPT를 필두로 한 여러 AI 에이전트들과 한참을 논의한 후 나름의 모델을 구현해보았다.
(1) 문제 정의
- 최근 3년간 재무, 인력운영 현황이 어떤 판단라벨로 귀결될 가능성이 높은지 확률로 제시
- 인력구조가 현재 어떤 상태에 있으며 유지해야 하는지, 줄여야 하는지 등 확률적으로 설명하는 모델임
- 즉, 경영진 및 이해관계자의 의사결정을 돕기 위해 근거있는 선택지를 제공하고자 함
(2) 데이터
- 2025년 컨설팅 수행 기업 중 재무, 인원현황 데이터 등 객관적인 비교가 가능한 기업
- 즉, 관측 데이터로는 각 기업의 3년치 과거 재무, 인원현황 데이터
- 타겟 데이터는 2025년 컨설팅 수행에 따른 판단결과(감축, 유지, 적정 등)
- 나아가 업종(한국표준산업분류 기준)별 재무 데이터(예, 인건비 대비 매출액, 노동소득분배율 등)
(3) 입력변수
1) 리스크
- 매출액 증가율 / 매출액 대비 영업이익률 / 부채비율 / 유동비율
- 기업의 생존가능성 혹은 지속가능성 판단을 위한 데이터
2) 운영 효율성
- 매출 대비 인건비율 / 노동생산성 / 노동소득분배율 / 인적자원투자수익율(HCROI)
- 인력(인건비) 투자 효율 판단을 위한 데이터
3) 보정 변수
- 업력 / 평균연령 / 평균 근속년수
- 해석 맥락을 결정하는 변수
(4) Feature Engineering
- 업종 평균 기반 정규화
- 업종 평균 데이터가 제공된 변수는 기업값을 업종 평균 대비 편차로 바꿔넣음
- 업종 평균 데이터가 없는 변수는 표본 기준 z-score로 표준화(평균 0, 표준편차 1)함
- 업종 평균 기반 정규화로 “절대값 비교”가 아니라 “동종 대비 구조”를 학습함에 초점을 둠
(5) Random Forest Classifier
- RandomForestClassifier (scikit-learn)
- Random Forest는 다수의 의사결정나무를 결합해 분산을 낮추고 과적합을 완화하는 앙상블 기법
- 변수 간 상호작용을 규칙 없이 학습하고 결과를 확률로 출력함
(6) Feature Importance(지표 기여도)
- “무엇이 판단에 크게 작용했는가”를 수치로 보여주며 상위는 HCROI/노동생산성/영업이익률/인건비율
- 학습된 Random Forest 기준 중요도 상위는 아래 순서였음
HCROI(z) 0.178
노동생산성(z) 0.153
영업이익률(z) 0.111
인건비율(z) 0.110
유동비율(z) 0.091
위 모델을 활용하였을 때 나온 결과는 아래와 같다. 그리고 앞으로 업무에서 컨설팅 기업의 Data Set을 만들고 이 모델을 활용하여 진단을 하고 방향성 제시에 활용하고자 한다.
(1) 충남 소재 1차 금속 제조업
① 확률 Top2 : 유지 44.4% / 확장 31.0%
② 핵심 시그널 : 노동생산성 낮음, 노동소득분배율 낮음, HCROI 높음
③ 보정 : 특이사항 크지 않음
④ 개선과제
- 핵심인력 유지 + 월간 조기경보 대시보드(Risk/Eff)
- 공정/업무량 기준 병목 제거 → 인당 산출 개선
- 직무별 산출·기여도 연결(직무 손익)로 인력구조 근거화
(2) 서울 소재 연구개발업
① 확률 Top2 : 감축 62.7% / 유지 19.1%
② 핵심 시그널 : 영업이익률 급락, 부채/유동 구조 불리, HCROI 변동
③ 보정 : 업력 짧음(5년) → 구조 미성숙 리스크
④ 개선과제
- 단기적으로 고정비 절감 + 현금버퍼 확보(유동성 방어)
- 전사 감축이 아닌 핵심직무만 남기고 재편(선택과 집중)
- 단기 매출/수익 파이프라인 확정(고객·계약 기반)
(3) 충북 소재 의료 제조업
① 확률 Top2 : 유지 62.7% / 감축 17.2%
② 핵심 시그널 : 효율 신호가 ‘유지’로 수렴, 다만 인건비 부담이 큰 편
③ 보정 : 업력 29년 / 근속 6.8 → 조직 안정
④ 개선과제
- 유지 운영 + 인력 효율 미세조정(라인별 생산성 기준)
- 인건비가 늘어도 버틸 수 있게 단가/공정 개선 동시 추진
- 핵심직무 역량 강화로 HCROI 유지
(4) 서울 소재 정보통신업
① 확률 Top2: 유지 43.6% / 확장 37.4%
② 핵심 시그널: 노동소득분배율/HCROI/인건비율 조합이 ‘유지-확장’ 경계
③ 보정: 근속6.4(조직 안정) → 급격한 구조조정은 비용↑
④ 개선과제
- 유지 운영 + 직무 손익 기반 인력 재배치
- 확장 필요 직무(영업/제품)만 선별 증원
- 성과-보상 연결 강화(투자 대비 회수: HCROI 관리)
E.O.D