![[개발일지] #2. 두번째 도전과 완성](https://cdn.offpiste.ai/images/articles/1637/cover/dcc901cb-e812-41c0-b55c-35e763393089_화면 캡처 2026-06-10 135104.png)
HR Stats 개발이 실패로 끝났을 때 이 개발을 기획했을 때의 문제인식과 방향성에 대해서는 의심하지 않았다. 데이터 입력 프레임워크, 데이터 기반의 진단(기술적 진단), 업종별·산업별 비교, 경영진을 위한 의사결정을 위한 도구로 구현하기 위해서는 Bubble로는 내가 원하는 수준을 구현할 수 없었고 데이터를 쌓고 모델을 학습시키는 구조를 만들기엔 근본적인 한계가 있었기 때문이다.
그 이후 두 번째 시도는 잠시 접어두고 있었다. 방향은 확신했으나 개발 경험이 전무하고 인사노무만 10년동안 해온 문과 출신인 내가 혼자 할 수 있는 수준이 아니라는 걸 알았기 때문이다. 그러던 중 안티그래비티를 만났다. 기획을 입력하면 코드를 짜주고 오류가 나면 수정해주고 구조를 설명하면 구현해주는 도구였다. 처음엔 반신반의 했지만 몇 번 써보고 나서 확신이 생겼다. 기술력의 부재가 더 이상 장벽이 아닐 수 있겠다 라는 생각으로 2025년 12월 다시 개발 작업을 시작했다.
HR Stats의 실패에서 얻은 교훈을 구조에 반영했다. 데이터 입력은 사용자가 하는 게 아니라 컨설턴트인 내가 직접 입력하는 방식으로 바꿨다. 결과 해석은 GPT API에 의존하는 게 아니라 내 도메인 지식을 규칙으로 변환해서 코드에 박아 넣었다. 그리고 단순한 계산기가 아니라 ML 모델이 업종 벤치마크 데이터와 비교해서 판단을 내리는 구조로 설계했다. Python, FastAPI, Supabase, Random Forest, Gradient Boosting. 처음 들어보는 단어들이었다. 코드 한 줄 못 짰지만 그래도 기획은 내가 했고 AI 에이전트가 구현했고 나는 검증했다.
말은 쉽지만 실제 개발 과정은 달랐다. 오류가 발생하면 원인을 찾는 데만 며칠이 걸렸다. 익숙하지 않은 구조라 어디서 문제가 생긴 건지 파악하기가 어려웠다. 같은 실수를 반복했고 분명히 고쳤다고 생각했는데 다른 곳에서 똑같은 문제가 터졌다. 단위 변환이 특히 그랬다. 재무 데이터가 원 단위인지 천원 단위인지 억원 단위인지에 따라 계산 결과가 완전히 달라진다. 한 곳을 고치면 다른 곳이 틀렸고 다른 곳을 고치면 또 다른 곳이 터졌다. 화면에 표시되는 숫자가 맞는 건지 틀린 건지조차 처음엔 판단하기 어려웠다.
롤백도 수없이 했다. 기능 하나를 추가했다가 기존 페이지가 통째로 깨지면 Render 커밋 이력을 뒤져서 이전 버전으로 되돌렸다. 그리고 다시 시작했다. 한 발 전진하고 두 발 후퇴하는 날이 많았다. AI 에이전트와의 협업도 생각만큼 단순하지 않았다. 지시가 모호하면 엉뚱한 방향으로 코드를 짰고, 범위를 명확히 하지 않으면 건드리지 말아야 할 코드까지 수정했다. 매번 스크린샷으로 검증하고, 확인하고, 다음 단계로 넘어가는 방식을 만들었다. 코딩보다 커뮤니케이션이 더 어려운 순간도 있었다.
그리고 토큰 한도. 대화가 길어지면 컨텍스트가 날아갔다. 처음부터 다시 설명해야 했다. 며칠에 걸쳐 쌓아온 작업 맥락이 사라지는 순간의 허탈함은 겪어본 사람만 안다. 그래도 계속했고 기획했던 모델을 만들기 위해서한달 내내 업종별, 규모별 10년치 1,500행의 벤치마크 데이터를 수집 했고 과거 경험을 바탕으로 내가 세운 규칙을 코드로 넣어놨다. 6개월이 지난 지금 원하는 기능 구현은 다 끝냈다. 본래 목표했던 SATURN LAB Tier 1 세 개 모듈이 작동하고 있다.
기술은 도구이고 방향을 아는 사람이 도구를 쥐었을 때 비로소 의미 있는 것이 만들어진다고 생각한다. 3편에는 기획한 내용을 보다 자세히 풀어볼 계획이다.
E.O.D