콘텐츠로 이동

Joel's TIL

2026 03 03

2026 03 03

2026-03-03¶

AI 하네스¶

참고: https://v.daum.net/v/20260302140601577
참고: https://www.stdy.blog/harness-tool-agent/
참고: https://news.hada.io/topic?id=26222
참고: https://leansprint.kr/ai-agent-harness-competitive-advantage-for-startups/
참고: https://openai.com/index/harness-engineering/

개요
- 하네스: AI 모델이 장시간 작업을 수행하도록 관리하는 인프라 기술
  - AI 모델 => 연산
  - 하네스 => 외부 도구와 AI 모델을 연결, 데이터 접근 관리, 다른 에이전트 관리
- AI 엔진 자체가 아니라 엔진을 잘 활용하는 설계 기술이 성능을 좌우한다
- 모델 성능이 수렴하면서, 동일한 모델을 어떻게 감싸고 제어하느냐가 AI 에이전트 비즈니스의 성패 좌우!

OpenAI
- 코드를 작성하는 것보다, 코덱스 에이전트가 안정적으로 작업할 수 있는 피드백 루프 구축이 목표
- 코드 작성 => 문서, 의존성 규칙, 린터, 테스트 인프라, 관측 체계에 집중 투자
  - 라인 단위 코드리뷰에는 별로 투자하지 않음
- 문법/구현 => 아키텍처 설계, 명세 작성, 피드백 루프 설계로 이동 중

SW Engineering 미래 견해
- 아키텍처, 기술부채, 확장성, 모듈성에 깊이 신경 씀
- 새로운 기능 추가가 쉽도록 에너지를 투자하는 것

실제 시스템 구성
1. 스펙 기반 워크플로우
  - AI와의 대화를 통해 "매우 구체적이고 상세한 스펙"을 먼저 작성
  - 요구사항 ID를 통한 제품 스펙 ~ 실행 계획까지 추적 가능하도록 구조화
  - 검증 방식이 명시된 수용 기준 포함
    - TEST, BROWSER:DOM, curl/bash
2. AI Coding Toolkit
  - 프롬프트, 스킬, 훅, 스크립트로 구성된 툴킷이 에이전트의 작업 방식 제약.
  - 에이전트 지침 == 인프라
    - AGENTS.md: 보수적 수정, 기존 인터페이스 유지, TDD 준수, 추측 금지, git 히스토리 override 금지