콘텐츠로 이동

2026 03 03

2026-03-03

AI 하네스

참고: https://v.daum.net/v/20260302140601577
참고: https://www.stdy.blog/harness-tool-agent/
참고: https://news.hada.io/topic?id=26222
참고: https://leansprint.kr/ai-agent-harness-competitive-advantage-for-startups/
참고: https://openai.com/index/harness-engineering/

  • 개요
    • 하네스: AI 모델이 장시간 작업을 수행하도록 관리하는 인프라 기술
      • AI 모델 => 연산
      • 하네스 => 외부 도구와 AI 모델을 연결, 데이터 접근 관리, 다른 에이전트 관리
    • AI 엔진 자체가 아니라 엔진을 잘 활용하는 설계 기술이 성능을 좌우한다
    • 모델 성능이 수렴하면서, 동일한 모델을 어떻게 감싸고 제어하느냐가 AI 에이전트 비즈니스의 성패 좌우!
  • OpenAI
    • 코드를 작성하는 것보다, 코덱스 에이전트가 안정적으로 작업할 수 있는 피드백 루프 구축이 목표
    • 코드 작성 => 문서, 의존성 규칙, 린터, 테스트 인프라, 관측 체계에 집중 투자
      • 라인 단위 코드리뷰에는 별로 투자하지 않음
    • 문법/구현 => 아키텍처 설계, 명세 작성, 피드백 루프 설계로 이동 중
  • SW Engineering 미래 견해
    • 아키텍처, 기술부채, 확장성, 모듈성에 깊이 신경 씀
    • 새로운 기능 추가가 쉽도록 에너지를 투자하는 것
  • 실제 시스템 구성
    1. 스펙 기반 워크플로우
      • AI와의 대화를 통해 "매우 구체적이고 상세한 스펙"을 먼저 작성
      • 요구사항 ID를 통한 제품 스펙 ~ 실행 계획까지 추적 가능하도록 구조화
      • 검증 방식이 명시된 수용 기준 포함
        • TEST, BROWSER:DOM, curl/bash
    2. AI Coding Toolkit
      • 프롬프트, 스킬, 훅, 스크립트로 구성된 툴킷이 에이전트의 작업 방식 제약.
      • 에이전트 지침 == 인프라
        • AGENTS.md: 보수적 수정, 기존 인터페이스 유지, TDD 준수, 추측 금지, git 히스토리 override 금지