Skip to Content

Comprehensive Cost Analysis Addendum / 종합 비용 분석 부록

Last verified: 2026년 2월 / February 2026


한국어

개요

본 문서는 혜경궁 홍씨(Lady Hyegyong) AI NPC 프로젝트의 구현 및 운영을 위한 종합적인 비용 분석을 제공합니다. 전시 환경(6개월, 일평균 200명 방문)을 기준으로 세 가지 주요 기술 경로(Path A, B, C)에 따른 초기 투자 비용과 운영 비용을 비교 분석합니다. 이를 통해 프로젝트의 예산 규모와 확장성을 검토하고, 최적의 기술 선택을 위한 재무적 근거를 제시합니다.

핵심 발견

  • 최저 비용 경로: Path C(Full Custom + Local Models)가 약 $9,000로 6개월 총 비용이 가장 낮습니다. 이는 높은 초기 하드웨어 투자에도 불구하고 API 비용이 발생하지 않기 때문입니다.
  • 최고 유연성 경로: Path B(Custom Stack + ElevenLabs)는 약 $11,300~$13,000로 비용이 가장 높지만, 최상의 한국어 음성 품질과 기술적 제어권을 제공합니다.
  • 빠른 구축 경로: Path A(Convai Scale)는 약 $10,000로 중간 수준의 비용이며, 통합 플랫폼을 통한 개발 기간 단축이 가능합니다.
  • 비용 구조: 모든 경로에서 하드웨어(Jetson AGX Orin, Quest 3)가 초기 투자의 60% 이상을 차지합니다.

비교 분석

1. 경로별 비용 비교표 (6개월 전시, 5대 헤드셋, 200명/일 기준)

항목 (2026년 2월 기준)Path A (Convai Scale)Path B (Custom + ElevenLabs)Path C (Full Custom + Local)
플랫폼/구독료$2,994 (6개월)$792 (ElevenLabs)$0
LLM API 비용포함 (Convai)$3,000+ (GPT-4o)$0
STT API 비용포함 (Convai)$500+ (Azure)$0 (Whisper Sentis)
하드웨어 (초기)$6,800$6,800$8,300
네트워크/기타$200$200$700
총 예상 비용 (6개월)~$10,000~$11,300+~$9,000
특징빠른 프로토타이핑최상의 한국어 품질오프라인 안정성, 최저 운영비

2. 구성 요소별 상세 단가 (2026년 2월 기준)

구성 요소세부 항목단가 (예상)비고
LLMGPT-4o$0.005 / 1K tokens (Input)$0.015 / 1K tokens (Output)
TTSElevenLabs$0.30 / 1K charactersTurbo v2.5 기준
STTAzure Speech$0.001 / 15 seconds실시간 스트리밍 기준
하드웨어Jetson AGX Orin$2,500 / unit엣지 AI 서버
하드웨어Meta Quest 3$500 / unit128GB 모델 기준
개발커스텀 개발$40,000 - $60,0001회성 구축 비용 (인건비 포함)

추천 및 Trade-off 분석

  • 시나리오 1: 예산 최적화 및 장기 운영

    • 추천: Path C (Full Custom + Local Models)
    • 장점: 초기 하드웨어 투자 이후 추가 API 비용이 거의 없어 장기 전시(1년 이상) 시 가장 경제적입니다.
    • 단점: 로컬 모델(Llama 3.2 등)의 한국어 성능이 GPT-4o 대비 낮을 수 있으며, 엣지 서버 관리가 복잡합니다.
  • 시나리오 2: 최상의 사용자 경험 및 품질

    • 추천: Path B (Custom Stack + ElevenLabs)
    • 장점: ElevenLabs의 자연스러운 한국어 음성과 GPT-4o의 깊이 있는 대화 능력을 결합하여 최고의 몰입감을 제공합니다.
    • 단점: 사용량에 비례하여 API 비용이 증가하므로 방문객 급증 시 예산 초과 위험이 있습니다.
  • 시나리오 3: 빠른 시장 검증 및 프로토타이핑

    • 추천: Path A (Convai Scale)
    • 장점: NPC 구현에 필요한 기능을 통합 제공하여 개발 기간을 획기적으로 단축할 수 있습니다.
    • 단점: 플랫폼 종속성(Vendor Lock-in)이 발생하며, 세밀한 커스터마이징에 제약이 있을 수 있습니다.

스케일링 시나리오 (2026년 2월 기준)

시나리오헤드셋 수월간 API 비용 (예상)하드웨어 투자6개월 총 비용 (Path B 기준)
파일럿 (Pilot)1대$150$3,000~$4,500
표준 전시 (Standard)5대$700$6,800~$11,300
대형 전시장 (Large)10대$1,300$11,000~$22,000

ROI 분석 및 위험 요소

  • ROI 분석: 전통적인 전시 가이드 고용 비용(월 300만 원 이상) 대비, AI NPC는 초기 투자 후 낮은 유지비로 24시간 운영이 가능하여 1년 내 투자 회수가 가능할 것으로 예상됩니다.
  • 위험 요소:
    • API 가격 변동: 주요 서비스 제공업체의 가격 정책 변경 시 운영비 상승 가능성.
    • 사용량 폭주: 피크 시간대 방문객 집중 시 API 비용 급증.
    • 하드웨어 장애: Quest 3 배터리 수명 및 Jetson 서버 고장 시 교체 비용 발생.

알려진 갭 및 향후 과제

  • Samsung Galaxy XR: 해당 기기에서의 온디바이스 모델(Path C) 최적화 수준은 아직 검증되지 않은 알려진 갭(Known Gap)입니다.
  • 네트워크 비용: 전시장 내 전용 회선 구축 비용은 현장 인프라 상태에 따라 변동될 수 있습니다.

출처 및 참고문헌

  • Convai Pricing Page (2026)
  • ElevenLabs Pricing & API Documentation (2026)
  • OpenAI API Pricing (GPT-4o)
  • NVIDIA Jetson AGX Orin Official Store
  • Meta Quest for Business Documentation

English

Overview

This document provides a comprehensive cost analysis for the implementation and operation of the Lady Hyegyong AI NPC project. Based on an exhibition scenario (6 months, average 200 visitors/day), it compares the initial investment and operational costs across three major technical paths (Path A, B, and C). This analysis aims to review the project’s budget scale and scalability, providing a financial basis for optimal technology selection.

Key Findings

  • Lowest Cost Path: Path C (Full Custom + Local Models) has the lowest total 6-month cost at approximately $9,000. This is due to the absence of API costs, despite a higher initial hardware investment.
  • Highest Flexibility Path: Path B (Custom Stack + ElevenLabs) has the highest cost at approximately $11,300 - $13,000, but offers the best Korean voice quality and full technical control.
  • Fastest Deployment Path: Path A (Convai Scale) is a mid-range option at approximately $10,000, allowing for shorter development time through an integrated platform.
  • Cost Structure: Hardware (Jetson AGX Orin, Quest 3) accounts for over 60% of the initial investment in all paths.

Comparative Analysis

1. Cost Comparison Table by Path (6-month exhibition, 5 headsets, 200 visitors/day)

Item (As of February 2026)Path A (Convai Scale)Path B (Custom + ElevenLabs)Path C (Full Custom + Local)
Platform/Subscription$2,994 (6 months)$792 (ElevenLabs)$0
LLM API CostIncluded (Convai)$3,000+ (GPT-4o)$0
STT API CostIncluded (Convai)$500+ (Azure)$0 (Whisper Sentis)
Hardware (Initial)$6,800$6,800$8,300
Network/Misc$200$200$700
Total Est. Cost (6mo)~$10,000~$11,300+~$9,000
Key FeaturesRapid PrototypingBest Korean QualityOffline Stability, Lowest OpEx

2. Detailed Unit Costs by Component (As of February 2026)

ComponentDetail ItemUnit Cost (Est.)Remarks
LLMGPT-4o$0.005 / 1K tokens (Input)$0.015 / 1K tokens (Output)
TTSElevenLabs$0.30 / 1K charactersBased on Turbo v2.5
STTAzure Speech$0.001 / 15 secondsBased on Real-time Streaming
HardwareJetson AGX Orin$2,500 / unitEdge AI Server
HardwareMeta Quest 3$500 / unitBased on 128GB Model
DevelopmentCustom Development$40,000 - $60,000One-time setup cost (incl. labor)

Recommendations & Trade-off Analysis

  • Scenario 1: Budget Optimization & Long-term Operation

    • Recommendation: Path C (Full Custom + Local Models)
    • Pros: Minimal additional API costs after initial hardware investment, making it the most economical for long-term exhibitions (over 1 year).
    • Cons: Korean performance of local models (e.g., Llama 3.2) may be lower than GPT-4o, and edge server management is complex.
  • Scenario 2: Best User Experience & Quality

    • Recommendation: Path B (Custom Stack + ElevenLabs)
    • Pros: Provides the highest immersion by combining ElevenLabs’ natural Korean voice with GPT-4o’s deep conversational capabilities.
    • Cons: API costs increase in proportion to usage, posing a risk of budget overruns during visitor spikes.
  • Scenario 3: Rapid Market Validation & Prototyping

    • Recommendation: Path A (Convai Scale)
    • Pros: Significantly shortens development time by providing integrated features for NPC implementation.
    • Cons: Potential for vendor lock-in and limitations on fine-grained customization.

Scaling Scenarios (As of February 2026)

ScenarioHeadsetsMonthly API Cost (Est.)Hardware InvestmentTotal 6mo Cost (Path B)
Pilot1 unit$150$3,000~$4,500
Standard Exhibition5 units$700$6,800~$11,300
Large Venue10 units$1,300$11,000~$22,000

ROI Analysis & Risk Factors

  • ROI Analysis: Compared to the cost of hiring traditional exhibition guides (over 3 million KRW/month), AI NPCs can be operated 24/7 with low maintenance costs after the initial investment, with an expected ROI within one year.
  • Risk Factors:
    • API Price Fluctuations: Potential for increased operational costs if major service providers change their pricing policies.
    • Usage Spikes: Sudden increases in API costs during peak visitor hours.
    • Hardware Failure: Replacement costs for Quest 3 battery life or Jetson server malfunctions.

Known Gaps & Future Work

  • Samsung Galaxy XR: The optimization level of on-device models (Path C) on this device remains an unverified Known Gap.
  • Network Costs: The cost of establishing a dedicated line within the exhibition hall may vary depending on the site’s infrastructure status.

Sources & References

  • Convai Pricing Page (2026)
  • ElevenLabs Pricing & API Documentation (2026)
  • OpenAI API Pricing (GPT-4o)
  • NVIDIA Jetson AGX Orin Official Store
  • Meta Quest for Business Documentation