Comprehensive Cost Analysis Addendum / 종합 비용 분석 부록
Last verified: 2026년 2월 / February 2026
한국어
개요
본 문서는 혜경궁 홍씨(Lady Hyegyong) AI NPC 프로젝트의 구현 및 운영을 위한 종합적인 비용 분석을 제공합니다. 전시 환경(6개월, 일평균 200명 방문)을 기준으로 세 가지 주요 기술 경로(Path A, B, C)에 따른 초기 투자 비용과 운영 비용을 비교 분석합니다. 이를 통해 프로젝트의 예산 규모와 확장성을 검토하고, 최적의 기술 선택을 위한 재무적 근거를 제시합니다.
핵심 발견
- 최저 비용 경로: Path C(Full Custom + Local Models)가 약 $9,000로 6개월 총 비용이 가장 낮습니다. 이는 높은 초기 하드웨어 투자에도 불구하고 API 비용이 발생하지 않기 때문입니다.
- 최고 유연성 경로: Path B(Custom Stack + ElevenLabs)는 약 $11,300~$13,000로 비용이 가장 높지만, 최상의 한국어 음성 품질과 기술적 제어권을 제공합니다.
- 빠른 구축 경로: Path A(Convai Scale)는 약 $10,000로 중간 수준의 비용이며, 통합 플랫폼을 통한 개발 기간 단축이 가능합니다.
- 비용 구조: 모든 경로에서 하드웨어(Jetson AGX Orin, Quest 3)가 초기 투자의 60% 이상을 차지합니다.
비교 분석
1. 경로별 비용 비교표 (6개월 전시, 5대 헤드셋, 200명/일 기준)
| 항목 (2026년 2월 기준) | Path A (Convai Scale) | Path B (Custom + ElevenLabs) | Path C (Full Custom + Local) |
|---|---|---|---|
| 플랫폼/구독료 | $2,994 (6개월) | $792 (ElevenLabs) | $0 |
| LLM API 비용 | 포함 (Convai) | $3,000+ (GPT-4o) | $0 |
| STT API 비용 | 포함 (Convai) | $500+ (Azure) | $0 (Whisper Sentis) |
| 하드웨어 (초기) | $6,800 | $6,800 | $8,300 |
| 네트워크/기타 | $200 | $200 | $700 |
| 총 예상 비용 (6개월) | ~$10,000 | ~$11,300+ | ~$9,000 |
| 특징 | 빠른 프로토타이핑 | 최상의 한국어 품질 | 오프라인 안정성, 최저 운영비 |
2. 구성 요소별 상세 단가 (2026년 2월 기준)
| 구성 요소 | 세부 항목 | 단가 (예상) | 비고 |
|---|---|---|---|
| LLM | GPT-4o | $0.005 / 1K tokens (Input) | $0.015 / 1K tokens (Output) |
| TTS | ElevenLabs | $0.30 / 1K characters | Turbo v2.5 기준 |
| STT | Azure Speech | $0.001 / 15 seconds | 실시간 스트리밍 기준 |
| 하드웨어 | Jetson AGX Orin | $2,500 / unit | 엣지 AI 서버 |
| 하드웨어 | Meta Quest 3 | $500 / unit | 128GB 모델 기준 |
| 개발 | 커스텀 개발 | $40,000 - $60,000 | 1회성 구축 비용 (인건비 포함) |
추천 및 Trade-off 분석
-
시나리오 1: 예산 최적화 및 장기 운영
- 추천: Path C (Full Custom + Local Models)
- 장점: 초기 하드웨어 투자 이후 추가 API 비용이 거의 없어 장기 전시(1년 이상) 시 가장 경제적입니다.
- 단점: 로컬 모델(Llama 3.2 등)의 한국어 성능이 GPT-4o 대비 낮을 수 있으며, 엣지 서버 관리가 복잡합니다.
-
시나리오 2: 최상의 사용자 경험 및 품질
- 추천: Path B (Custom Stack + ElevenLabs)
- 장점: ElevenLabs의 자연스러운 한국어 음성과 GPT-4o의 깊이 있는 대화 능력을 결합하여 최고의 몰입감을 제공합니다.
- 단점: 사용량에 비례하여 API 비용이 증가하므로 방문객 급증 시 예산 초과 위험이 있습니다.
-
시나리오 3: 빠른 시장 검증 및 프로토타이핑
- 추천: Path A (Convai Scale)
- 장점: NPC 구현에 필요한 기능을 통합 제공하여 개발 기간을 획기적으로 단축할 수 있습니다.
- 단점: 플랫폼 종속성(Vendor Lock-in)이 발생하며, 세밀한 커스터마이징에 제약이 있을 수 있습니다.
스케일링 시나리오 (2026년 2월 기준)
| 시나리오 | 헤드셋 수 | 월간 API 비용 (예상) | 하드웨어 투자 | 6개월 총 비용 (Path B 기준) |
|---|---|---|---|---|
| 파일럿 (Pilot) | 1대 | $150 | $3,000 | ~$4,500 |
| 표준 전시 (Standard) | 5대 | $700 | $6,800 | ~$11,300 |
| 대형 전시장 (Large) | 10대 | $1,300 | $11,000 | ~$22,000 |
ROI 분석 및 위험 요소
- ROI 분석: 전통적인 전시 가이드 고용 비용(월 300만 원 이상) 대비, AI NPC는 초기 투자 후 낮은 유지비로 24시간 운영이 가능하여 1년 내 투자 회수가 가능할 것으로 예상됩니다.
- 위험 요소:
- API 가격 변동: 주요 서비스 제공업체의 가격 정책 변경 시 운영비 상승 가능성.
- 사용량 폭주: 피크 시간대 방문객 집중 시 API 비용 급증.
- 하드웨어 장애: Quest 3 배터리 수명 및 Jetson 서버 고장 시 교체 비용 발생.
알려진 갭 및 향후 과제
- Samsung Galaxy XR: 해당 기기에서의 온디바이스 모델(Path C) 최적화 수준은 아직 검증되지 않은 알려진 갭(Known Gap)입니다.
- 네트워크 비용: 전시장 내 전용 회선 구축 비용은 현장 인프라 상태에 따라 변동될 수 있습니다.
출처 및 참고문헌
- Convai Pricing Page (2026)
- ElevenLabs Pricing & API Documentation (2026)
- OpenAI API Pricing (GPT-4o)
- NVIDIA Jetson AGX Orin Official Store
- Meta Quest for Business Documentation
English
Overview
This document provides a comprehensive cost analysis for the implementation and operation of the Lady Hyegyong AI NPC project. Based on an exhibition scenario (6 months, average 200 visitors/day), it compares the initial investment and operational costs across three major technical paths (Path A, B, and C). This analysis aims to review the project’s budget scale and scalability, providing a financial basis for optimal technology selection.
Key Findings
- Lowest Cost Path: Path C (Full Custom + Local Models) has the lowest total 6-month cost at approximately $9,000. This is due to the absence of API costs, despite a higher initial hardware investment.
- Highest Flexibility Path: Path B (Custom Stack + ElevenLabs) has the highest cost at approximately $11,300 - $13,000, but offers the best Korean voice quality and full technical control.
- Fastest Deployment Path: Path A (Convai Scale) is a mid-range option at approximately $10,000, allowing for shorter development time through an integrated platform.
- Cost Structure: Hardware (Jetson AGX Orin, Quest 3) accounts for over 60% of the initial investment in all paths.
Comparative Analysis
1. Cost Comparison Table by Path (6-month exhibition, 5 headsets, 200 visitors/day)
| Item (As of February 2026) | Path A (Convai Scale) | Path B (Custom + ElevenLabs) | Path C (Full Custom + Local) |
|---|---|---|---|
| Platform/Subscription | $2,994 (6 months) | $792 (ElevenLabs) | $0 |
| LLM API Cost | Included (Convai) | $3,000+ (GPT-4o) | $0 |
| STT API Cost | Included (Convai) | $500+ (Azure) | $0 (Whisper Sentis) |
| Hardware (Initial) | $6,800 | $6,800 | $8,300 |
| Network/Misc | $200 | $200 | $700 |
| Total Est. Cost (6mo) | ~$10,000 | ~$11,300+ | ~$9,000 |
| Key Features | Rapid Prototyping | Best Korean Quality | Offline Stability, Lowest OpEx |
2. Detailed Unit Costs by Component (As of February 2026)
| Component | Detail Item | Unit Cost (Est.) | Remarks |
|---|---|---|---|
| LLM | GPT-4o | $0.005 / 1K tokens (Input) | $0.015 / 1K tokens (Output) |
| TTS | ElevenLabs | $0.30 / 1K characters | Based on Turbo v2.5 |
| STT | Azure Speech | $0.001 / 15 seconds | Based on Real-time Streaming |
| Hardware | Jetson AGX Orin | $2,500 / unit | Edge AI Server |
| Hardware | Meta Quest 3 | $500 / unit | Based on 128GB Model |
| Development | Custom Development | $40,000 - $60,000 | One-time setup cost (incl. labor) |
Recommendations & Trade-off Analysis
-
Scenario 1: Budget Optimization & Long-term Operation
- Recommendation: Path C (Full Custom + Local Models)
- Pros: Minimal additional API costs after initial hardware investment, making it the most economical for long-term exhibitions (over 1 year).
- Cons: Korean performance of local models (e.g., Llama 3.2) may be lower than GPT-4o, and edge server management is complex.
-
Scenario 2: Best User Experience & Quality
- Recommendation: Path B (Custom Stack + ElevenLabs)
- Pros: Provides the highest immersion by combining ElevenLabs’ natural Korean voice with GPT-4o’s deep conversational capabilities.
- Cons: API costs increase in proportion to usage, posing a risk of budget overruns during visitor spikes.
-
Scenario 3: Rapid Market Validation & Prototyping
- Recommendation: Path A (Convai Scale)
- Pros: Significantly shortens development time by providing integrated features for NPC implementation.
- Cons: Potential for vendor lock-in and limitations on fine-grained customization.
Scaling Scenarios (As of February 2026)
| Scenario | Headsets | Monthly API Cost (Est.) | Hardware Investment | Total 6mo Cost (Path B) |
|---|---|---|---|---|
| Pilot | 1 unit | $150 | $3,000 | ~$4,500 |
| Standard Exhibition | 5 units | $700 | $6,800 | ~$11,300 |
| Large Venue | 10 units | $1,300 | $11,000 | ~$22,000 |
ROI Analysis & Risk Factors
- ROI Analysis: Compared to the cost of hiring traditional exhibition guides (over 3 million KRW/month), AI NPCs can be operated 24/7 with low maintenance costs after the initial investment, with an expected ROI within one year.
- Risk Factors:
- API Price Fluctuations: Potential for increased operational costs if major service providers change their pricing policies.
- Usage Spikes: Sudden increases in API costs during peak visitor hours.
- Hardware Failure: Replacement costs for Quest 3 battery life or Jetson server malfunctions.
Known Gaps & Future Work
- Samsung Galaxy XR: The optimization level of on-device models (Path C) on this device remains an unverified Known Gap.
- Network Costs: The cost of establishing a dedicated line within the exhibition hall may vary depending on the site’s infrastructure status.
Sources & References
- Convai Pricing Page (2026)
- ElevenLabs Pricing & API Documentation (2026)
- OpenAI API Pricing (GPT-4o)
- NVIDIA Jetson AGX Orin Official Store
- Meta Quest for Business Documentation