AI 심화 모델링 학습 가이드: MLOps
과목: MLOps (Machine Learning Operations)
주요 학습 토픽:
- 학습-서빙 편향 (Training-Serving Skew)
- CI/CD/CT 파이프라인 (CI/CD/CT Pipelines)
- 실험 관리 및 MLOps 플랫폼 (Experiment Management & MLOps Platforms)
- 모델 거버넌스 및 모델 카드 (Model Governance & Model Cards)
요약:
본 학습 가이드는 MLOps의 핵심 원칙에 대한 이해를 돕는 데 목적이 있습니다. 특히 모델 개발(학습) 환경과 실제 운영(서빙) 환경 간의 차이로 인해 발생하는 문제를 해결하는 방법, 코드와 모델의 변경 사항을 안정적으로 관리하고 배포하는 자동화 파이프라인의 개념, 수많은 머신러닝 실험을 체계적으로 추적하고 재현하는 방법, 그리고 마지막으로 AI를 책임감 있게 사용하기 위한 모델 거버넌스의 중요성에 대해 학습합니다.
주요 개념:
- 학습-서빙 편향 (Training-Serving Skew):
- 설명: 모델을 학습시키는 환경과 학습된 모델이 사용되는 실제 서비스(서빙) 환경 간의 차이로 인해 모델 성능이 저하되는 현상입니다. 이는 데이터 전처리 방식의 차이, 라이브러리 버전의 불일치, 피처 생성 로직의 차이 등에서 비롯됩니다.
- 핵심: 이 문제의 해결은 '환경의 불일치'를 해소하는 데 있습니다. 학습과 서빙 파이프라인에서 동일한 코드와 전처리 로직을 사용하거나, 피처 스토어(Feature Store)를 도입하여 피처를 일관되게 관리하는 것이 근본적인 해결책입니다.
- 참고: '데이터 드리프트'는 시간이 지남에 따라 실제 데이터의 분포 자체가 변하는 현상으로, 환경의 불일치가 원인인 학습-서빙 편향과는 구분되어야 합니다. 드리프트의 해결책은 '지속적인 모니터링 및 재학습'입니다.
- CI/CD/CT 파이프라인:
- 설명: 소프트웨어 개발의 자동화 파이프라인 개념을 머신러닝 시스템에 확장한 것입니다.
- CI (Continuous Integration, 지속적 통합): 코드 변경사항을 주기적으로 빌드하고 테스트하여 통합하는 과정입니다. 새로운 모델 아키텍처 코드가 커밋되면 CI가 트리거됩니다.
- CD (Continuous Delivery/Deployment, 지속적 제공/배포): 테스트를 통과한 코드를 실제 운영 환경까지 자동으로 배포하는 과정입니다.