월간 인공지능 5호 소버린 AI와 한국적 영상 이해 데이터(2편)

2025-09-22

안녕하세요.

지난 1편에서 소버린 AI에 대해 말씀드렸습니다. 2편에서는 저희가 최근 수행한 한국적 영상 데이터 구축 프로젝트를 소버린 AI의 관점에서 소개해 드리겠습니다.

‍

🎥한국적 영상 이해 데이터 프로젝트와 소버린 AI

‍

지난 월간 인공지능 4호에서 ‘한국적 영상 이해 데이터’ 프로젝트를 소개해 드렸습니다. 우리나라와 연관된 이미지 약 41,000장과 각 이미지에 대한 상세 설명 205,000문장으로 구성되어 있는데요.

‍

다음과 같은 절차로 데이터를 구축했습니다.

1) 방송, 영상 콘텐츠에서 한국 관련 이미지 추출 및 전문가 검수

2) 이미지마다 5개의 설명 문장을 생성(이미지 캡셔닝, 즉 이미지에 대한 설명 생성 작업)

3) 이미지와 설명 문장 검수 및 부적합 표현 수정, 보완

4) 품질 검증과 유효성 평가

이 과정을 통해 한국 고유 문화를 더 잘 이해하는 AI 학습용 데이터를 구축할 수 있었습니다.

‍

월간 인공지능 4호(1편) 바로가기 ⟶ https://www.letr.ai/ko/blog/multimodal-ai-data

‍

그렇다면 왜 이런 데이터가 중요할까요? AI 모델은 학습 데이터에 따라 생각하고 표현하는 방식이 달라집니다. ChatGPT, Gemini 같은 해외 빅테크의 범용 모델은 전 세계 데이터를 폭넓게 다루지만, 정작 우리 생활과 문화가 반영된 데이터는 상대적으로 적습니다. 따라서 한국적 맥락이 담긴 데이터를 우리가 직접 구축해야 우리만 특성을 반영할 수 있는 AI모델을 만들 수 있습니다.

‍

예를 들어 ChatGPT와 Gemini에서 ‘궁전’ 하면 떠오르는 이미지를 하나 만들어 달라고 요청하였더니 이런 이미지를 생성하더군요. 여러분이 떠올리신 궁전의 모습과 일치하나요? 물론 서양식 궁전을 떠올린 분도 많겠지만, 한국의 궁전과는 사뭇 다른 모습이죠.

‍

<ChatGPT와 Gemini가 생성한 ‘궁전’ 이미지>

‍

이런 측면에서 이번 프로젝트는 소버린 AI 전략과 깊이 연관되어 있습니다. 우리 사회와 문화에 맞는 AI를 직접 만든다는 것이 소버린 AI의 핵심이기 때문이지요. 한국적 영상 이해 데이터 프로젝트는 그 첫걸음으로, 앞으로 AI가 우리 문화의 맥락을 더 정교하게 이해하고 반영하는데 중요한 밑거름이 될 것입니다. 나아가 이는 단순히 기술 개발을 넘어, 우리 스스로 문화적 주권을 지켜내는 길이기도 합니다.

‍