KT, 한국형 LLM ‘믿:음 2.0’ 공개…소버린 AI 전략 본격 시동

허깅페이스 통해 오픈소스 공개…상업적 활용도 허용
정부 ‘독자 AI 파운데이션’ 프로젝트 참가 준비
GPT-4 한국 특화 모델과 병행…AX 시장 공략 시동

최영준 기자

cyj@sateconomy.co.kr | 2025-07-03 14:40:17

▲ KT 믿음 <사진=KT>

 

[토요경제 = 최영준 기자] KT가 자체 개발한 한국어 특화 대형언어모델(LLM) ‘믿:음 2.0’을 공개하고 소버린 인공지능(AI) 전략에 본격 합류했다.

KT는 3일 온라인 브리핑을 열고 자사 생성형 AI ‘믿:음 2.0’의 오픈소스를 글로벌 개발 플랫폼 허깅페이스를 통해 공개할 예정이라고 밝혔다. 기업과 개인, 공공 부문 누구나 제약 없이 상업적으로 활용할 수 있도록 해 한국형 LLM 대중화에 나선다는 방침이다.

‘믿:음’은 KT가 독자적으로 개발한 한국 특화 AI 모델이다. 한국어의 언어 구조와 사회문화적 맥락을 반영한 데이터를 학습해 국내 환경에 최적화된 LLM을 지향한다. 지난해 1.0 버전을 출시한 이후 약 2년 만에 업그레이드된 2.0 모델을 선보였다.

이번에 공개된 모델은 115억 파라미터 규모의 ‘믿:음 2.0 베이스’와 23억 파라미터 규모의 ‘미니’ 2종이다. KT는 향후 고성능 ‘프로’ 모델도 순차적으로 출시할 계획이다.

신동훈 생성형 AI 랩장(CAIO)은 “기간 통신 사업자로서 생성형 AI 원천 기술을 확보해야 한다는 믿음으로 믿:음을 고도화했다”며 “정부가 추진하는 ‘독자 AI 파운데이션 모델 프로젝트’에 참여하려고 준비 중”이라고 밝혔다.

베이스 모델은 한국 특화 지식과 문서 기반 질의응답에 강점을 보이고 미니 모델은 경량화된 구조로 다양한 경량 응용처에 적합하다는 설명이다.

KT는 교육·법률 문서, 도서, 특허 등 방대한 한국 특화 데이터를 수집해 학습에 활용했으며 한국어 구조에 특화된 자체 토크나이저도 개발해 정확도를 높였다.

신 상무는 “모든 작업에 GPT 같은 대형 모델이 필요한 건 아니”라며 “고객 목적에 따라 간단한 요약이나 정형 응답에는 믿:음을, 복잡한 작업에는 GPT를 병행 활용하는 방식으로 서비스할 예정”이라고 설명했다.

KT는 현재 마이크로소프트(MS)와 GPT-4 기반의 한국 특화 모델도 공동 개발 중이다. 다만 출시 시점은 구체적으로 밝히지 않았다.

이날 KT는 믿:음 2.0의 성능 평가 결과도 공개했다. 사회·문화 분야에서는 기존 A사 모델 대비 약 9점 높은 81.2점을 기록하면서 한국어 이해와 전문지식 분야에서도 유사한 수준의 성능을 확보한 것으로 나타났다.

SK텔레콤이 같은 날 공개한 ‘에이닷 엑스’ 모델과의 비교에 대해서는 “매개변수 규모에서 직접 비교는 의미 없다”고 선을 그으면서 “곧 출시될 프로 모델이 그 이상의 성능을 확보하고 있다”고 설명했다.

KT는 믿:음 기반 AI 모델을 바탕으로 공공과 금융을 포함한 다양한 산업 분야의 AI 전환(AX)을 지원할 계획이다. 교육·법률·B2C 분야까지 사업 확대를 검토 중이며, 퍼블릭 모델 튜닝, 추론, 멀티모달 기능도 순차적으로 공개할 예정이다.

오승필 기술혁신부문장(CTO)은 “하나의 AI 모델만 선택해 나머지를 버리는 것이 아니라, 모든 라인업에 한국적 데이터를 주입해 융합 활용하는 것이 KT의 철학”이라고 밝혔다.

KT는 이번 프로젝트에서 리벨리온 등 국내 NPU 스타트업과도 협력해 국산 AI 생태계 구축에 방점을 찍었다.

또한 KT는 국가가 보유한 공공 문서 데이터를 AI 학습에 활용할 수 있도록 관련 규제 개선을 정부에 요청한 상태다.

 

토요경제 / 최영준 기자 cyj@sateconomy.co.kr 

[ⓒ 토요경제. 무단전재-재배포 금지]