통신사·포털 등 주요 IT 기업들은 AI(인공지능) 초거대 언어모델인 'GPT-3'에 대항할 한국어에 특화된 초거대 AI를 속속 선보이고 있다. 특히 자사의 주요 서비스에 AI 기술을 속속 적용하고 나섰다.
네이버는 지난해 5월 국내 기업 중 가장 빨리 초거대 AI인 '하이퍼클로바'를 출시해 각종 서비스에 적용했다. SK텔레콤은 GPT-3의 한국어 특화 버전을 자체 개발해 자사 서비스에 적용하기 시작했으며, KT는 초거대 AI인 '믿음'을 이달 상용화한다고 발표했다. 또 LG의 AI 연구원은 초거대 AI인 '엑사원'을 개발해 산업현장에 투입 중이며, 카카오도 GPT-3 모델 기반의 AI 언어모델을 깃허브에 공개했다.
차세대 AI로 평가받는 초거대 AI는 대규모 데이터를 스스로 학습해 인간처럼 생각하고 판단할 수 있는 AI를 말한다. GPT-3는 지난 2020년 6월 공개됐다. 미국의 오픈AI가 AI 언어모델 'GPT-3'를 발표했는데 파라미터가 많을수록 AI가 더 정교한 학습을 하는 것으로 분석된다. GPT-3는 무려 1750개의 파라미터를 갖췄는데 이는 기존 GPT-1의 1000배에 달하며, GPT-2의 117배에 해당하는 수치이다.
하지만 GPT-3의 API(프로그램 언어 형식)을 분석해보면 97% 영어가 사용됐으며 한국어는 0.01%가 적용된 데 불과하다. 이에 따라 국내 기업들은 한국어에 특화된 AI 언어모델 개발에 나선 것이다.
◆초거대 AI 개발 경쟁 '활발'...서비스 적용 분주
네이버는 크게 검색, 쇼핑, 클로바, 플레이스에 초거대 AI 하이퍼클로바를 적용했다.
검색에서 사용자가 오타를 입력하거나 맞춤법을 잘못 입력할 경우, 잘못 알고 있는 검색어를 입력한 경우, 하이퍼클로바가 올바른 단어로 전환해 검색해주거나 적절한 검색어를 추천해준다. 음성 검색에서도 사용자 발화 맥락에 대한 이해도를 높였으며, 긴 구어체나 어려운 질의를 키워드형으로 자동 변환해주고, 음성인식 오류 감소로 음성검색 성능을 크게 높였다.
네이버쇼핑 내 개인화 큐레이션 서비스탭인 '포유'에도 하이퍼클로바가 적용돼 더 정교화된 상품 추천을 제공한다. 'AI 리뷰 요약' 기능으로 하이퍼클로버가 방대한 쇼핑 리뷰를 분석한 후 하나의 자연스러운 문장으로 만들어 리뷰의 요약본을 한 눈에 파악할 수 있다.
또 하이퍼클로바의 딥러닝 기술이 '클로바 노트'의 음성인식 엔진 'NEST'에 적용돼 음성인식 정확도를 개선시켰다. 또 플레이스 코너에서 업종별로 적합한 키워드를 추출하는 데 소요되는 시간을 87% 단축할 수 있다.
네이버 관계자는 "하이퍼클로바는 언어모델을 넘어 텍스트 뿐 아니라 이미지, 음성 등을 같이 이해할 수 있는 '멀티모달' 모델로 확장해나가며 SME(중소상공인), 크리에이터를 위한 다양한 솔루션을 적용할 예정"이라며 "장기적으로는 네이버 클라우드 플랫폼을 통해 스타트업 등 기업 고객들이 하이퍼클로바 기술을 서비스에 적용할 수 있도록 지원할 계획"이라고 밝혔다.
SKT는 초거대 AI를 지난 5월 오픈베타 버전으로 처음 공개된 AI 서비스 '에이닷(A.)'에 적용했다. 에이닷에서 한국어 특화 GPT-3 기반의 '에이닷tv'와 '에이닷 게임'을 선보였다. 에이닷tv는 이용자들의 취향에 맞는 개인화된 콘텐츠를 광고 없이 무료로 즐길 수 있도록 지원하며, 에이닷 게임은 26개 캐주얼 게임을 할 수 있고 게임플레이에 대한 리워드로 에이닷 캐릭터를 꾸밀 수 있는 포인트도 제공한다.
또 SKT가 AI 기업 코난테크놀로지 지분 20.77%를 인수해 2대 주주가 된 만큼 초거대 AI 기술과 코난테크놀로지의 검색 및 음성 합성 기술을 활용해 에이닷 기능 차별화에 나설 계획이다.
KT는 지난 16일 초거대 AI인 '믿음'을 상용화해 AI 전문상담, AI 감성케어 서비스를 처음 선보였다.
믿음은 다양한 응용 사례를 쉽게 학습할 수 있는 '협업 융합 지능'을 보유한 것이 최대 강점이다. 믿음은 감성을 이해하고 인간과 공감하는 AI를 목표로 개발됐으며, 적은 양의 데이터를 학습해 사용자 의도를 해석하고 상황에 맞춰 말투나 목소리 등을 바꿀 수 있다. 또 이전에 나눴던 대화를 기억해 활용하는 등 '사람에 더 가까운 대화'를 지향하고 있다. AI 감성케어는 AI가 시니어 고객과 과거 대화를 기억하고, 좋아하는 장소나 취미 등 고객의 상황을 인지해 감성적인 대화를 나눌 수 있는 서비스다.
LG는 그룹 차원에서 AI 연구소가 초거대 AI '엑사원'을 출시했으며 각종 산업현장에 적용하는 작업을 진행하고 있다. LG 엑사원은 '인간을 위한 전문가 AI'라는 의미로, 국내 최대인 3000억개의 파라미터를 보유했다. 언어 뿐만 아니라 이미지·영상까지 인간의 의사소통과 관련된 다양한 정보를 습득하고 다룰 수 있는 '멀티 모댈리티' 능력을 갖췄다.
LG는 화학·의학·과학·기술 서적 전문 네덜란드 출판사 '엘스비어'와 협력해 개발하고 있는 '화학전문가 AI'를 위해 엑사원을 적용하고 있다. 또 LG유플러스는 LG AI 연구원과 협력해 초거대 AI를 AICC(AI 콜센터), 챗봇 등에 적용할 계획이다.
카카오의 AI 자회사인 카카오브레인은 GPT-3 모델 기반의 한국어 특화 AI 언어모델 'KoGPT'를 최대 오픈소스 커뮤니티 깃허브(gitHub)에 공개했다. 초기 버전이다 보니 매개변수는 60억개로 네이버 하이퍼클로바 2040억개, GPT-3의 1750억개에 비하면 작고, 학습 데이터도 2000억개 토큰으로 네이버 하이퍼클로바 5600억개 토큰 등에 비해 규모가 작다. 하지만 KoGPT 언어모델의 최대 규모를 향후 100배 이상 키운다는 전략이다.
KoGPT가 수행 가능한 언어 과제는 주어진 문장의 긍정과 부정 판단, 긴 문장 한줄 요약, 문장 추론으로 결론 예측, 질문 시 문맥 이해를 통한 답변 등으로 크게 네 가지다. 자동으로 글쓰기도 가능한 만큼 상품 소개글 작성, 감정 분석, 기계 독해, 기계 번역 등에 활용되고 교육에도 적용될 것으로 보인다.
또 언어모델은 아니지만 카카오브레인은 초거대 AI 멀티모달이자 이미지 생성 모델인 '민달리'도 깃허브에 공개헀다. 오픈AI의 'DALL-E'를 누구나 접근하기 쉽게 작은 사이즈 모델로 만든 것으로, 1400만장의 텍스트와 이미지 세트를 사전 학습하고 13억개의 파라미터를 가진다.
◆GPT-4 튜링테스트 통과 알려져...GPT-3 '환각을 보고 있을' 가능성 제기
해외에서는 MG와 엔비디아가 무려 530억개의 매개변수를 가진 자연어 생성 모델인 '메가트론-듀링'을 지난해 10월 선보였다. 또 중국에서도 초거대 AI 개발에 적극 나서 베이징 AI 아카데미 주도로 개발된 '우다오 2.0'은 1조 7500억개의 매개변수를 갖추고 있다.
또한 미국의 오픈AI가 다음달에서 내년 1분기 사이에 'GPT-4'를 출시할 계획이어서 관심을 모은다.
국내 IT 기업들이 개발한 초거대 AI는 대부분 GPT-3 기반으로 개발됐는데, 지난해부터 이 달까지 초거대 AI를 속속 내놓고 있지만, 해외에서는 GPT-4가 발표되는 것과 비교해 시기적으로 늦었다는 지적도 나온다. 특히 AI가 내놓는 텍스트 반응이 인간과 구분할 수 없을 정도로 진화했고 활용 비용도 훨씬 싸질 것이라는 전망까지 제기되고 있다.
벌써부터 GPT-4가 이미 튜링테스트를 통과했다는 얘기도 나오고 있다. 컴퓨터가 자연스럽게 인간과 소통할 수 있는 지 알아보는 테스트인 튜링테스트는 심사위원이 AI과 대화를 나누고 심사위원 중 30%가 AI를 사람으로 착각하면 통과하는 방식이다. 그만큼 인간처럼 대화가 가능한 것으로, 성능은 GPT-3 이상이 될 것으로 기대가 모아지는 이유다.
하지만 국내 기업들이 GPT-4를 접하고 또 이 기술을 적용하기까지 상당한 시간이 소요될 것으로 보인다.
또 업계 관계자들은 GPT-3가 '환각을 보고 있을' 가능성이 제기되는 등 성능적으로 완벽하지 않다는 한계가 있다는 점을 지적한다.
GPT-3는 이용자가 제공한 텍스트 입력을 기반으로 다음에 올 단어들을 예측하는 데 사실에 기반하지 않은 부정확한 정보를 생성할 수도 있다. 이는 언어모델이 이용자가 제공한 맥락과 학습 데이터에 있는 통계적 패턴을 바탕으로 그럴듯한 텍스트를 생성하려 시도하기 때문인데, 환각이라고 불린다.
IT 업계 한 관계자는 "GPT-3도 환각의 문제가 발생하고 여러모로 아직 완벽하지는 않다"며 "하지만 국내에 한정되는 문제는 아니고 신생 기술인 만큼 나타날 수 있는 문제"라고 지적했다.
또 국내 기업들이 초거대 AI를 개발해 이 기술을 자사에만 적용하지 않고 중견·중소기업, 스타트업들에게 나눠야 하는데, 아직까지 잘 되지 않는 부분이다.
초거대 AI를 가장 빨리 개발해 사용하고 있는 네이버 관계자는 "하이퍼클로바를 네이버 내부에서만 사용하지 않고 '클로바 스튜디오'를 통해 네이버가 방대한 투자를 통해 개발한 AI를 스타트업이나 중소기업들이 활용할 수 있도록 오픈하는 것이 기본 기조"라며 "아직 부족한 부분이 있지만 더 많은 기업들에게 기술을 확산해나갈 계획"이라고 말했다.
네이버는 지난 2월부터 일부 파트너사를 대상으로 클로즈드 베타 서비스를 시작해 아직 초기 수준이다. 현재까지 1000개 업체에서 신청해 이 중 300개 기업들이 사용하고 있다.
또한 대한상공회의소에 따르며 초거대 AI를 위해 선행돼야 할 과제가 슈퍼컴퓨터, 빅데이터, 인재양성인 데 슈퍼컴퓨터 인프라가 잘 갖춰져 있지 않다는 점이 한계로 남는다. 여기에 고도화된 학습을 위해 정제된 빅데이터도 필요하다.
Copyright ⓒ Metro. All rights reserved. (주)메트로미디어의 모든 기사 또는 컨텐츠에 대한 무단 전재ㆍ복사ㆍ배포를 금합니다.
주식회사 메트로미디어 · 서울특별시 종로구 자하문로17길 18 ㅣ Tel : 02. 721. 9800 / Fax : 02. 730. 2882
문의메일 : webmaster@metroseoul.co.kr ㅣ 대표이사 · 발행인 · 편집인 : 이장규 ㅣ 신문사업 등록번호 : 서울, 가00206
인터넷신문 등록번호 : 서울, 아02546 ㅣ 등록일 : 2013년 3월 20일 ㅣ 제호 : 메트로신문
사업자등록번호 : 242-88-00131 ISSN : 2635-9219 ㅣ 청소년 보호책임자 및 고충처리인 : 안대성