[테크리포트]2023 데이터 키워드②자연어(NLP) 합세한 증강 분석, 실시간 인사이트 시대 연다
페이지 정보
작성자 최고관리자 작성일 23-01-18 13:52 조회 459회본문
[테크리포트]2023 데이터 키워드②자연어(NLP) 합세한 증강 분석, 실시간 인사이트 시대 연다
기업이 데이터로부터 통찰력을 얻는 방식 자체가 변화
인사이트 자동화로 실시간 인사이트 및 데이터 민주화 구현
그러나 데이터 품질 및 무결성(integrity) 전략 고민해야
2023 데이터 키워드 두번째는 증강 분석(Agmented Analytics)으로, 인공지능/머신러닝(AI/ML)을 이용한 데이터 분석을 뜻한다.
데이터 분석에 머신러닝과 딥러닝 등 AI 기술 적용은 더 이상 새로운 뉴스는 아니다. 하지만 이 시장은 분석해야 할 데이터가 폭증하고 더 이상 수작업으로는 비즈니스가 원하는 속도에 맞출 수 없다는 점 때문에 지속적인 성장이 기대되고 있다. 나아가 증강 분석은 세 가지 강력한 특징과 함께 움직인다. △데이터 분석의 민주화 △인사이트 자동화(실시간 인사이트) △컨텍스트를 이해하는 자연어(NLP) 기반 데이터 검색이 그것이다.
(이미지 출처 :softengi.com)
기업이 데이터를 관리하고 평가하는 방식은 AI 기반 기술로 급변하고 있다. 가트너 정의에 따르면 증강 분석은 데이터 준비, 인사이트 생성과 설명에 머신러닝, AI 등의 기술을 사용해 ‘분석 및 BI(Analytics and BI, 이하 ABI) 플랫폼’에서 데이터를 탐색하고 분석하는 방식을 강화한 것이다.
전통적인 데이터 분석이 기존에 수집된 사용자 요구 사항에 기반을 두고 사전 정의된 쿼리나 보고서의 형태로 데이터로부터 인사이트를 창출했다면 증강 분석은 머신러닝, 자연어 처리(Natural Language Processing)와 같은 기술을 활용해 분석 보고서를 자동 생성해낸다.
가트너는 2021년 ‘ABI’ 매직쿼드런트 보고서에서 BI 툴의 차별화 요소가 시각화(비주얼라이제이션) 툴에서 증강 분석으로 넘어갈 것으로 주장한 바 있다. “이제 누구나 훌륭한 시각화 툴을 가지고 있다, BI 시장의 차별화는 증강 분석, 또는 머신러닝과 AI를 BI 툴에 얼마나 잘 통합하는지에 달려 있다, 앞으로는 AI/ML 기능이 분석 툴 혹은 ABI 툴과 분리돼 존재하는 대신, ABI 제품 전반적으로 주입된다”는 주장이었다.
자료:가트너. 자동화와 자연어 등 증강 분석의 고도화는 시민 데이터 사이언티스트 양성으로 이어진다.
이러한 추세를 반영하듯 지난해 AI/ML 없이 데이터 분석을 말하는 솔루션 및 서비스 사업자는 찾아보기 힘들었다. 2022년부터 ABI 플랫폼은 로코드/노코드 워크플로, 클라우드 에코시스템 및 디지털 워크플레이스 툴과의 연동, 최종 사용자를 위한 시각적 셀프서비스, AI에 의해 강화된 자동화된 인사이트 도출에 중점을 두고 있다.
이러한 특징들은 데이터 분석의 민주화로 이어지는데 가트너는 “증강의 초점이 분석가에게서 소비자 혹은 의사결정자로 점점 이동하고 있다”고 지적했다. 전문 데이터 과학자나 IT의 기술 지원이 일상의 분석 작업에서는 필요하지 않으며, 현업의 데이터 소비자와 의사결정자의 셀프서비스 분석을 더욱 강력하게 지원하고 있다.
시민 데이터 사이언티스트 시대의 도래
증강 분석은 데이터 사이언스, 머신러닝, AI 모델 개발/관리/배포의 많은 부분을 자동화하기 때문에 전문가는 물론 시민 데이터 사이언티스트도 증가시킬 수 있다. 현업 실무자는 데이터 파이프라인을 엔지니어링할 필요 없이 “서울 지역에 할당해야 하는 마케팅 예산”과 같이 임의의 쿼리를 던져도 즉각적으로 답을 받을 수 있다.
이는 궁극적으로 인사이트 도출에 이르는 많은 과정이 자동화됨을 뜻하고 가트너는 이를 자동화된 인사이트(automated insights)라고 표현했다. 즉, 실시간 인사이트의 시대라고 할 수 있다.
하지만 이러한 인사이트 자동화는 통계적 관련성뿐만 아니라 데이터에 기반을 두고 사용자의 목표, 워크플로, 필요한 실행 조치에서의 전후 상황 파악이 필수다. 이는 ABI 플랫폼과 AI 결합의 제2막을 열고 있는데 바로 컨텍스트를 이해하는 자연어 기반 상호작용이다.
전후 맥락을 이해하는 자연어 쿼리, 자연어 응답이 증강 분석에 가세하고 있다. (자료:가트너)
데이터 분석에서 ‘증강’은 증강은 AI와 머신러닝이 지원하는 데이터 준비, 쿼리 생성 및 통찰력 생성 등 여러 가지 형태로 제공되는데, 최근의 ABI 플랫폼은 더욱 효과적인 사용자 경험을 위해 사용자 행동과 관심사에 대한 더 많은 정보를 포착하려 하고 있다. 예를 들면 자연어 쿼리(NLQ, Natural Language Query) 또는 대화형 분석 인터페이스 등과 같은 상호 작용 방법으로 보완하고 자연어 생성(NLG, Natural Language Generation) 설명으로 응답하는 것이다. 이러한 기술은 다시 의사결정자를 위한 셀프서비스 분석, 데이터 분석의 민주화에 기여한다.
데이터 분석에서 AI의 결합은 머신러닝에 의한 분석 속도와 정확성에서, 자연어 기반 사용자 경험 향상으로 발전해 나가고 있다. 가트너의 매직쿼드런트에서도 이를 반영해 2021년부터 새롭게 등장한 카테고리가 ‘인사이트 엔진(Insight Engines)’이다.
자연어 기반 쿼리와 분석 결과 도출, 데이터 민주화 ‘성큼’
인사이트 엔진(IE)에 대한 가트너의 정의는 “기업 내외부의 모든 콘텐츠 및 데이터 스펙트럼으로부터 실행 가능한 인사이트를 제공하기 위해 검색 기능과 AI를 결합한 것”이다. 인사이트 엔진은 콘텐츠와 데이터를 발견, 분석, 설명 및 구성하는 데 연관성 방법(relevancy methods)을 적용한다. 각각의 비즈니스 모멘트 맥락(컨텍스트)에 맞춰 사람에게는 정보를, 기계(시스템)에게는 데이터를 상호 작용 혹은 사전예측적으로 전달하거나 합성해 제공해주는 것이다. 인사이트 엔진은 리포지터리(저장소), 웹사이트, 데이터베이스 등 다양한 소스와 유형의 데이터를 중앙 인덱스로 가져와 쿼리할 수 있게 해준다.
가트너 인사이트 엔진 매직쿼드런트 2022. 기업 내외부의 모든 콘텐츠 및 데이터 스펙트럼으로부터 실행 가능한 인사이트를 제공하기 위해 검색 기능과 AI를 결합한 것을 인사이트 엔진으로 정의하고 있다.
인사이트 엔진은 검색 그 이상의 역할을 하는데, 의사결정과 실행 조치를 지원하기 위한 정보, 자동화를 지원하는 데이터의 매개자 역할을 한다는 게 가트너의 설명이다. 사용자의 질문에 대한 답변, 상황에 맞는 추천(contextual recommendations), 인사이트 도출에서 데이터 소비자들(분석 소비자)의 디지털 경험을 한 단계 더 높여주는 역할을 한다.
지난달(2022년 12월) 발표된 가트너 인사이트 엔진 매직쿼드런트 2022 보고서에서는 리더 그룹에 마인드브리즈(Mindbreeze), 마이크로소프트, 엘라스틱, IBM, 코베오(Coveo) 등이 선정됐다. 비전 완성도 측면에서는 엘라스틱이 가장 높은 점수를 얻었으나 실행 능력 측면에서는 마인드 브리즈, 마이크로소프트가 더 우세했다.
한편 인사이트 엔진, 증강 분석과 함께 눈여겨볼 새로운 가트너 매직쿼드런트 중 하나는 ‘엔터프라이즈 대화형 AI 플랫폼(Enterprise Conversational AI Platforms)’이다. 이 역시 2022년 첫 등장한 것으로, 2021년 출시된 글로벌 챗봇 플랫폼을 평가해 2022년 초에 발표됐다(Gartner Magic Quadrant for Enterprise Conversational AI Platforms 2022).
대화형 AI 플랫폼은 “대화형 자동화의 사용 사례 개발을 구축, 오케스트레이션(조정), 지원하는 데 사용되는 소프트웨어 애플리케이션”이라는 게 가트너의 정의이며 그 목적과 용도는 다양하다고 소개하고 있다. 그 중 하나가 증강 분석일 수 있다.
2022년 엔터프라이즈 대화형 AI 플랫폼 매직쿼드런트에서 가트너는 대화형 AI 플랫폼 제품들이 △자연어 포트폴리오 중심 △비즈니스 자동화 중심 △사용자 경험 중심 세 부류로 나눌 수 있다고 설명했다. 리더 그룹에는 코어.ai(Kore.ai), 아멜리아(Amelia), IBM, 오밀리아(Omilia), 코그니지(Cognigy), 원리치.ai(OneReach.ai)가 선정됐다.
2022년 초 발표된 가트너의 엔터프라이즈 대화형 AI 플랫폼 매직쿼드런트.
‘힘들게 일하지 않고 스마트하게’ 데이터 분석의 효율성 강화
해외 미디어인 파이낸스온라인은 2022/2023 분석 트렌드 톱10(10 Top Analytics Trends & Forecasts for 2022/2023 You Should Be Thinking About)에 증강 분석, NLP 및 대화형 분석(Conversational Analytics)을 포함시켰는데 이 중 NLP 및 대화형 분석의 역할이 매우 거대해질 것이며 NLP 대화형 분석 플랫폼의 기능이 기하급수적으로 증가할 것으로 강조했다.
파이낸스온라인에 따르면 이미 많은 소비자들이 스마트홈 기기에서 음성 검색을 사용하고 있는 상황에서 시장 분석, 고객 분석에도 음성 검색이 수반될 수밖에 없다. NLP 변환 분석 툴을 사용해 기본 검색 쿼리만 입력하면 실시간으로 고객 데이터를 쉽게 모니터링하고 분석할 수 있다. 무엇보다 전문가 아닌 일반 비즈니스 유저들이 복잡한 데이터 조합을 신속하게 분석해낼 수 있다.
NLP 및 대화형 분석 또한 데이터 분석의 민주화, 즉 비즈니스 실무자들이 데이터 팀, IT팀에 대한 의존도를 대폭 줄이게 만들며 그에 따라 빠른 인사이트 도출을 수행하는 데 기여한다. 파이낸스온라인은 “누구나 음성이나 텍스트로 더 복잡한 쿼리를 만들어 검색하고 문의해 답변을 받을 수 있다”고 설명한다.
파이낸스온라인이 선정한 2022/2023 분석 트렌드 톱10
TDWI(The Data Warehousing Institute)의 경우 2023년의 세 가지 데이터 트렌드 중 첫번째로 데이터 민주화를 꼽기도 했다. 다른 두 가지는 분석의 자동화 가속(Analytics becomes more automated) 및 데이터 메시의 확산(Data mesh popularity increases)로, 이 세 가지 트렌드는 모두 긴밀히 관련돼 있으며 핵심을 관통하는 것은 ‘데이터 액세스 및 분석, 소비의 주체’다.
이는 올해 ABI 플랫폼과 솔루션의 새 기능을 점쳐볼 수 있는 대목이다. 2021년에는 데이터 시각화, 2022년에는 AI/ML 기반 증강 분석이 ABI 솔루션 시장의 화두이자 경쟁력의 포인트였다면, 올해는 얼마나 사용자 친화적이고 사용하기 쉬운 NLP 및 대화형 분석 기능을 제공하느냐에 달려 있는 것으로 보인다.
증강 분석의 결론은 실시간 인사이트
파운드리(Foundry. 구 IDG)의 ‘2022년 데이터 및 분석(Data&Analytics)’ 보고서에 따르면 설문 조사에 응한 IT의사결정권자 중 88%가 데이터 수집 및 분석을 통해 향후 1~3년 동안 회사의 비즈니스 방식을 근본적으로 바꿀 수 있다는 데 동의했다. 이러한 기업과 조직들은 시장 경쟁 우위를 확보하기 위해 예측 분석, 프로세스 자동화 및 비즈니스 인텔리전스 플랫폼과 같은 툴에 투자하고 있다고 전했다.
이러한 변화는 데이터 급증과 민주화, 데이터의 생성 및 소비 속도에 의해 가속화되고 있다. 기업들이 데이터 중심 조직으로 변화할수록 데이터 분석 결과물이 나오는 속도에 대한 요구 역시 커지고 있다. 증강 분석 기술 없이는 숙련된 데이터 엔지니어와 데이터 사이언티스트라도 비즈니스 인텔리전스를 위한 데이터를 준비하는 데 몇주 혹은 몇 달을 소요한다.
해외 IT미디어인 솔루션 리뷰는 “데이터 수집 시간이 (비즈니스)차별화 요소가 되고 있기 때문에 최고 데이터 책임자(CDO)는 현재 가용할 수 있는 모든 툴과 소스를 동원해 데이터 분석을 효율화해야 한다”고 주장한다. 더 빠른 시간 내에 더 많은 가치를 얻을 수 있도록 하는 것이 AI와 ML로, 특히 AI/ML은 데이터 팀이 “더 열심히가 아니라 더 스마트하게(working smarter, not harder)” 일할 수 있도록 하는 데 핵심 역할을 하고 있다고 전한다.
즉, 증강 분석의 혜택 중 하나는 데이터 관련 부서의 업무 효율성이다. 데이터 팀이 분석을 위해 데이터를 준비하는 대신 실행 가능한 문제에 집중할 수 있도록 해준다. 데이터 액세스의 흐름을 개선하고 다양한 관점에서 적시에 공통된 시각을 가질 수 있도록 해준다.
글로벌 증강 분석 시장, 2030년까지 평균 30% 성장
해외 시장조사 업체인 리포트&데이터는 글로벌 증강 분석 시장 규모를 2021년 100억6000만달러로 추정하는데 2030년까지 연평균 29.5% 성장해 2030년 말이면 1038억7000만달러(한화 약 129조3100억원) 규모에 이를 것으로 주장하고 있다. 다른 시장조사업체들의 전망 보고서도 대동소이하다.
관련링크
- 이전글DX 정책 콘트롤타워, '산업 디지털전환 위원회' 23.01.15
- 다음글원프레딕트, 미국 법인 설립 및 현지 전문가 영입… 글로벌 진출 가속화 23.01.19