< 목록보기

AI 기술의 뉴스룸 도입 현황과 전망

by
@

연수보고서 다운로드
AI 기술의 뉴스룸 도입 현황과 전망 YTN 차장 권준기 연수기관: 노스캐롤라이나대
왜 AI 저널리즘인가?

 A.I.(Artificial Intelligence 인공지능) 유행 시대에 살고 있다. 웬만한 전자·가전제품에 AI라는 수식어가 안 붙는게 없고 서비스·의료·교육 등 분야에서도 홍보 문구에 AI라는 단어를 심심치 않게 볼 수 있다. 언론도 예외가 아니다. AI 또는 로봇 저널리즘, 뉴스룸 자동화(automation in newsroom) 등 명칭은 다르지만 전세계 여러 언론사들이 다양한 방식으로 AI 기술을 접목하고 있다. 2014년 AP(Associated Press)가 데이터 마이닝과 자동언어생성 기술을 이용해 기업 분기 보고서 기사를 대량 생산한 데 이어 워싱턴포스트는 2016년 올림픽과 선거 기사 작성에 AI 시스템인 헬리오그래프를 도입해 언론계에 본격적인 AI에 대한 관심을 불러 일으켰다. 경제 전문지 포브스는 기사작성시스템(CMS)에 AI 기술을 이식한 버티(Bertie)를 개발해 뉴스 소스 발굴과 기사 초안 작성 등에 활용하고 있고 마이크로소프트는 자사 포털사이트인 MSN의 뉴스 페이지에서 사람 손을 떼고 전면 AI 기술로 대체한다고 최근 발표했다. 미국의 지역 언론들도 취재 영역을 넓히고 (인간) 기자들의 생산성을 높이기 위해 속속 AI 시스템을 도입하는 실정이다.

 AI 기술의 활용 범위는 점점 넓어져 데이터 수집·분석 같은 취재 영역에서부터 기사 작성과 배포, 댓글창 관리, 수익화 전략수립 등 언론계 전반을 아우르고 있다. 초기 AI 저널리즘이 스포츠 경기 결과나 기업 실적 같은 빈칸 채우기 기사 작성으로 기자들의 허드렛일을 떠맡는데 그쳤다면, 지금은 인간의 직관으로 발견할 수 없는 데이터 분석이나 탐사보도, 펙트체크를 위한 도구로까지 영역을 확장하고 있는 것이다. 여기에 기자 개개인이 일일이 감당할 수 없는 독자와의 교감·상호작용을 위한 AI 기술도 대안으로 모색되고 있다. 모든 언론사의 고질병인 인력 부족을 해결하기 위해 AI의 필요성이 처음 대두되었다면 점점 더 언론의 본질적인 가치를 높이고 세분화 되는 뉴스 소비자들의 요구를 충족시키는 방향으로 활용 폭이 커지고 있는 것이다.

AI 기술 보급으로 바뀌는 취재 환경

 지난해 보든 대학 학술지 퀼(Quill)에 실린 AI 저널리즘 기사는 인공지능 기술로 바뀌고 있는 취재 환경을 다루고 있다. “풋볼 경기가 열리는 금요일 밤 커트 콘래드 기자는 새벽 4시가 돼서야 잠자리에 들었던 기억이 생생하다. 하지만 이제는 아니다. 자동 기사작성 시스템이 경기 결과부터 득점 상황, 팀 성적, 기록 등을 정리하는 사이 콘래드 기자는 사진을 더 찍거나 관계자를 인터뷰하고 심층 취재하는데 시간을 쓸 수 있게 된 것이다.” 기사에 나오는 콘래드는 20년차 스포츠 기자로 오하이오주 맨스필드에 있는 리치랜드 소스라는 온라인 매체에 소속된 실존 인물이다. 리치랜드 소스 홈페이지(www.richlandsource.com)에는 콘래드 기자를 비롯한 기자 바이라인이 붙은 기사 사이사이에 AI가 쓴 경기 결과 기사를 볼 수 있다. 스웨덴의 축구 전문 스포츠매체인 ‘클라크스파크(www.klackspark.com)’도 AI 시스템 도입으로 프로 축구부터 최하위 리그인 디비전 6의 경기까지 광범위한 영역을 커버할 수 있게 됐다.

 AP(Associated Press)의 AI 시스템 도입을 담당했던 프란시스코 마코니는 자신의 저서 에서 현재 쓰이고 있는 인공지능 기술과 가까운 미래에 도입될 기술을 버무려 좀 더 실감나게 기자의 일상을 그리고 있다. “A기자가 자율주행 자동차로 출근하는 사이 차에 달린 센서는 공기질이 10% 악화됐다는 걸 알려주고, 보도국에 도착하기 전 소셜미디어 분석 알고리즘을 이용해 공해와 어린이 천식에 대한 이야기가 온라인 상에 평소보다 많이 회자되고 있다는 걸 감지한다. 회사에 도착하자마자 AI로 구동되는 소프트웨어로 드론 이미지와 대기질 측정 데이터를 수집하고 지난 10일 사이 방직공장 5마일 근방에 공해 가능성이 있다는 정보를 파악한다. 그 사이 미국 국립 환경보건과학연구소(NIEHS) 자료 분석을 통해 해당 지역이 과거보다 공해 수치가 높아졌다는 점을 확인하고 소셜미디어에서 어린이 건강과 관련해 어떤 이야기가 오가는지 수집해 요약본으로 정리한다. 소셜미디어 타임라인을 통해 인터뷰 대상을 정하고 방직공장 책임자의 신원과 연락처를 확보하는 것도 가능하다. 인터뷰를 마친 뒤에는 오디오파일을 녹취록으로 풀고 중요한 부분을 체크해 놓는 것도 AI 몫이다.” 취재를 마친 뒤 기사를 만들어내는 과정에도 AI가 등장한다. 자동언어 생성 기술로 기사 초안 작성은 물론 데스킹 과정까지 머신러닝 기술이 적용된다. 기사 출고 이후에는 댓글창에 달린 독자들의 반응을 AI가 종합·분석해 기자가 생각하지 못했던 후속 취재 포인트를 찾아내기도 한다. 많은 독자들이 공장주의 과실 문제를 지적하자 A기자는 추가 취재에 나선다. 마코니의 이야기는 AI 기술의 도입 이후 기자들은 좀 더 핵심적인 역량에 집중해 효율성을 높이는 동시에 독자들과의 교감을 통해 더 좋은 반응을 이끌어내는 선순환을 그리고 있다.

취재 과정(news gathering)에서 AI 기술

 속보 경쟁에서 가장 중요한 요소 중 하나는 제보이다. 사건·사고가 발생한 장소에 있었던 사람이 언론사에 직접 연락해 알려주는 것만큼 속보를 빨리 입수할 수 있는 방법은 흔치 않다. 하지만 소셜미디어가 발달하면서 제보 못지 않은 속보 창구로 활용되고 있다. 여기에 소셜미디어를 단순히 모니터링 하는 데 그치지 않고 AI로 키워드나 데이터를 수집해 분석하는 기술을 갖추면 훨씬 더 강력한 속보 수집 도구가 될 수 있다. 로이터는 인지 컴퓨팅과 머신러닝 기술을 활용한 뉴스트레이서(News Tracer)를 개발해 트위터에서 속보를 발굴하고 있다. 2015년 캘리포니아 샌버나디노 총기 난사 사건을 가장 먼저 보도한 것과 이듬해 에콰도르 지진을 타사보다 18분 먼저 전한 것도 뉴스트레이서가 소셜미디어에서 키워드를 추출했기 때문에 가능한 일이었다. AP는 소셜미디어 데이터 분석 기술을 갖춘 SAM(www.samdesk.io)이라는 스타트업과 손을 잡았다. SAM은 소셜미디어에서 “화재”나 “총기 사고”와 같은 키워드를 추출해 게시물의 내용과 사용자 신뢰성을 분석한 뒤 믿을만하다고 판단되는 내용을 뉴스룸 에디터에게 전송한다. AP가 SAM 시스템을 도입하기 전 5주간의 시험을 거친 결과 적어도 50건의 속보를 챙길 수 있었다. 이후 BBC, 뉴욕타임즈 등 다른 주요 언론들도 SAM과 협업해 뉴스룸 경보 시스템을 도입하기 시작했다. 소셜미디어 데이터 분석 기업인 데이터마이너(Dataminr)는 뉴욕포스트, 라디오 프랑스 같은 언론사 뿐 아니라 FBI에서도 고용해 정보수집에 활용한 것으로 알려져 있다.

 데이터 발굴 대상을 소셜미디어에서 언론 보도로 바꿔 뉴스 전반을 모니터링하는 것도 가능하다. 언론사별 특정 이슈에 대한 보도 경향이나 증감을 활용하면 그 자체로 뉴스가 될 수 있다. 트럼프 행정부의 코로나바이러스 대응을 놓고 대리전을 벌이고 있는 언론 진영별 보도량 분석이 하나의 예가 될 수 있다. MIT 대학의 시빅미디어센터가 AI 기술로 만든 미디어클라우드는 언론 보도를 모니터링해 정량적 데이터로 수치화하는 시스템인데, 최근 코로나 사태 보도 비율을 그래프로 그려 발표했다. 코로나 사태 초기 미국 정부의 소극적 대응 만큼이나 폭스의 보도도 상대적으로 빈약했던 걸 확인할 수 있다.

 넘쳐나는 데이터 속에서 뉴스를 찾아내는 것도 AI 기술이 가진 장점이다. 워싱턴 포스트가 2016년 브라질 리우 올림픽에서 헬리오그래프를 활용한 방법 중 하나는 모든 경기 가운데 10% 이상 기록이 뛰거나 하락한 데이터가 발견되면 즉시 기자 단체 메신저 창에 알림을 띄우는 자동화 시스템을 갖춘 것이다. 2018년 중간선거에서 헬리오그래프는 전국의 지리 정보와 투표 데이터를 수집해 도시와 시골의 투표 성향이 더 양극화 되었다는 사실을 보여주기도 했다. 경제 지표에서 소위 데이터가 ‘튀는’ 구간을 잡아내 뉴스로 만들거나 수많은 스포츠 경기에서 기자들이 현장에서 찾아내지 못한 기록을 발견하는 것도 AI 기술을 이용하면 가능해진다.

 AI를 이용한 정보 수집은 숫자 뿐 아니라 문자도 대상이 될 수 있다. 자연언어 처리(Natural Language Processing)는 기계가 사람의 언어를 이해할 수 있도록 하는 게 궁극적인 목적인데 AI 저널리즘 구현을 위해 가장 중요한 기술로 꼽힌다. 초기 단계 자연언어 처리는 단어 개수를 세고 반복되는 표현을 짚어내는 수준이었다. 온라인 미디어 복스는 오바마 대통령의 8년 간 국정연설 내용 가운데 “경제” “일자리” “전쟁” 같은 단어가 얼마나 많이 쓰였는지 집계해 매년 지향하는 정책이 어떻게 바뀌었는지 분석하는 기사를 썼다. 월스트리트저널은 제너럴 일렉트릭(GE)의 기업 연차보고서(annual report) 내용을 분석해 기업 전략이 어떻게 변화하는지 분석했다. 예를 들어 제프 이멜트 회장의 2017년 연차보고서에는 3D 프린터 기술 등 적층제조에 대한 언급이 일곱 번 들어가 있었는데 반해 후임자는 2년 간 4번에 그쳤다는 점을 주목하며 기업 전략의 우선순위가 바뀌었다는 점을 지적했다. 자연언어 처리 기술은 방대한 분량의 자료에서 뉴스를 찾아내는데 유용하게 쓰이기도 한다. 뉴스데이즈는 뉴욕주 의회에서 통과된 1700건의 법안을 텍스트 마이닝 기술로 분석해 경찰의 비위를 감시하기 위한 법안이 얼마나 자주 제정됐는지 찾아내기도 했다. 미국 경제매체 쿼츠는 콜롬비아 대학과 함께 미국 언론의 총기난사 사건 보도 경향을 분석했다. 141시간 동안의 케이블 뉴스 방송 분량을 자연언어 처리 기술로 분석해 가해자 인종에 따라 단어 선택이 어떻게 달라지는지 파악한 것이다. 쿼츠는 텍스트 마이닝을 통해 유색인종이 가해자인 경우 ‘급진적(radical)’이라는 표현을 많이 했고, 백인이 용의자일 경우 가해자 가족에 대한 언급이 상대적으로 많아졌다는 점을 찾아냈다. 자연언어 처리 기술은 단어 개수를 파악하는 초기 단계에서 발전해 기계가 문장의 흐름과 문맥, 뉘앙스 까지 이해할 수 있게 만드는 방향으로 개발이 진행중이다.

 AI를 이용한 취재 기법은 온라인 데이터 수집에 그치지 않는다. 스마트 센서는 인간의 감각으로 측정할 수 없는 영역까지 수치화할 수 있게 도와준다. 예를 들어 진동과 소음을 측정하는 스마트 기기를 이용하면 정당의 전당대회나 가수의 콘서트장, 또는 스포츠 경기에서 관중 반응이 가장 폭발적인 구간을 확인할 수 있다. 관중의 호응도에 따른 당선 확률이나 팬들의 박수와 환호성이 가장 큰 구간으로 추린 하이라이트는 기자의 직관과 다른 양상을 보일 가능성도 있다. GPS 센서를 이용한 탐사보도 사례도 있다. 사우스 플로리다 선 센티널 신문은 교통경찰의 과속 문제를 GPS 센서로 잡아낸 보도로 퓰리처상을 수상했다. 이 밖에 온도측정 센서를 이용해 매미가 언제부터 울기 시작할지 예측하거나 도심 지역 고온현상으로 인한 주민들의 스트레스를 취재하는 것도 아이디어이다.

 뉴욕주립대 저널리즘 연구소인 ‘스튜디오 20’이 AP와 협업해 만든 소음 감지 카메라도 주목할 만 하다. 대규모 행사나 집회를 취재할 때 여러 촬영기자를 내보내고도 정작 결정적인 장면을 포착하지 못하는 경우가 있는데 이를 보완하기 위한 방안으로 개발된 기술이다. 일종의 CCTV 같은 카메라에 소리를 감지하는 센서를 달아 일정 수준 이상의 소음이나 행동이 보이는 곳을 포착해 사진을 찍은 뒤 기자들에게 전송하는 방식이다. 뉴욕타임즈는 이미 시중에 보급된 안면인식 기술을 이용해 사법 당국의 개인정보 수집의 위험성을 경고하는 기사를 쓰기도 했다. 뉴욕 브라이언트 파크가 온라인에 공개하고 있는 CCTV 영상에 아마존이 상업용으로 개발한 안면인식 기술을 적용시켜 합법적인 방법으로 9시간 동안 2,750명의 얼굴 정보를 수집한 것이다. 뉴욕타임즈는 이 가운데 뉴욕주립대 리차드 마돈나 교수의 얼굴과 89% 일치하는 안면 정보를 찾아 실제로 신원이 일치하는지 확인하고 충격적이라는 당사자의 인터뷰까지 실었다.

기사 생산(production) 과정에서 AI 기술

 경제 매체인 블룸버그는 일찌감치 자동언어 생성 기술(NLG : Natural Language Generate)의 가능성을 포착하고 적극적인 투자에 나섰다. 특히 각종 증시, 경제 지표, 기업 실적을 다루는 기사 작성에만 AI를 도입한 게 아니라 증권사와 투자 전문가들이 구독하는 블룸버그 단말기(Bloomberg Terminal)에도 이 NLG 기술을 적용했다. 경제에 정통한 전문가 뿐 아니라 그래프와 지표를 읽을 줄 모르는 일반인들도 단말기에 접근할 수 있게 만들기 위해서이다. UNC 저널리즘 스쿨 도서관에 설치된 블룸버그 단말기를 구동해봤더니, 회사 이름을 검색창에 친 뒤 ‘Grab’이라고 써진 노란색 버튼만 누르면 회사 주가와 주목해야 할 정보가 자동언어생성 기술로 정리돼 1~2초 안에 펼쳐졌다. 아래 캡쳐 화면은 지난 3월 3일 블룸버그 단말기에서 검색한 아마존의 정보인데, 마치 기사의 헤드라인과 소제목을 정리해놓은 듯 일목요연하게 정리돼 있다. 주가가 몇% 올랐다는 단순 정보가 아니라 “거래량이 20일 평균보다 54% 늘어났다”는 점과 장단기별 주가 흐름을 요약해 놓은 점이 인상깊다. 가운데 파란색 글씨로 코로나바이러스로 인한 특이 사항을 표시해 놓은 것도 눈에 띈다. 블룸버그 단말기는 자연언어 생성 기술이 어느 수준까지 왔는지 단적으로 보여주는 예다. 사람 기자가 따라갈 수 없을 정도의 빠른 속도로 데이터를 문자화하는 건 물론이고 수많은 정보 가운데 중요 정보를 추리는 기술도 상당히 발전한 걸 확인할 수 있다.

처음 AP가 분기별 기업 실적을 AI 기술로 대량생산할 때만 해도 질보다 양이라는 관점이 지배적이었다. 기자들이 며칠간 공을 들여도 300건에 그쳤던 실적 기사를 NLG 기술 도입으로 기자들의 품을 거의 들이지 않고도 4,400개 기사를 만들어 낸 것이다. AP와 손잡고 자연언어 생성 기술을 제공한 오토메이티드 인사이트(Automated Insight)의 애덤 스미스 부사장은 2014년 인터뷰에서 “우리가 만든 기술은 천만 명이 보는 기사 하나를 생산하는 대신 한두 명이 읽는 천만 개의 기사를 찍어내는 것”이라고 말했다. 자연언어 생성 기술의 기초는 데이터 변화에 따른 경우의 수를 계산해 템플릿을 만드는 것이다. 분류 작성(branch writing)법이라고 불리는 이 기술은 발생 가능한 변수를 고려해 표본 문장을 만들고 같은 단어가 반복되지 않도록 여러 동의어를 골고루 쓰는 방식을 말한다. 지난 5~6년 사이 자연언어 생성 기술은 발전을 거듭해 초기보다 훨씬 더 자연스러운 문장을 만드는 게 가능해졌다. 오토메이티드 인사이트를 비롯해 내러티브 사이언스, 아리아, 이지업 등 NLG 전문 기업들이 경쟁을 펼치고 있는 환경도 시스템 도입 단가와 기술 수준을 높이는 요인으로 분석된다.

 자연언어 생성 기술은 짧은 시간에 대량으로 기사를 생산할 수 있다는 점 외에도 독자 맞춤형 기사 작성이 가능하다는 장점이 있다. 전통적인 기사 작성 방식은 기자가 취재한 내용을 하나의 관점으로 쓴 뒤 배포하는 것으로 그쳤지만 AI 기술을 이용하면 같은 데이터로 다른 관점의 기사 작성이 가능하다. 대표적인 경우가 스포츠 경기이다. 승패가 나뉘는 스포츠 경기의 특성상 같은 기사라도 어느 쪽 팬인지에 따라 기사를 읽는 입장이 나뉜다. 예를 들어 레알 마드리드와 FC 바르셀로나의 경기 결과를 놓고 AI는 동시에 두 가지 버전의 기사를 생산해 낼 수 있다.

“바르셀로나, 레알 마드리드 상대로 또 석패”
“레알 마드리드, 바르셀로나 꺾고 연승행진”

제목 뿐 아니라 내용도 주어를 어느 팀으로 하고 단어 선택을 어떻게 바꾸느냐에 따라 같은 데이터로 다른 버전의 기사가 나오게 된다. 사람 기자가 쓰면 2배 이상의 품이 들지만 AI 기술을 활용해 거의 동시에 기사를 뽑아낼 수 있게 된 것이다. 발전을 거듭한 NGL 기술은 단순히 승패에 따른 관점 뿐 아니라 미묘한 뉘앙스 차이를 적용시켜 경기의 중요도에 따른 톤 조절까지 가능한 수준에 이르렀다. 물론 이같은 기술은 스포츠 기사에만 국한하지 않는다.

 AI 기술을 이용한 맞춤형 기사로 지역 차이에 따른 독자들의 요구도 충족시킬 수 있다. 요즘 이메일 뉴스레터에는 전국 날씨가 아니라 수신자의 지역 날씨만 표시해 놓는 게 단편적인 예이다. 전국판 기사와 지역판 기사의 구성과 내용을 달리하는 것도 가능하다. 예를 들어 청소년 비만율에 대한 전국 조사 결과를 놓고 특정 지역 독자들에게는 해당 지역 데이터 분석으로 기사 도입부를 시작하는 방식이다. 일일이 사람 손을 거치면 큰 부담이지만 AI 기술을 이용하면 실현 가능한 일이 된다.

AI 기사의 바이라인 표시

자연언어 생성 기술을 이용해 쓴 기사의 바이라인을 어떻게 표기할지에 대한 입장은 언론사마다 조금씩 다르다. AI가 썼는지 사람이 썼는지에 따라 독자의 판단 기준이 달라질 수 있으므로 당연히 AI로 표시해야 한다는 게 광범위하게 적용되는 원칙이다. 가장 먼저 기업 분기실적 기사를 AI로 작성했던 AP통신은 기사 말미에 “이 기사는 자연언어 생성 기술 제공업체인 오토메이드 인사이트가 금융 데이터 업체인 인베스트먼트 리서치가 제공한 자료를 토대로 작성하였습니다”라고 표시했다. AI 기사에 사람 기자가 내용을 덧붙인 경우에도 기사의 일부는 자연언어 생성 기술로 작성됐다는 점을 명시했다. 월스트리트 저널의 방식은 좀 더 구체적이다. 대학순위를 데이터 마이닝으로 작성한 기사에서 월스트리트저널은 “이 기사는 본지의 케빈 맥알리스터와 프란시스코 마코니 기자가 작성한 템플릿을 토대로 오토메이티드 인사이트가 작성했으며 대학 순위 정보는 타임즈고등교육(THE) 데이터에서 가져왔습니다”라고 표기하고 아래 자세한 방법과 데이터 리스트 링크도 붙여놓았다. 여론조사 기사에서 표본과 신뢰수준, 오차범위를 밝히는 것과 같은 원칙을 적용한 것이다. 반면 영국 PA (Press Association) 통신과 RADAR의 경우 AI 기사라고 해도 템플릿을 사람이 작성했으므로 굳이 AI가 쓴 기사라고 밝힐 이유가 없다는 입장을 취하고 있다. 사람이 쓴 기사와 AI 기사에 대한 독자의 인식은 어떨까. 독일 LMU 대학 마리오 하임 교수의 연구 내용을 보면 보통 독자들은 사람 기자가 쓴 기사가 가독성과 품질 면에서 더 나을거라고 생각하지만 막상 출처를 밝히지 않고 보여주면 차이를 거의 느끼지 못하는 것으로 나타났다. 게다가 사람 기사와 AI가 쓴 기사라는 사실을 밝혔을 경우 독자들은 AI 기사에서 더 신뢰를 갖는다고 논문은 밝히고 있다.

뉴스 배포(Distribution) 과정에서 AI 기술

뉴미디어 시대 모든 언론이 마주하고 있는 고민 가운데 하나는 과거와 같이 단일 경로가 아닌 여러 채널을 통해 뉴스 소비자들을 만나야 한다는 점이다. 인터넷과 스마트폰 보급으로 기존 신문·방송의 비중이 줄어드는 현상은 더이상 새로운 사실이 아니다. 문제는 온라인 채널도 점점 더 세분화되고 있다는 것이다. 포털 사이트와 소셜미디어, 각종 인터넷 게시판 등 온라인 독자들의 분포는 점점 더 산재되고 있다. 미국의 뉴미디어 매체인 버즈피드의 경우 페이스북·트위터 등 각종 소셜미디어와 메시징 앱, 이미지·동영상 공유 플랫폼 등 온라인 채널이 무려 45개에 달한다. 바꿔 말하면 하나의 기사가 45개의 각각 다른 채널에 게시된다는 이야기다. 이 가운데 80%가 넘는 트래픽이 자사 홈페이지가 아닌 외부 사이트에서 유입되고 있는 것으로 집계된다. 포털사이트를 통한 온라인 뉴스 소비가 상대적으로 많은 우리나라의 경우도 언론사 별로 10개 안팎의 온라인 채널에 뉴스를 출고하고 있다. 다양한 온라인 채널로 기사를 배포하는 주요 목적은 뉴스 소비자를 자사 홈페이지로 끌어와 트래픽을 늘리는 것이다. 하지만 최근에는 언론사 홈페이지로 독자를 유입시키지 않고 외부 사이트에서 자체 수익을 올리는 모델이 발달하고 있다. 대표적인 예가 페이스북의 인스턴트 아티클과 유튜브의 구독 수입이다.

이렇듯 언론사 입장에서 채널 다변화가 피할 수 없는 선택이지만 각각의 채널에 일일이 뉴스를 배포하는 일은 여간 번거로운 게 아니다. 게다가 온라인 채널마다 다른 미디어 특성과 독자 성격을 고려해 뉴스를 출고하려면 몇몇 사람의 손으로 감당할 수 있는 수준을 넘어서게 된다. 이 같은 고민도 AI 기술이 해결할 수 있다. 어떤 콘텐츠를 어느 온라인 채널에, 그리고 어떤 시점에 올릴건지 등에 대한 판단을 AI 기술을 통해 내리는 것이다. 로이터 통신과 시카고 트리뷴, 허스트, CBS 등은 트루앤섬(TrueAnthem)이라는 AI 시스템을 도입해 온라인에 기사를 배포하고 있다. 트루앤섬 기술의 핵심은 기사의 반응을 미리 예측할 수 있다는 점이다. 이를 통해 언론사는 독자들의 ‘좋아요’나 공유(share) 같은 참여도를 예상해 기사 배포의 빈도와 시점 등을 잡을 수 있다. 특히 기사 내용에서 콘텐츠 인덱싱과 메타데이터 추출 기술을 통해 소셜미디어에 붙일 멘션도 생성할 수 있다.

AI는 사람 기자를 대체하게 될까?

AI 저널리즘을 다룬 연구나 기사에서 빠지지 않고 등장하는 대목이 바로 AI 기술이 사람 기자를 대체할지에 대한 질문이다. 궁극적으로 AI 기술이 과연 어디까지 발전할 것인지에 대한 질문과 다르지 않기 때문에 AI를 보는 관점에 따라 결론도 달라진다. 예를 들어 AI 기술의 최고 권위자로 알려진 앤드류 응 교수는 “로봇이 사람을 해치는 미래를 걱정하는 건 화성의 인구 과밀을 염려하는 것 만큼이나 터무니 없다”고 일축하는 반면, 테슬라 CEO 엘런 머스크는 “다음 세계 대전을 일으키게 될 AI 기술을 무차별적으로 개발하는 건 악마를 소환하는 것과 같다”고 말할 정도로 강력하게 경고하고 있다. 이렇게 궁극적인 전망은 엇갈리지만 분명한 사실은 AI 기술은 발전을 거듭하고 있고 언론계에 미치는 영향도 점점 더 커지고 있다는 점이다.

 그렇다면 AI 저널리즘 기술이 발전을 거듭하면 사람 기자를 대체하게 될까. 옥스포드 대학이 내놓은 연구결과를 보면 컴퓨터가 언론사 에디터를 대체할 가능성은 8%, 기자는 11%로 예측했다. 은행원 96.8%, 스포츠 코칭스태프 38.3%와 비교하면 대체 가능성이 낮은 수준이다. AI 저널리즘을 연구하는 학자나 기술자들도 지나친 우려를 경계한다. 전화기의 발명이나 인터넷의 보급처럼 기자들의 취재 환경을 바꿔놓긴 하겠지만 인력을 완전히 대체하기는 어려울 거라는 게 대체적인 전망이다. 2014년 ‘로봇 기자(The Robotic Reporter)’ 연구보고서를 썼던 미네소타 대학 매트 칼슨 교수는 당시 용어 선택에 대해 후회한다고 말한다. ‘로봇 기자’라는 단어가 상상력을 부풀려 마치 스타워즈의 R2D2 같은 로봇이 보도국에서 인간 대신 일하는 그림을 그리게 됐다는 것이다. 칼슨 교수는 AI 기술을 통한 보도국 자동화에 대해 좀 더 냉정하고 객관적으로 받아들이고 저널리즘의 품질 향상을 위해 조화를 이룰 필요가 있다고 지적하고 있다.

 그렇다고 AI가 향후 언론사 인적 구성에 아무런 영향이 없을 거라고 장담하기는 힘들다. 혹자는 AI가 기자를 직접 대체한다고 보긴 힘들어도 이미 내리막을 걷고 있는 언론 산업의 기자 해고 바람과 맞물려 ‘오비이락’이 될 가능성을 경고하기도 한다. 예를 들어 경영 악화로 이미 지난해 기자를 대량 해고 했던 스포츠 일러스트레이터(SI)가 인력 부족을 해결하기 위해 AI 시스템을 도입하는 식의 일은 얼마든지 벌어질 수 있다는 얘기다. 반대로 언론사가 선제적으로 AI 기술을 이식해 경쟁력을 키울 경우 오히려 일자리를 늘릴 가능성도 있다. AP 통신의 경우처럼 보도국 자동화 전반을 관리감독할 오토메이션 에디터와 양질의 데이터를 관리하기 위한 컴퓨팅 에디터 등을 예로 삼을 수 있다. 보도국 자동화로 일손을 덜게 된 기자들의 시간 배분도 달라져야 한다. 단순 사건사고 전달과 평면적인 숫자 나열 기사 대신 더 많은 기획기사와 탐사보도, 심층취재로 보도의 차별화를 꾀하는 길이 AI 자동화 시대 인간 기자가 지향해야 할 방향이 될 것이다.