언론사 망하게 하는 AI 봇 개발기

코딩 대신해주는 AI 등장 이후 개발자들은 다 굶어 죽을거라는 둥, 직원을 다 잘라도 사장 혼자 사업을 해도 된다는 둥 하는 FOMO(놓치는 것에 대한 두려움) 기사가 워낙 흥하다 보니 나도 FOMO 스러운 제목을 적어보았다. ‘언론사 망하게 하는 AI 봇’ 을 만들었다고.

반은 뻥이다. 그리고 반은 진담이다.


2026년 2월 9일, 음성인식 AI모델이 오픈소스로 풀렸다는 소식을 들었다. 사람 말귀를 알아 듣는 스마트 스피커를 나도 쉽게 만들 수 있겠구나 라고 생각했다. 명령어 한 줄 만으로도 데모가 실행되었는데, 꽤 그럴싸하게 한국어와 일본어, 영어 발음을 인식했다. 다음날, MacOS에 내장된 음성인식 엔진을 가져다 써도 쓸만하다는 평을 들었다. 성능이 어느 정도인지 궁금해서 Claude AI에게 이 엔진으로 음성을 인식해 프린트하는 프로그램을 만들어달라고 했다. AI 모델이 아니어도 꽤 그럴싸하게 한국어를 인식하는 것을 확인했다. 로컬에서도 돌아가는 이 엔진을 쓰면 비용도 덜 들고 속도도 빠르겠구나…라고 생각했다. 그렇게, 간단히 ‘지금 몇시야?’ 같은 질문에 TTS로 대답을 하는 코드를 덧붙였다. 나와 목소리로 대화할 수 있는 대화 봇을 만든 것이다.

그 때, Claude AI에게 한가지 프롬프트를 더 얹었다.

“오늘의 뉴스를 물어보면 오늘의 뉴스를 요약해서 읽어줘.”

30여초 뒤, 수십여개의 신문사와 방송사를 사라지게 할 수 있는 봇이 탄생했다.

일단 구경하시라

이 글은 인터넷에 올라온 하이퍼미디어 글이다. 글을 읽다가 동영상을 볼 수도 있다는 의미이다. 일단 봇의 작동장면을 5분간 시청해보자.

요약된 뉴스는 4~5분 가량이고, 이정도면 지상파 방송 라디오 정시 뉴스 길이와 비슷하다. 문장이 매끄럽지 못한 부분은 몇 달 지나면 개선될 것이고, 중요 뉴스는 충분히 설명하기 때문에 이미 원하는 기능은 모두 구현되었다고 판단되었다. 라디오 정시 뉴스와 품질도 비슷하다.

음성인식은 MacOS 에서 기본적으로 제공하는 SFSpeechRecognizer 프레임워크를 이용했다. 루프를 돌면서 마이크로 들어오는 사람의 목소리를 인식하는 프레임워크이다. ‘오늘의 뉴스’ 라고 외치는 것은 다음 작동을 위한 트리거에 불과하다. 원래 파이썬에서 만들기 쉬웠던 프레임워크이고, AI에게 시켜서 만들기도 쉽다. 이 프레임워크의 존재는 이 글의 주제는 아니다.

스피커로 대답을 하기 위해 쓰는 TTS 역시 MacOS 에서 기본적으로 제공한다. 터미널에 say -v Yuna "안녕하세요" 라고 치면 안녕하세요 라는 목소리가 스피커에서 흘러나올 것이다. 이 목소리보다 마이크로소프트의 MS Edge TTS가 더 자연스러워서 이걸 쓰기로 했다. 파이썬에는 이미 Edge TTS 패키지가 존재한다. 쉽게 가져다 쓸 수 있다는 이야기이다. 이 패키지도 이 글의 주제는 아니다.

‘오늘의 뉴스’라는 음성이 트리거링되었을 때, 파이썬 코드는 구글 뉴스 RSS에서 최신 뉴스를 가져온다. RSS는 Really Simple Syndication의 약자. 20여년 전부터 쓰여온 콘텐츠 전달 포맷이다. 각 언론사도 자사 사이트에서 RSS를 제공한다. 그리고 구글 뉴스는 전 세계의 언론사로부터 뉴스를 공급받아 목록을 제공한다. 그래서 Claude AI는 특별히 어떤 언론사를 지목하지 않고 구글 뉴스를 쓰기로 결정했던 모양이다. 이것도 개발일을 해온 입장에선 어렵지 않은 일이다.

기사 요약은 언론사 사이트를 읽은 뒤 Gemini 에게 내용을 요약해달라고 시켰다. AI학습 금지 조항을 달아둔 언론사들도 있지만 기계적인 차단장치를 걸어둔 곳은 국내에는 그리 많지 않았다. 반면 해외 매체는 프로그래밍적 접근이 문제가 아니라 아예 페이월(Paywall - 돈을 내야 볼 수 있는 잠금화면)이 걸려있다.

구글 뉴스는 알고리즘을 통해 중요 뉴스를 배치한다. 여기서 언론사 크레딧은 그다지 중요하지 않다. 기사 주인이 조선일보든 한겨레든 MBN이든 KBS든 알 바 아니다. 거의 모든 언론사들이 같은 주제로 기사를 써내려가고 있고, 비슷비슷한 기사는 그 아젠다의 중요성에 가중치를 부여하는 역할로만 알고리즘에서 기여한다. 각 뉴스의 제호는 프롬프트에서 언론사 이름은 읽지는 마 라는 한 문장으로 쉽게 제거된다. 그리고, 아무리 자세하게 기자가 글에 살을 붙였다 한들, 4~6문장으로 요약해 라는 프롬프트만으로 기자가 정성스레 덧붙인 코멘트는 소거된다.

군더더기 버그를 고쳐달라는 프롬프트를 제외하면, 말 귀를 알아듣는 음성인식 봇을 만들어줘 그리고 오늘의 뉴스를 물어보면 오늘의 뉴스를 요약해서 읽어줘 두 가지만 Claude AI에게 물어보았더니 4~5분 가량의 개인용 실시간 오디오 뉴스가 탄생했다.

상품화를 못할거라고? 요즘 알리익스프레스는 설명서를 포함한 오픈소스 키트를 묶어 판다. 3D프린터로 조립된 케이스 안에 부품을 조립해 넣고 USB 로 소프트웨어를 주입하면 알아서 돌아가는 식이다.

꼴 좋다고 비웃던 사이에

자 이제, 방송사 뉴스는 뭐하러 듣고, 신문사 기사는 뭐하러 봐야하는가?

뉴스에 관점을 붙여온 기자는 이제 어디로 가야하는가? LLM이 문장을 대신 쓰고 있다.

뉴스를 고르는 데스크는 이제 어디로 가야하는가? 알고리즘이 데스킹을 대신하고 있다.

뉴스를 읽는 아나운서는 이제 어디로 가야하는가? TTS가 뉴스를 대신 읽고 있다.

뉴스를 틀어주는 방송사는 어디로 가야하는가? 인터넷이 알아서 뉴스를 배달하고 있다.

뉴스를 만드는 언론사는 어디로 가야하는가? AI가 알아서…

프로그래밍된 동작이 인간의 동작을 대체하고 있다고 2018년 칼럼에 썼었다. 누군가의 일자리를 빼앗지 못하면 혁신이 아니라는 구호가 스타트업 업계에 팽배하던 시절도 지나갔다. AI 등장 이후 진짜로 여기저기 일자리를 빼앗을 수 있다는 곡소리가 나온다. 하필 ‘고액 연봉 개발자들 이제 쪽박 찬다’는 FOMO 기사를 수많은 언론들이 쏟아냈다. 그런데 이번에는 그 언론사들도 존립이 위태로운 형국이다. AI가 뉴스를 대신 요약하면서 언론사 사이트 방문자수가 급감했다는 소식이 심심치 않게 들려온다.

꼴 좋다고 비웃는 사람들이 있었다. 언론사가 언론사답지 못하다는 힐난이야 50여년 전부터 내려온 것이긴 하다. 황색저널리즘 이야기도 있었다. 30여년 전 쯤부터 지하철역 입구에 무가지가 배치되면서 신문 안 읽는 세상이라고 혀를 차는 이들도 있었다. 그러다 20여년 전부터 포털 사이트를 통해 조각조각난 뉴스를 보는 사람들이 전체 뉴스 소비자의 대부분이 되어버렸다. 방송 뉴스도 45분 가까이 되는 뉴스편성이 포털에서 3분 단위로 조각조각나고 스탠딩 멘트는 스크립트로 따여져 텍스트로 재가공되었다. 제호 아래의 1면 배치로 권력을 휘두르던 신문 권력과 메인 뉴스 첫꼭지 배치로 권력을 휘두르던 방송 권력이 물러갔다며 좋아하는 사람들도 있었다. 레거시 미디어라는 용어가 한국어로 ‘재래식 언론’으로 바뀌더니 언제부터인가 조롱의 언어로 쓰이고 있다.

솔직히 AI 앞에서 남 밥그릇 사라지는 일에 즐거워하던 기사들을 떠올리면 나도 니들 꼴 좋다고 비아냥거리고 싶은 마음이 아른거리긴 한다. 하지만, 정말 꼴 좋다고 비웃어도 될 일인가? 빈 자리는 저마다 내편을 찾는 유투버들이 새로운 언론인을 자처하며 저마다의 부족을 만들어냈다. 일론 머스크는 공영방송이 쓰레기라며 NPR의 예산을 끊으라 했고, 트럼프 정부는 정말로 예산을 끊어 PBS와 NPR을 문닫게 했다. 그 결과 2026년 슈퍼볼 하프타임 공연은 두 쪽이 났다. 남의 나라 이야기인가? 한국도 “우리는 유튜브만 믿어! 유튜브가 진실이야!”가 구호로 등장한다.

그래서 그 결과는 어떠한가? 릴스 쇼츠는 극우선전에 잠식되었고, 좌파 부모에게서 우파 청년이 탄생했다고 어디서는 폭죽을 터트린다. 그렇게 대화가 단절되고, 나의 일상에서 안전이 위협을 받기 시작한다. 꼴 좋다고 비웃고 넘어간 댓가는 아닌지?

저널리즘 그 너머에

사회의 합의를 이끌어내는 공론장은 민주주의 사회에서 언제나 필요하고, 공공의 아젠다가 공유되지 않는다면 분리주의가 팽배해진다. 선전매체가 아닌 ‘언론’은 그래서 필요하다. 특히나 공영 언론은 민주주의 유지를 위한 세금에 가깝다.

AI가 만들어내는 요약은 요약 텍스트일 뿐 진실을 담고 있지 않다. 가짜뉴스가 양적으로 팽창할수록, 대안팩트가 팽배한 시대일수록, 우리에게는 진짜 ‘진실’이 더욱 절실해질 것이다.

LLM이 품고 있는 본질적인 구조때문에, LLM은 자신이 만들어낸 문장의 ‘진실성’을 보증할 길이 없다. 그럴 수록 우리에게는 진실의 ‘신뢰할 만한 보증인’이 필요하다. 언론의 제호, 콜싸인은 이제 그 보증인의 역할을 해야 한다.

알고리즘은 공공의 영역이 아니고 공적 지배구조를 가지고 있지 않다. 필요에 따라선 누군가의 욕망을 담아 편향되게 운영될 수도 있는 것이 알고리즘이다. (포털 장악의 욕망을 다시 읽어보시라) 그냥 하는 이야기가 아니라 플랫폼을 차지한 뒤 타국 선거에 개입했다는 공식 발표를 내놓는 정부 수사기관도 있었다. 그러니, 어딘가에는 공적 지배구조를 가지거나 공적 영역에 발을 담근 사명을 가진 이들이 알고리즘을 감시할 수 있어야 한다. 저널리즘은 알고리즘과 AI시대에 알고리즘을 감시하는 역할을 해야 한다.

수제 코딩에 대해 비웃는 사람들이 많다. 하지만 LLM이 만들어낸 코드를 많은 개발자들이 직접 검수를 한다. 회사 사장님이 확 가버린 사람이 아닌 한, 보안 문제를 챙기기 위해서라도 사람이 검수를 해야하고, 한심하게 비용이 늘어나게끔 설계하지 않았는지 최종 검수하는 역할은 결국 인간이 해야 한다. 그렇다면 ‘자기 이름을 걸고’ 기사를 쓰는 기자들 역시 자기 기사에는 그 정도 가치를 걸고 보도를 해야 가치가 입증되지 않을까? 받아쓰는 기사가 아니라 자기 이름을 걸 만한 기사를 만들어내야 한다는 이야기다. 이제는 그런 기사만이 AI의 쓰레기더미로부터 살아남아 빛을 볼 것이다.

프롬프트 몇개면 뉴스는 쉽게 확보된다. 그러면 누가 언론사 사이트를 방문하겠는가? 이제는 사람이 아니라 파이썬 코드가 기사를 읽고, AI가 기사를 읽는다. 광고를 봐줄 사람이 사라지는데, 그러면 언론사는 무엇으로 자생력을 갖추어야 하는가?

프롬프트를 조금만 고친다면 내가 관심있어하는 언론사의 기사만 읽거나, 특정 주제의 기사만 요악해서 들려주는 봇을 만드는 것도 가능할 것이다. 뉴스의 소비가 더욱 파편화되고 개인화되며 맥락이 소거되는 시대에 대한 전망은 포털을 통한 뉴스공급이 시작될 즈음부터 예견되었던 것이다. 그 미래가 예정대로 찾아왔을 뿐이다. 클릭바이트에 매몰되었던 지난 몇십여 년의 관성에서 다시 벗어나, 본래의 존립 근거를 물어야 한다. 언론이 왜 필요한지, 민주주의 사회에서 언론은 어떤 역할을 해야하는지 처음부터 물어봐야할 때가 되었다. 그리고 새로이 바뀐 생태계에 맞게 생존 방식을 바꾸어야 한다.

굳이 이런 시대에도 언론사의 콘텐츠를 일부러 찾고, 신문을 읽고 방송을 찾는 이유를 다시 만들어내야 한다. 그것이 무엇인지는 실은 언론인들도 다 알고 있을 것이다. 모르겠다면 다시 옛 책을 펼쳐 볼 때이다.

소스코드 공개

사람 말을 알아듣고 뉴스를 요약해 들려주는 봇의 코드는 https://github.com/rainygirl/rspeaker 에서 누구나 다운받아 체험해볼 수 있다.

make run 만 하면 작동한다

MIT 라이센스이다. 어차피 내가 수제로 만든 코드도 아니다. 누구나 고쳐 쓸 수 있지만 각 코드의 책임은 고쳐쓰는 각자에게 있다.