위 영상은 원래 한국어 자막이 없는 해외 영상입니다. 그러나 30분만에 쓸만한 퀄리티의 자막을 만들어서 개인용으로 감상하는 모습입니다. (유튜브 기본 자동번역과 퀄리티가 다릅니다.)
이 글에서는 제가 직접 쓰고있는, 개인화된 한국어 자막 생성용 AI 모듈을 구현한 아이디어에 대해 소개합니다.
특징을 요약하자면 아래와 같습니다.
- 자막 전문 채널에 가서 ‘제발 이 영상좀 번역해주세요’라고 부탁할 필요 없음
- 원하는 영어 원본 영상 링크를 넣으면 곧바로 30분만에 한국어 자막을 만듬
- AI의 성능을 누리면서도 400만원짜리 초고성능 컴퓨터를 맞출 필요 없음. 크롬만 되면 사용 가능
- 사용법이 클릭 몇 번이면 끝날 정도로 간편하며, 일상 용도로는 무료로 사용가능
유튜브에서 해외 영상을 자주 보시는 분들은 이 부록이 특히 유용하실 겁니다.
‘아.. 이 영상 자막 어디 없나? 꼭 보고싶은데.. 자동번역은 진짜 못봐주겠네.’
유튜브를 지식 찾기나 자기계발 혹은 투자 목적으로 쓰시는 분들은 위와 같은 경우가 한 번쯤 있으셨을 텐데요. 무슨 말인지 알아들을 수 있으면 참 좋을텐데, 모국어도 아닌 영어로 열심히 들으려니 제대로 들리지도 않고, 에너지 소모도 많아서 답답했던 적이 있으셨을 겁니다.
그렇다고 비슷한 주제를 다룬 대체 영상을 국내에서 찾자니 이 분야에 대해 그정도로 깊이 다룬 유튜버도 찾기 어렵고, 하물며 영상마다 내용이 100% 똑같을수가 없기에 찝찝함이 가시지 않는데요. 이런 경험이 있으시다면 앞으로 소개해드리는 아이디어가 답답함을 해소하는 데에 도움이 되실 겁니다.
이 파트에서는 제가 개인적으로 상당히 유용하게 쓰고 있는 ‘받아쓰기 모듈’을 소개해드리려고 합니다. 이 모듈은 AI를 기반으로 한 프로그램인데요. 유튜브 영상을 넣으면 AI가 알아서 영상에서 말하는 음성을 ‘받아쓰기’ 해서 자막으로 만들고, 번역까지 해주는 기능이 있습니다.
이득 1. 언어의 장벽 초월 능력
제가 지금 소개하는 모듈을 사용한다면 얻는 이득은 다음과 같습니다.
- 언어의 장벽을 넘어서 ‘국내에서’가 아니라, ‘지구상에서’ 최전선에서 만들어지고 있는 최신 지식들, 최신 기술들, 최신 유행들에 직접 접근할 수 있는 능력이 생깁니다.
- 아주 오래된 지식들에 대해서도 접근이 가능해집니다. 사람들이 더이상 찾지 않는 곳에 조회수 900도 찍지 못하고 묻혀있는, 그러나 깊이있는 밀도로 결정적인 도움이 될 수 있는 지식들에 대해 ‘개인적으로’ 접근할 수 있는 능력을 갖게 될 것입니다.
이 모듈을 만들기 전까지, 저는 ‘한국어’라는 한계에 갇혀있었습니다. 그나마 국내 유튜버들 중 몇몇이 해외 전체 영상이라는 바다에서 ‘한 두 방울’에 해당하는 극소수 영상만을 번역해서 올려주는 영상만을 보면서 채워지지않는 지식의 퀄리티에 대한 갈증을 느꼈습니다.
그래서 결국 정보획득능력을 업그레이드하기 위해 스스로 이 모듈을 개발했습니다.
이 모듈이 있다면 번역 전문 유튜브 채널에 가서 ‘이 영상도 번역해주실 수 있나요?’하고 언제 될지도 모르고, 들어줄지도 모르는 부탁을 하고 하염없이 기다리지 않아도 됩니다. 이 모듈을 사용한다면, 유튜브 링크만 하나 던져넣고 가볍게 30분 산책 나갔다 오면 자막 파일은 물론 번역까지 마쳐져있는 환경을 갖게 됩니다. 업로드된지 2시간밖에 안된 따끈따끈한 해외 유튜브 영상에 개인용 자막을 입혀서 감상할 수 있게 되는 것이죠.
말 그대로 언어의 장벽을 초월해서 지식을 얻을 수 있게 되는 것입니다.
이득 2. 말로 나눈 이야기를 ‘검색’하는 능력
또한 앞서 소개해드린 영어 영상에 번역자막 입히는 용도는 사용 사례의 하나일 뿐입니다. 저는 이 모듈을 응용해서 한국어 영상에도 유용하게 쓰고 있는데요.
예를 들어 국내 채널 중에 ‘이 유튜버는 정말 배울 점이 많은데.. 무편집본 1시간짜리를 통으로 올리는게 아쉽네..’하는 경우가 있습니다. 대부분은 이런 경우 여유롭게 시간을 갖고 운전하거나 대중교통을 사용하며 라디오 듣듯이 천천히 듣는 편을 택합니다.
그런데 만약 이런 채널이 한 두개가 아니고, 들어야 할 영상이 100~200개라면 어떨까요? 이걸 다 듣는건 영원한 숙제처럼 느껴질 것입니다. 집중력도 빨리 고갈되고 지치는 일처럼 느껴져서 결국 양에 질려버리게 됩니다. 듣고 듣고 또 들으며 딴 길로 새는 얘기나 가십거리들을 한 귀로 흘리면서 ‘언제 다듣지..’하는 한숨이 나올 것입니다.
저는 시간의 효율성을 위해 이런 수많은 영상들에 대해 한국어 자막을 만들고, ctrl F를 눌러 필요한 내용만 ‘검색’하거나, 스크롤을 내리며 잡담은 거르고 핵심 내용만 ‘읽는’ 식으로 활용하고 있습니다.
이렇게 말로 되어있는 이야기를 ‘읽게’ 되면 아래의 이득을 덩달아 얻게 되는데요.
이득 3. 뇌의언어 해킹 방어력 증가
이 모듈을 사용하게 되면 영상매체에서 사용되는, 뇌의 정보처리를 교란시키는 각종 트릭에 면역을 갖게 됩니다.
예를 들어 시청자들에게 두려움울 주고싶다면 영상에서는 그 목적을 달성하기가 상당히 쉽습니다. 우리가 앞서 다룬 뇌의언어의 표현적인 면을 몰라도, 단순히 으스스한 배경음악을 넣기만 해도 그 감정을 심어줄 수 있기 때문입니다. 이런 식으로 긴장을 고조시키거나, 엄청 놀란 것 같은 목소리 톤으로 ‘놀라운 정보인가보다’하고 은연중에 느끼게 만들거나 (진짜 그 정보가 그런지와 상관없이) 하는 식으로 뇌를 해킹하려는 수작들을 전부 무효화시킬 수 있습니다.
만약 이 모듈을 쓰기로 결심하게 되신다면, 테스트삼아 기존에 보던 영상들에 사용해보시길 바랍니다. 끄덕끄덕하며 보던 영상들을 텍스트로 보면 놀라실 겁니다. ‘이렇게 허술한 논리였어?’하고 말이죠. – 왜곡 이론에서 좀 더 자유로워지는 것입니다.
비슷한 맥락에서 텍스트로 보게 되면 불필요하고 자극적인 후킹문구들은 건너뛰고, 내가 필요한 부분만 취하면서 자신의 페이스대로 조절하며 정보를 받아들일 수 있게 됩니다.
최근 제 블로그에서 ‘NPC이론’에 대한 글을 올렸는데요. 여기에서 강조한 내용은 NPC가 되지 않으려면 정보과부하로부터 뇌를 보호하는게 핵심하고, 이를 위해 ‘비판적사고’가 중요하다는 점이었습니다.
영상을 시청할 때에는 페이스 조절이 영상 편집자에 의해 이루어지므로 비판적 사고 능력이 쉽게 우회됩니다. 하지만 글로 읽을 때에는 스스로 페이스를 조절할 수 있기에 좀 더 휘둘리지 않고 정보를 흡수할 수 있습니다.
여기까지 읽으셨다면, 아래와 같은 생각이 드실수도 있습니다.
‘거창하게 소개했지만 그냥 해외 영상에 자막 달아주는거 아닌가요?’
‘자막 다는거, 번역 하는거 다 지금도 가능하잖아요.’
하며 별 거 아닌 아이디어라는 생각이 드실 수 있습니다. 물론 이미 있는 기술입니다. 저는 그것들을 ‘이거 자막 달아서 보고싶다!’라는 생각이 들자마자 1분만에 사용할 수 있게 극도로 간결화했을 뿐입니다.
실제 세계에서 쓸 수 있을 정도로 고도화된 모듈
핵심은 간편성과 편리성을 최대화한 모듈이라는 데에 있습니다.
기존에도 번역기는 있었습니다. 해석이 궁금한 게 있으면 구글 번역기같은 곳에 복사-붙여넣기를 할 수 있었죠. 또 기존에도 음성인식 서비스는 있었습니다. 핸드폰 마이크를 가져다 대면 글자로 바뀌는 기능이 있었죠.
하지만 1시간짜리 영상에 계속 마이크를 대고 있을수는 없는 노릇입니다. 또 그렇게 해서 얻은 글자들을 일일이 복사 붙여넣기해서 번역하고, 그걸 또 적절한 타임스탬프에 맞춰 자막 파일로 만드는 건 엄청난 노동이 됩니다.
잘 찾아보면 영상을 업로드하면 자막으로 생성해주는 서비스가 있을지도 모릅니다. 그런데 영상을 업로드하기 위해 수동으로 다운받고, 또 그걸 업로드하고, 영어라면 번역도 따로 해야하는 수고로운 작업이 남습니다. 그 서비스에서 내가 업로드한 영상의 정보로 무슨 짓을 할지도 믿을 수 없고요.
제가 소개해드리는 모듈은 수 천번의 사용을 통해 진화시키고, 극한의 커스터마이징과 개발을 통해 보안을 높이고, 사용을 매우 쉽게 했다는 특징이 있습니다.
최상단에 첨부한 gif가 실제 사용 예시입니다. 프로그램이 다 돌면 위처럼 자신의 구글드라이브 폴더에 영상과 자막이 생성됩니다. 자막을 입혀준 뒤 그저 더블클릭해서 감상만 하면 되는 것이죠. 다운로드할 필요조차 없습니다.
단지 유튜브 링크 하나만 넣으면 알아서 영상 다운로드, 자막 받아쓰기 작업, 번역이 진행됩니다. 다 끝나면 다운받을 필요도 없이 바로 열어서 감상할 수 있습니다.
‘낮에 돌리면 밤에서야 끝나는거 아닌가요?’하실 수 있는데요. 이 프로그램은 10초에 30초 분량의 자막을 만듭니다. 다시 말해 1시간짜리 영상의 자막 및 번역 작업이 끝마쳐지는 데에 30분도 채 걸리지 않습니다. 이 모든 과정은 본인 소유의 구글드라이브를 사용하기 때문에 데이터 유출 걱정도 없고, 400만원짜리 컴퓨터 견적을 맞출 필요도 없으며, 추가로 지출되는 요금도 없다는 장점이 있습니다. 그저 크롬 인터넷창을 열어서 ‘실행’ 버튼만 누르면 되는 수준의 간결함을 지녔습니다.
물론 유튜브 링크만 입력 가능한 게 아니라, 소장중인 영상파일을 직접 넣어도 자막을 입힐 수 있습니다.
이런 간결성은 해외영상을 제대로 이해하면서 보고싶을 때 복잡한 작업을 위해 ‘큰 마음 먹고’ 해야 하는 수준에서 손가락만 몇 번 까딱하면 되는 쉬운 일로 만들어주는 데에서 가치가 있다고 생각합니다.
여기까지 읽으셨다면 ‘그래서 이걸 어떻게 쓸 수 있는건가요?’라는 의문이 드실 텐데요. 제가 몇 개월에 걸쳐서 점진적으로 진화시킨 모듈을 한 달 커피값 정도의 저렴한 가격에 제공해드리기로 결정했습니다. 제가 만든 모듈을 직접 사용하고싶으시다면, 여기에서 만나보실 수 있습니다.
모듈을 구매하시면 아래 혜택이 추가로 제공됩니다.
- 사용법 외에도, 번역해서 볼만한 가치있는 채널들, 해외에서 뇌의언어를 실제로 사용하는 유튜버 등을 짧게 소개해두었습니다.