안녕하세요, 님👋 스켈티가 님께 “당신이 일상에서 느끼는 인공지능이란 무엇일까요?”라고 묻는다면, 어떤 대답을 가장 먼저 듣게 될까요? AI라는 단어를 실생활에서 쉽게 접하게 된 첫 계기를 아마도 “AI 스피커" 혹은 스마트폰에 탑재된 음성 어시스턴트라 답하는 사람들이 많지 않을까 싶어요. 여러분도 일상 속에서 음성으로 명령하고, 명령에 따른 역할을 수행하는 디바이스를 사용해보신 적이 있을 거에요. 손을 사용할 수 없는 상황에서 음성으로 문자메시지를 보내거나, 음악이 흘러나오는 스피커의 볼륨을 낮추고, 리모컨 대신 TV 채널을 바꾸는 행위가 모두 AI 기반의 음성인식(Speech Recognition) 혹은 STT(Speech-to-Text)라 불리는 기술로 가능하죠. 오늘만 해도, 아침에 일어나자마자 AI 스피커에게 샤워하면서 들을 음악을 틀어달라고 하고 날씨와 미세먼지 농도를 물어보며 하루를 시작한 스켈티입니다. 오늘은 이처럼 우리가 가장 먼저, 쉽게, 접하는 AI, 음성인식을 기술적 관점으로 살펴보려고 해요. 어떻게 AI는 사람의 목소리를 신호로 인식해, 텍스트로 변환할까요? 여성과 남성의 각기 다른 톤의 목소리, 소음이 많은 환경이나 전화 통화 상의 목소리, 이미 녹음된 목소리 등 다양한 종류의 음성을 정확하게 인식하는 AI 모델은 어떤 식으로 구현될까요? 스켈터랩스의 음성인식 엔진은 단독으로도, 혹은 보이스봇 같은 패키지된 서비스로도 다양하게 쓰일 수 있고, 계속해서 최신 AI 기법을 도입하며 성능 고도화를 진행하고 있어요. 워낙 여러 곳에, 다채로운 형태로 쓰일 수 있는 기술인만큼 이번 레터뿐 아니라 앞으로도 자주 관련 내용을 소개드릴 것 같아요. 기대해 주실 거죠? 재밌게 읽어주시길 바라며, 내용이 좋으셨다면 주변에도 뉴스레터 구독을 추천해 주세요.😉 #1. 누구의 목소리인지 듣고 맞추기, 화자인식 '음성인식 AI'로 통칭되지만, 각기 다른 특징과 목적을 가지고 있는 요소 기술 - 특히 화자 인식(Speaker Recognition)에 대해 알아볼게요. 화자분할, 화자식별, 화자검증 등의 기술이 어떤 문제를 해결하고 있는지, 그리고 이렇게 '누구의 목소리인지 잘 분간하는' 화자인식 기술이 어떻게 활용되는지를 짚어봤어요. #2. 한국어 최고의 음성인식 엔진, 우리가 만들어요! "음성 인식 기술이 각 개인의 문맥과 상황을 인지해서, 사용자가 정말 필요할 때 도움을 줄 수 있는, 진정한 어시스턴트의 역할을 하는 데 활용됐으면 한다. 즉, ‘나'를 제대로 인지하는 음성인식 기술으로 발전해 나갔으면 좋겠다." - 스켈터랩스의 Principal Software Engineer, 길현석 님과의 인터뷰를 통해 음성인식 개발에 대한 뒷이야기를 들어보세요😉 #3. 해외의 음성인식 기술은 어디까지? 워낙 다양한 분야에 필수적으로 쓰이는 AI 기술이기에, 음성인식 기술에 대한 흥미로운 소식은 해외에서도 많이 들려오고 있어요. 스켈티가 여러분이 알아두시면 좋을만한 음성인식 관련 해외 뉴스들을 모아모아 살펴보실 수 있게 소개할게요! 오늘의 뉴스레터는 여기까지 님, 다음에도 새롭고 흥미로운 소식으로 찾아오겠습니다. 꼭 다시 만나요👋 스켈터랩스의 솔루션 도입에 관심이 있거나 비즈니스 파트너십 제휴 문의를 하고 싶으시다면, business@skelterlabs.com 으로 연락 주세요. Skelter Labs hello@skelterlabs.com 04798 서울특별시 성동구 성수이로22길 60 (성수동2가), K2빌딩, 6-7F 1666-8972 수신거부 Unsubscribe |
스켈터랩스의 AI 연구원과 함께 최신 대화형 AI 트렌드를 정리해 드려요.