Research

International Journal

Taewoo Lee, Sukmoon Chang, and Dongsuk Yook
“Parallel SRP-PHAT for GPUs”
Computer Speech and Language, vol. 35, pp. 1-13, Jan. 2016

In-Chul Yoo, Hyeontaek Lim, and Dongsuk Yook
“Formant-Based Robust Voice Activity Detection”
IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol. 23, no. 12, pp. 2238-2245, Dec. 2015

Hyeontaek Lim, In-Chul Yoo, Youngkyu Cho, and Dongsuk Yook
“Speaker Localization in Noisy Environments Using Steered Response Voice Power”
IEEE Transactions on Consumer Electronics, vol. 61, no. 1, pp. 112-118, Feb. 2015

Dongsuk Yook, Taewoo Lee, and Youngkyu Cho
“Fast Sound Source Localization Using Two-Level Search Space Clustering”
IEEE Transactions on Cybernetics, vol. 46, no. 1, pp. 20-26, Feb. 2015

Sunhyung Lee, Dongsuk Yook, and Sukmoon Chang
“An Efficient Audio Fingerprint Search Algorithm for Music Retrieval”
IEEE Transactions on Consumer Electronics, vol. 59, no. 3, pp. 652-656, Aug. 2013

Hyubwoo Lee and Dongsuk Yook
“Feature Adaptation for Robust Mobile Speech Recognition”
IEEE Transactions on Consumer Electronics, vol. 58, no. 4, pp. 1393-1398, Nov. 2012

Hyubwoo Lee and Dongsuk Yook
“Space-Time Voice Activity Detection”
IEEE Transactions on Consumer Electronics, vol. 55, no. 3, pp. 1471-1476, Aug. 2009

Hyubwoo Lee, Sukmoon Chang, Dongsuk Yook, and Yongserk Kim
“A Voice Trigger System Using Keyword and Speaker Recognition for Mobile Devices”
IEEE Transactions on Consumer Electronics, vol. 55, no. 4, pp. 2377-2384, Nov. 2009

Youngkyu Cho, Dongsuk Yook, Sukmoon Chang, and Hyunsoo Kim
“Sound Source Localization for Robot Auditory Systems”
IEEE Transactions on Consumer Electronics, vol. 55, no. 3, pp. 1663-1668, Aug. 2009

Youngkyu Cho and Dongsuk Yook
“Rapid Adaptation Using Linear Spectral Transformation for Embedded Speech Recognizers”
IET Electronics Letters, vol. 44, no. 17, pp. 1040-1042, Jan. 2008

In-Chul Yoo and Dongsuk Yook
“Automatic Sound Recognition for the Hearing Impaired”
IEEE Transactions on Consumer Electronics, vol. 54, no. 4, pp. 2029-2036, Nov. 2008

Donghyun Kim and Dongsuk Yook
“Linear Spectral Transformation for Robust Speech Recognition Using Maximum Mutual Information”
IEEE Signal Processing Letters, vol. 14, no. 7, pp. 496-499, Jul. 2007

Donghyun Kim and Dongsuk Yook
“Feature Transform in Linear Spectral Domain for Fast Channel Adaptation”
IEE Electronics Letters, vol. 40, no. 20, pp. 1313-1314, Sep. 2004

Donghyun Kim and Dongsuk Yook
“Fast Channel Adaptation for Continuous Density HMMs using Maximum Likelihood Spectral Transform”
IEE Electronics Letters, vol. 40, no. 10, pp. 632-633, May 2004

 

Domestic Journal

Youngkyu Cho and Dongsuk Yook
“Maximum Likelihood Training and Adaptation of Embedded Speech Recognizers for Mobile Environments”
ETRI Journal, vol. 32, no. 1, pp. 160-162, Feb. 2010

In-Chul Yoo and Dongsuk Yook
“Robust Voice Activity Detection Using the Spectral Peaks of Vowel Sounds”
ETRI Journal, vol. 31, no. 4, pp. 451-453, Aug. 2009

Donghyun Kim and Dongsuk Yook
“A Closed-Form Solution of Linear Spectral Transformation for Robust Speech Recognition”
ETRI Journal, vol. 31, no. 4, pp. 454-456, Aug. 2009

Kyongchul Yang, Yongchan Bang, Sunho Cho, and Dongsuk Yook
“주파수 변화율을 이용한 음성과 음악의 구분”
한국음향학회지, vol. 28, no. 3, pp. 454-456, Aug. 2009

Hyubwoo Lee and Dongsuk Yook
“Sound Source Localization using Acoustically Shadowed Microphones”
음성과학, vol. 15, no.3, pp. 17-28, Sep. 2008

Sung-a Kim, Dongsuk Yook, and Ohil Kwon
“Phonetic Question Set Generation Algorithm”
한국음향학회지, vol. 23, no.2, pp. 173-179, Feb. 2004

 

International Conference

Hyeopwoo Lee and Dongsuk Yook
“Unsupervised Adaptation without Estimated Transcriptions”
IEEE International Conference on Acoustics, Speech, and Signal Processing, pp. 7918-7921, May 26-31, 2013, Vancouver, Canada

Donghyun Kim and Dongsuk Yook
“Fast Speech Adaptation in Linear Spectral Domain for Additive and Convolutional Noise”
International Conference on Spoken Language Processing, vol. 4, pp. 2557-2560, Oct. 2004, Jeju, Korea

Youngkyu Cho and Dongsuk Yook
“Hybrid Model using Subspace Distribution Clustering Hidden Markov Models and Semi-Continuous Hidden Markov Models for an Embedded Speech Recognizer”
International Conference on Spoken Language Processing, vol. 1, pp. 669-672, Oct. 2004, Jeju, Korea

Dongsuk Yook
“Unsupervised Incremental Online Adaptation to Unknown Environment and Speaker”
IEEE International Conference on Acoustics, Speech, and Signal Processing, vol. 1, pp. 617-620, May 13-17, 2002, Orlando, FL, USA

 

Domestic Conference

박지웅, 육동석
“음성 인식을 위한 적층 잡음 제거 오토인코더”
한국음향학회 춘계학술대회 발표논문집, 제 35권, 제1(s)호, 6 쪽, 2016년 5월 12일.

이태우, 오상준, 육동석
“화자 위치 추적 및 음성 강화 알고리즘 성능 평가”
한국음향학회 제29회 음성통신 및 신호처리 학술대회, 제 29권 제 1호, 46-47 쪽, 2012년 8월 25일.

오상준, 육동석
“원거리 음성 강화 알고리즘 성능 비교”
한국음성학회 봄 학술대회, 90-91 쪽, 2012년 5월 18일.

유인철, 육동석
“한국어 음성 인식을 위한 규칙 기반 발음 사전 생성 알고리즘”
한국음성학회 가을 학술대회, 81-82 쪽, 2011년 12월 2일.

이태우, 육동석
“음원 위치 추적을 위한 GPU 기반 SRP-PHAT의 최적 스레드 구성”
한국음성학회 가을 학술대회, 제 30권 제 2호, 100-103 쪽, 2011년 12월 2일.

이태우, 육동석
“음원 위치 추적을 위한 GPU 기반 병렬 SSC-SRP-PHAT”
한국음향학회 추계학술대회 논문집, 제 30권 제 2호, 71-72 쪽, 2011년 11월 10일.
(우수발표상)

이선형, 육동석
“음악 검색을 위한 오디오 핑거프린트 추출 실험”
한국음향학회 춘계학술대회 논문집, 제 30권 제 1호, 171-172 쪽, 2011년 5월 11일.

오상준, 육동석
“안드로이드 기반 실내 위치 추적 기술”
HCI 2011 학술대회, 72-74 쪽, 2011년 1월 26일.

이선형, 육동석
“음악 검색을 위한 오디오 핑거프린팅 방법”
한국멀티미디어학회 추계학술대회, 제 13권 제 2호, 434-435 쪽, 2010년 11월 19일.

백향순, 조선호, 육동석
“음절 기반 인식 단위를 사용한 한국어 연속 숫자음 인식”
한국멀티미디어학회 추계학술대회, 제 13권 제 2호, 514-515 쪽, 2010년 11월 19일.

유인철, 육동석
“음성 인식”
한국음향학회 추계학술대회, 제 29권 제 2호, 243 쪽, 2010년 11월 10일.

이태우, 김승일, 육동석
“부부젤라 소음 제거”
한국음향학회 제27회 음성통신 및 신호처리 학술대회, 제 27권 제 1호, 39-42 쪽, 2010년 8월 21일.
(소리상)

임현택, 유인철, 육동석
“GPU를 이용한 고속 화자 식별”
한국 음성학회 가을 학술대회, 189-190 쪽, 2009년 11월 28일.

임현택, 육동석
“음성 인식을 이용한 성도 면적 추정 성능 개선”
한국음성학회 가을 학술대회, 191-192 쪽, 2009년 11월 28일.

최우진, 육동석
“음성과 음악의 구분 성능 개선”
한국음향학회 제26회 음성통신 및 신호처리학술대회, 275-276 쪽, 2009년 8월 22일.

권석법, 육동석
“등록 및 인증 데이터양에 따른 문맥 종속 화자 인식 성능 분석”
한국음향학회 제26회 음성통신 및 신호처리학술대회, 5-6 쪽, 2009년 8월 22일.
(소리상)

이시현, 육동석
“소형 로봇을 위한 음원 위치 추적 기술”
한국음향학회 제26회 음성통신 및 신호처리학술대회, 159-160 쪽, 2009년 8월 22일.

방용찬, 육동석
“음성과 음악의 구분을 위한 주파수 변화율 추정 성능 개선”
한국음향학회 춘계학술발표대회 논문집, 266-267 쪽, 2009년 5월 14일.

유인철, 육동석
“Speech Processing Techniques for Efficient Human-Robot Interface”
한국언어학회 2008년도 겨울 학술대회 자료집, 1-4 쪽, 2008년 12월 6일.

조영규, 육동석
“화자 인식을 위한 GMM과 HMM의 비교”
한국음향학회 추계학술발표대회 논문집, 299-302 쪽, 2008년 11월 14일.

최우진, 육동석
“도착 지연 시간 군집화를 이용한 음원 위치 탐색 속도 향상”
대한음성학회·한국음성과학회 공동 학술대회 발표 논문집, 3-6 쪽, 2008년 11월 21일.

권석법, 육동석
“등록 및 인증 음성데이터에 따른 화자 인식 성능 분석”
대한음성학회·한국음성과학회 공동 학술대회 발표 논문집, 7-8 쪽, 2008년 11월 21일.

김동현, 육동석
“선형 스펙트럼 변환 기술을 이용한 양자화 음향 모델 누적 적응”
한국음향학회 제25회 음성통신 및 신호처리 학술대회 논문집, 121-122 쪽, 2008년 8월 30일.

유인철, 육동석
“Spectral entropy에 기반한 음성구간 검출 알고리즘의 성능비교”
한국음성과학회·대한음성학회 공동 학술대회 발표 논문집, 63-64 쪽, 2008년 5월 17일.

이협우, 육동석
“Gaussian mixture models을 이용한 음성구간 검출”
한국음성과학회·대한음성학회 공동 학술대회 발표 논문집, 65-66 쪽, 2008년 5월 17일.

김동현, 육동석
“비지도 음성 적응의 신뢰도를 위한 state 사후 확률 분석”
대한음성학회 가을학술대회 발표논문집, 79-80 쪽, 2007년 11월 16일.

김동현, 육동석
“Lattice-Based Unsupervised MLLR for Acoustic Model Adaptation using Confidence Measure”
한국음향학회 추계학술발표대회 논문집, 41-42 쪽, 2007년 11월.

이협우, 육동석
“가려진 마이크로폰의 음원 위치 추적 성능 분석”
한국음향학회 제24회 음성통신 및 신호처리 학술대회 논문집, 229-230 쪽, 2007년 8월 4일.

유인철, 육동석
“잡음 환경에 강인한 원거리 음향 정보 검출 기술 연구”
대한음성학회ㆍ한국음성과학회 공동학술대회 발표논문집, 37-38 쪽, 2007년 5월 18일.

이협우, 육동석
“휴머노이드 로봇을 위한 원거리 음성 인터페이스 기술 연구”
대한음성학회ㆍ한국음성과학회 공동학술대회 발표논문집, 39-40 쪽, 2007년 5월 18일.

정재연, 육동석
“Steered response power를 위한 검색 공간 클러스터링 연구”
대한음성학회 가을 학술대회 발표 논문집, 88-91 쪽, 2006년 11월 17일.

조영규, 육동석
“노이즈 환경에 강인한 스펙트럴 엔트로피 기반의 음성 구간 검출”
한국음향학회 추계학술발표대회 논문집, 149-150 쪽, 2006년 11월 10일.

김동현, 육동석
“신뢰도를 이용한 래티스 기반 비지도 음성 적응”
한국음향학회 추계학술발표대회 논문집, 145-148 쪽, 2006년 11월 10일.

조영규, 육동석
“임베디드 음성 인식을 위한 Quantized Hidden Markov Model의 효율적인 codebook 디자인”
한국음향학회 제23회 음성통신 및 신호처리 학술대회 논문집, 167-170 쪽, 2006년 8월 26일.

정재연, 육동석
“휴대용 단말기에서 음원 위치 추적 기술 비교 연구”
대한음성학회 봄 학술대회 발표 논문집, 49-52 쪽, 2006년 5월 12일.

양경철, 육동석
“잡음 환경에서의 음성 검출 알고리즘 비교 연구”
대한음성학회 봄 학술대회 발표 논문집, 45-48 쪽, 2006년 5월 12일.

방규섭, 육동석
“모노폰 거리를 이용한 트라이폰 클러스터링 방법 연구”
대한음성학회 봄 학술대회 발표 논문집, 41-44 쪽, 2006년 5월 12일.

유하진, 김동현, 육동석
“음성 인식 기술 평가 동향”
대한음성학회 가을 학술대회 발표 논문집, 145-148 쪽, 2005년 11월 19일.

유봉수, 김동현, 육동석
“Maximum Mutual Information Estimation using Linear Spectral Transform based Adaptation”
대한음성학회 봄 학술대회 발표 논문집, 53-56 쪽, 2005년 4월 30일.

조영규, 육동석
“Codebook Design for Subspace Distribution Clustering Hidden Markov Model”
대한음성학회 봄 학술대회 발표 논문집, 87-90 쪽, 2005년 4월 30일.

김성아, 육동석
“결정트리 상태 클러스터링을 위한 데이터 기반 음소 질의어 집합 생성”
힌국음향학회 제20회 음성통신 및 신호처리 학술대회 논문집, 287-290 쪽, 2003년 8월 23일.

조영규, 육동석
“음성 인식을 위한 Multi-class Support Vector Machines”
한국음향학회 하계학술발표대회 논문집, 157-160 쪽, 2003년 7월 5일.

 

Etc.

Donghyun Kim and Dongsuk Yook
“Pronunciation Similarity Estimation for Spoken Language Learning”
ICCPOL, Lecture Notes in Artificial Intelligence, vol 4285, pp. 442-449, Dec. 2006

Donghyun Kim and Dongsuk Yook
“Robust Model Adaptation using Mean and Variance Transformation in Linear Spectral Domain”
IDEAL, Lecture Notes in Computer Science, vol 3578, pp. 149-152, Jul. 2005

Soonkyu Lee and Dongsuk Yook
“Audio-to-Visual Conversion Using Hidden Markov Models”
PRICAI, Lecture Notes in Artificial Intelligence, vol 2417, pp. 563-570, Aug. 2002

Soonkyu Lee and Dongsuk Yook
“Viseme Recognition Experiment Using Context Dependent Hidden Markov Models”
IDEAL, Lecture Notes in Computer Science,Vo 2412, pp. 557-561, Aug. 2002

Dongsuk Yook
“Decision Tree Based Clustering”
IDEAL, Lecture Notes in Computer Science, vol 2412, pp. 487-492, Aug. 2002

 

Last Millennium

Robust Speech Recognition Using Neural Networks and Hidden Markov Models
– Adaptations Using Non-linear Transformations –
Ph. D. dissertation, Rutgers University, October 1999
CAIP Technical Report TR-238, September 1999.

Adaptation To Environment And Speaker Using Maximum Likelihood Neural Networks
(Nominee of the ESCA best student paper)
European Conference on Speech Communication and Technology, September 1999.

Telephone Speech Recognition Using Neural Networks and Hidden Markov Models
IEEE International Conference on Acoustics, Speech, and Signal Processing, March 1999.

Speech Recognition in a Reverberant Environment using Matched Filter Array (MFA) Processing and Linguistic-Tree Maximum Likelihood Linear Regression (LT-MLLR) Adaptation
IEEE International Conference on Acoustics, Speech, and Signal Processing, March 1999.

Voiced-Unvoiced Classification for Recognition of Stop Consonants
Acoustical Society of America, 137th Meeting, March 1999.

A Neural Network System for Robust Large-Vocabulary Continuous Speech Recognition in Variable Acoustic Environments
CAIP Technical Report TR-234, January 1999.

N-best Breadth Search For Large Vocabulary Continuous Speech Recognition Using A Long Span Language Model
Acoustical Society of America, 136th Meeting, October 1998.

Speech Recognition in A Reverberant Environment Using Matched Filter Array Processing and Linguistic-Tree Maximum Likelihood Linear Regression Adaptation
Acoustical Society of America, 136th Meeting, October 1998.

Robust Speech Recognition Using Maximum Likelihood Neural Networks and Continuous Density Hidden Markov Models
IEEE Workshop on Speech Recognition and Understanding, December 1997.

Development of The RU Hub4 System
DARPA Speech Recognition Workshop, February 1997.

Selective Use of the Speech Spectrum and Effective Text Confirmation for Robust Speaker Recognition
International Conference on Spoken Language Processing, October 1996.

Environment-Independent Continuous Speech Recognition Using Neural Networks and Hidden Markov Models
IEEE International Conference on Acoustics, Speech, and Signal Processing, May 1996.

Robust Distant-Talking Speech Recognition
IEEE International Conference on Acoustics, Speech, and Signal Processing, May 1996.

An HMM Approach to Text-Prompted Speaker Verification
IEEE International Conference on Acoustics, Speech, and Signal Processing, May 1996.

Development of 1996 RU Speaker Recognition System
DARPA Speaker Recognition Workshop, March 1996.

Development of CROWNS: CAIP Recognizer Of Words ‘N Sentences
DARPA Speech Recognition Workshop, February 1996.

Environment-Independent Continuous Speech Recognition
IEEE Automatic Speech Recognition Workshop, December 1995.

A Microphone Array and Neural Network System for Speech Recognition
15th Annual Speech Research Symposium, June 1995.

 

Patents

특허명: 음원 처리 방법
발명인: 육동석, 이태우
출원번호(출원일): 10-2015-0141460(2015.10.08.)

특허명: 전 방향 고해상도 추적 녹화 장치 및 방법
발명인: 육동석, 이태우
출원번호(출원일): 10-2015-0113100(2015.08.11.)

특허명: 음원 위치 추정에 있어 대표 점 선정 방법 및 그 방법을 이용한 음원 위치 추정 시스템
발명인: 김현수, 육동석, 조영규, 최우진
등록번호(등록일): 1014832710000(2015.01.09.)

특허명: 로봇의 음원 위치 탐색 방법 및 그 장치
발명인: 김현수, 육동석, 조영규, 최우진
등록번호(등록일): 1014832690000(2015.01.09.)

특허명: 검색 공간 클러스터링 방법을 이용한 실시간 SRP-PHAT 음원 위치 탐색 시스템 및 제어방법
발명인: 김현수, 육동석, 조영규, 최우진
등록번호(등록일): 1014421720000(2014.09.12.)

특허명: Method of Recognizing Speech and Eletronic Device Thereof
발명인: Jaewon Lee, Dongsuk Yook, Hyeontaek Lim, and Taeyoon Kim
출원번호(출원일): US 20140019131 A1(2013.07.12.)

특허명: 숫자 음성 인식 장치 및 방법
발명인: 육동석, 조선호, 백향순
등록번호(등록일): 1012603680000(2013.04.26.)

특허명: 잡음 환경에서의 음성 처리 장치 및 방법
발명인: 임현택, 육동석
등록번호(등록일): 1012332720000(2013.02.07.)

특허명: 병렬 처리를 이용한 음원 위치 추정 장치 및 방법
발명인: 육동석, 이태우
등록번호(등록일): 101217#######(2012.12.26.)

특허명: Apparatus and Method for Localizing Sound Source in Robot
발명인: Hyun-Soo Kim, Dong-Suk Yook, Young-Kyu Cho, and Woo-Jin Choi
등록번호(등록일): US 8,159,902 B2(2012.04.17.)

특허명: 진화 학습에 의한 화자 적응 장치 및 방법과 이를 이용한 음성인식 시스템
발명인: 육동석, 이협우, 김동현
등록번호(등록일): 1010651880000(2011.09.08.)

특허명: 최대 우도 선형 스펙트럴 변환을 이용한 음향 모델 적응 방법 및 그 장치, 잡음 음성 모델을 이용한 음성 인식 방법및 그 장치
발명인: 육동석, 김동현, 이협우
등록번호(등록일): 1010471040000(2011.06.30.)

특허명: 고속 화자 인식 방법 및 장치, 고속 화자 인식을 위한 등록방법 및 장치
발명인: 육동석, 조영규
등록번호(등록일): 1010410350000(2011.06.07.)

특허명: 오디오 및 비디오 정보를 이용한 시공간 음성 구간 검출 방법 및 장치
발명인: 육동석, 이협우
등록번호(등록일): 1010410390000(2011.06.07.)

특허명: 음성과 음악을 구분하는 방법 및 장치
발명인: 육동석, 양경철
등록번호(등록일): 1010410370000(2011.06.07.)

특허명: 스펙트럼 피크를 이용한 음향 인식 시스템 및 방법과 이에 사용되는 음향 스펙트럼 유사도 측정 방법
발명인: 육동석, 유인철
등록번호(등록일): 1010225160000(2011.03.08.)

특허명: 모음 특징을 이용한 음성구간 검출 시스템 및 방법과 이에 사용되는 음향 스펙트럼 유사도 측정 방법
발명인: 육동석, 유인철
등록번호(등록일): 1010225190000(2011.03.08.)

특허명: 음성 인식을 이용한 음성 시각화 방법 및 장치
발명인: 육동석, 임현택
등록번호(등록일): 1010206570000(2011.03.02.)

특허명: 마이크로폰 및 시공간 정보를 이용한 음원 구간 탐지 시스템, 그 방법 및 이를 기록한 기록매체
발명인: 육동석, 이협우
등록번호(등록일): 1010020280000(2010.12.10.)

특허명: 음성의 음소간 경계 탐색 시스템 및 그 방법
발명인: 육동석, 조선호
출원번호(출원일): 1020090067695(2009.07.24.)

특허명: 음절 단위의 음성 인식 장치, 음절 단위의 음성 인식을 이용한 문자 입력 장치, 그 방법 및 기록 매체
발명인: 김동현, 육동석
등록번호(등록일): 1008481480000(2008.07.17.)

특허명: 음원 위치 추정 방법 및 그 방법에 따른 시스템
발명인: 김현수, 육동석, 조영규, 최우진
출원번호(출원일): 1020080054284(2008.06.10.)

특허명: Unsupervised Incremental Adaptatilon Using Maximum Likelihood Spectral Transformation
발명인: DONGSUK YOOK
등록번호(등록년도): US 6,999,926 B2(2006)