본문 바로가기
IT

딥러닝과 오디오 분석

by mimmic 2021. 5. 17.

1. 목표

본 딥 러닝 튜토리얼에서는 딥 러닝을 이용한 오디오 분석을 공부한다. 또한 오디오 처리 응용 프로그램을 사용하여 오디오 도메인에서 데이터 처리를 학습합니다. 우리는 오디오 데이터 분석을 더 잘 이해하기 위해 그래프를 사용할 것이다.

딥 러닝을 이용한 오디오 분석

2. 오디오 분석 소개

우리가 항상 오디오와 접촉하고 있기 때문에. 때로는 직접적이거나 간접적이기도 하다. 우리의 뇌가 지속적으로 작용하기 때문에. 그러므로, 두뇌는 정보를 처리하고 이해한다. 마지막으로 환경에 대한 정보를 제공합니다. 때때로 우리는 우리 주위에 떠 있는 이 오디오를 잡고 뭔가 건설적인 것을 느낍니다. 이런 소리들을 잡는데 도움이 되는 장치들이 있기 때문이다. 또한 컴퓨터를 읽을 수 있는 형식으로 나타냅니다.

  • 파형(파형 오디오 파일) 형식
  • MP3(MPEG-1 오디오 계층 3) 형식
  • WMA(Windows Media 오디오) 형식

오디오 분석 - 오디오 형식 오디오에 대해 점점 더 많이 생각한다면, 마지막으로, 오디오가 파동과 같은 형식의 데이터라는 결론이 하나 있다. 이것은 다음과 같이 그림으로 나타낼 수 있다. CNN을 통해 딥 러닝을 위한 전이 학습을 수정해 보겠습니다.

3. 오디오 영역의 데이터 처리

현재 구조화되지 않은 데이터 형식이 있습니다. 이 오디오 데이터의 경우 에는 몇 가지 사전 처리 단계가 있습니다. 오디오 분석을 위해 발표되기 전에 따라야 할 사항입니다. 먼저 우리는 데이터를 기계적으로 이해할 수 있는 형식으로 로드해야 한다. 이를 위해, 우리는 모든 특정 시간 단계 후에 값을 취하기만 하면 됩니다. 예를 들어 - 2초 오디오 파일에서 0.5초 내에 값을 추출합니다. 이를 오디오 데이터의 샘플링이라고 하며 샘플링 속도를 샘플링 속도라고 합니다.

오디오 분석 - 예제 다른 방법으로 표시할 수 있습니다. 데이터를 다른 도메인, 즉 주파수 도메인으로 변환할 수 있습니다. 오디오 데이터를 샘플링할 때 전체 데이터를 나타내려면 훨씬 더 많은 데이터 포인트가 필요합니다. 또한 샘플링 속도는 가능한 한 높아야 합니다. 그래서 우리가 오디오 데이터를 주파수 영역에서 표현한다면. 그러면 훨씬 적은 계산 공간이 필요합니다. 직관을 얻으려면 아래 이미지를 보십시오.

오디오 분석 - 오디오 특징 여기서는 하나의 오디오 신호를 주파수 영역에서 세 개의 고유한 값으로 쉽게 나타낼 수 있는 세 개의 다른 순수 신호로 분리해야 합니다. 또한, 현재 우리가 오디오 데이터와 오디오 분석을 표현할 수 있는 몇 가지 방법이 더 있다. 예를 들어 MFC를 사용해서. 이러한 방법은 데이터를 표현하는 다른 방법에 불과합니다. 또한, 우리는 이 오디오 표현에서 특징을 추출해야 한다. 이 알고리즘은 이러한 기능에서 작동하며 설계된 작업을 수행합니다. 다음은 추출할 수 있는 오디오 기능의 범주에 대한 시각적 표현입니다. 추출한 후에는 추가 분석을 위해 기계 학습 모델로 보내야 합니다.

4. 오디오 처리의 응용 프로그램

  • 오디오 기능에 따라 음악 컬렉션을 인덱싱 합니다.
  • 라디오 채널 음악 추천
  • 오디오 파일에 대한 유사성 검색(일명 Shazam)
  • 음성 처리 및 합성 - 대화 에이전트를 위한 인공 음성 생성

5. 결론

결과적으로, 우리는 오디오 처리 응용 프로그램이 있는 오디오 영역에서 오디오 분석과 데이터 처리를 연구했다. 또한 오디오 데이터를 더 잘 이해하는 데 도움이 되는 그래프를 사용했습니다.

'IT' 카테고리의 다른 글

SVM(지원 벡터 머신)의 사례  (0) 2021.05.17
Python에서 SVM을 구현하는 방법  (0) 2021.05.17
20개의 딥러닝 용어  (0) 2021.05.17
머신러닝과 기업 경영지침  (0) 2021.05.17
금융분야의 머신러닝  (0) 2021.05.16

댓글