파형에서 스펙트로그램으로:
오디오 데이터의 구조 이해파형으로서의 오디오샘플링 주파수와 나이퀴스트 정리진폭, 비트 심도 및 양자화주파수 영역과 푸리에 변환스펙트로그램과 단시간 푸리에 변환멜 스펙트로그램과 지각적 스케일링위상, 재구성 및 보코더다양한 응용 분야의 오디오 모델링오디오를 위한 트랜스포머 아키텍처:
지각에서 기초 지능으로음성 트랜스포머의 부상: Whisper의 영향오디오 파운데이션 모델: 이해,
생성, 대화의 통합Qwen2-AudioKimi-Audio를 활용한 회의 녹취오디오 내 모든 요소 분할텍스트와 음성을 넘어: 음악 작곡가로서의 트랜스포머결론