SDL開發筆記（二）：音頻基礎介紹、使用SDL播放音頻

時間 2020-10-02 標籤 sdl 開發筆記二音頻基礎介紹使用 sdl 播放音頻

若該文爲原創文章，未經容許不得轉載
原博主博客地址：https://blog.csdn.net/qq21497936
原博主博客導航：http://www.noobyard.com/article/p-gebpnuxb-mo.html
本文章博客地址：http://www.noobyard.com/article/p-rzssdsnn-mo.html
紅胖子(紅模仿)的博文大全：開發技術集合（包含Qt實用技術、樹莓派、三維、OpenCV、OpenGL、ffmpeg、OSG、單片機、軟硬結合等等）持續更新中…（點擊傳送門）web

Qt開發專欄：三方庫開發技術（點擊傳送門）

上一篇：《SDL開發筆記（一）：SDL介紹、編譯使用以及工程模板》
下一篇：《SDL開發筆記（三）：使用SDL渲染窗口顏色和圖片》緩存

前言

對於Qt應用來講，爲了更大的跨平臺通用性，使用SDL播放音頻，同時也能作更多的擴充操做。安全

聲波

聲音是經過空氣傳播的一種連續的波，簡稱聲波。聲音的強弱體如今聲波壓力的大小上，音調的音調體如今聲音的頻率上。
聲音信號由兩個基本參數是頻率和復讀。信號的頻率指的是信號每秒變化的次數，用Hz表示。
頻率範圍爲20Hz ~ 20Khz的信號成爲音頻信號。該範圍內的音頻聲音幅度在0~120dB之間，可被人感知到。
聲音轉換爲數字信號，則成爲音頻信號。svg

音頻信號

音頻信號（acoustic signals）是帶有語音、音樂和音效的有規律的聲波的頻率、幅度變化信息載體。根據聲波的特徵，可把音頻信息分類爲規則音頻和不規則聲音。其中規則音頻又能夠分爲語音、音樂和音效。規則音頻是一種連續變化的模擬信號，可用一條連續的曲線來表示，稱爲聲波。
聲音的三個要素是音調、音強和音色。聲波或正弦波有三個重要參數：頻率 ω0、幅度An和相位ψn ，這也就決定了音頻信號的特徵。
對音頻信號進行採樣，模擬信號數字化後，就是數字音頻信號了。函數

數字音頻信號

數字音頻計算機數據的存儲是以0、1的形式存取的，那麼數字音頻就是首先將音頻文件轉化，接着再將這些電平信號轉化成二進制數據保存，播放的時候就把這些數據轉換爲模擬的電平信號再送到喇叭播出，數字聲音和通常磁帶、廣播、電視中的聲音就存儲播放方式而言有着本質區別。相比而言，它具備存儲方便、存儲成本低廉、存儲和傳輸的過程當中沒有聲音的失真、編輯和處理很是方便等特色。
數字音頻信號，就是咱們最終處理的音頻數據。
音頻數字信號信號具有幾個特徵：測試

量化級

簡單地說就是描述聲音波形的數據是多少位的二進制數據，一般用bit作單位，如16bit、24bit。16bit量化級記錄聲音的數據是用16位的二進制數，所以，量化級也是數字聲音質量的重要指標。咱們形容數字聲音的質量，一般就描述爲24bit（量化級）、48KHz採樣，好比標準CD音樂的質量就是16bit、44.1KHz採樣。ui

聲道

能夠簡單的理解爲經過一個振膜採樣到的音頻數據就是一個聲道，兩個振膜就是兩個聲道，以此類推。振膜通常有大、中、小三種尺寸，尺寸越大，對聲波越敏感，成本也越高。一個麥克風裏面有的有一個振膜，有的有兩個振膜。一個振膜的麥克風進行的是Mono單聲道錄音，兩個振膜的麥克風進行的是Stereo雙聲道立體聲錄音。五聲道環繞立體聲錄音就是麥克風1錄取東北方向的聲音，麥克風2錄取西北方向的聲音，麥克風3錄取西南方向的聲音，麥克風4錄取東南方向的聲音，麥克風5錄取正前方的聲音。另外還有四聲道環繞立體聲錄音和七聲道環繞立體聲錄音。.net

採樣率

簡單地說就是經過波形採樣的方法記錄1秒鐘長度的聲音，須要多少個數據。44KHz採樣率的聲音就是要花費44000個數據來描述1秒鐘的聲音波形。原則上採樣率越高，聲音的質量越好。線程

比特率

按鍵渲染顏色一種數字音樂壓縮效率的參考性指標，表示記錄音頻數據每秒鐘所須要的平均比特值（比特是電腦中最小的數據單位，指一個0或者1的數），一般咱們使用Kbps(通俗地講就是每秒鐘1024比特)做爲單位。CD中的數字音樂比特率爲1411.2Kbps（也就是記錄1秒鐘的CD音樂，須要1411.2×1024比特的數據），近乎於CD音質的MP3數字音樂須要的比特率大約是112Kbps～128Kbps。指針

壓縮率

一般指音樂文件壓縮前和壓縮後大小的比值，用來簡單描述數字聲音的壓縮效率。

SDL音頻播放流程解析

基本流程以下：

步驟一：初始化子系統

初始化音頻系統，其餘多餘的系統不用初始化。

步驟二：根據音頻信息打開音頻設備

填充好SDL_AudioSpec音頻信息，打開音頻設備，此時會返回最接近的音頻設備，若沒有接近的則第二個參數返回0，此時咱們直接第二個參數如0，無需返回。

步驟三：開始播放

使用SDL_PauseAudio(0)進行播放。

步驟四：循環補充數據

根據緩衝區數據長度和文件剩餘的數據長度進行補充，若緩衝區數據沒了，就補充一次，使用SDL_Delay進行1ms的延遲，用當前緩存區剩餘未播放的長度大於0結合前面的延遲進行等待。

步驟四（附加）：回調函數

開始播放後，會有音頻其餘子線程來調用回調函數，進行音頻數據的補充，通過測試每次補充4096個字節。

步驟五：關閉音頻設別

步驟六：退出SDL系統

SDL播放音頻相關變量

struct SDL_AudioSpec

SDL_AudioSpec是包含音頻輸出格式的結構體，同時它也包含當音頻設備須要更多數據時調用的回調函數，此結構體是關鍵。

typedef struct SDL_AudioSpec
{
    int freq;                   // DSP頻率—每秒採樣數
    SDL_AudioFormat format;     // 音頻數據格式
    Uint8 channels;             // 通道數1-單聲道，2-立體聲
    Uint8 silence;              // 音頻緩衝靜音值（計算）
    Uint16 samples;             // 基本是5十二、1024設置不合適可能會致使卡頓’
    Uint16 padding;             // 對於某些編譯環境是必需的
    Uint32 size;                // 音頻緩衝區大小（字節）（計算）
    SDL_AudioCallback callback; // 爲音頻設備提供數據回調(空值使用SDL 自身預先定義的SDL_QueueAudio ()回調函數)
    void *userdata;             // 傳遞給回調的Userdata（對於空回調忽略）
} SDL_AudioSpec;

舉例：播放pcm音頻「匆匆那年-44100-16位-雙通道.pcm」

// 音頻結構體設置
SDL_AudioSpec sdlAudioSpec;
sdlAudioSpec.freq = 44100;
sdlAudioSpec.format = AUDIO_S16SYS;
sdlAudioSpec.channels = 1;
sdlAudioSpec.silence = 0;
sdlAudioSpec.samples = 1024;
sdlAudioSpec.callback = callBack_fillAudioData;
sdlAudioSpec.userdata = 0;

SDL播放音頻相關原型

SDL_Init()

int SDLCALL SDL_Init(Uint32 flags);

使用此函數初始化SDL庫，必須在使用大多數其餘SDL函數以前調用它，初始化的時候儘可能作到「夠用就好」，而不要用SDL_INIT_EVERYTHING。會出現一些不可預知的問題。

參數一：輸入初始化的設備

SDL_OpenAudio()

int SDL_OpenAudio(SDL_AudioSpec * desired,
                  SDL_AudioSpec * obtained);

此函數使用所需參數打開音頻設備，而後若是成功，則返回0，將實際硬件參數放入已得到指向的結構。若是得到的爲空，則音頻傳遞給回調函數的數據將被保證在請求的格式，並將自動轉換爲硬件音頻格式（若有必要）。若是失敗，此函數返回-1，則沒法打開音頻設備，或沒法設置音頻線程。

參數一：輸入須要打開的音頻設備參數；
參數二：返回打開成功的音頻設備參數；

SDL_PauseAudio()

extern DECLSPEC void SDLCALL SDL_PauseAudio(int pause_on);

暫停音頻功能。函數暫停和取消暫停音頻回調處理。
打開音頻後，應使用參數0調用它們開始播放聲音的設備。這樣就能夠在打開音頻設備後安全地初始化回調函數的數據。
暫停期間，靜音將寫入音頻設備。

SDL_MixAudio：混音播放函數

void SDL_MixAudio(Uint8 * dst,
                 const Uint8 * src,
                 Uint32 len,
                 int volume);

這須要播放音頻格式和混音的兩個音頻緩衝區它們執行加法、音量調節和溢出剪輯。音量的範圍從0到128，應設置爲SDL_MIX_MAXVOLUME全音頻音量。注意這不會改變硬件的音量。
這是爲了方便起見，能夠混合音頻數據。

參數一：目標數據，這個是回調函數裏面的stream指針指向的，直接使用回調的stream指針便可。
參數二：音頻數據，這個是將須要播放的音頻數據混到stream裏面去，那麼這裏就是咱們須要填充的播放的數據。
參數三：音頻數據的長度，這個是咱們填充過去的長度。
參數四：音量，0~128範圍，SAL_MIX_MAXVOLUME爲128，設置的是軟音量，不是硬件的音響。

SDL_Delay()

void SDL_Delay(Uint32 ms);

在返回以前等待指定的毫秒數。

SDL_Quit()

void SDLCALL SDL_Quit(void);

此函數用於清除全部初始化的子系統。在全部退出條件後調用它。

本文章博客地址：http://www.noobyard.com/article/p-rzssdsnn-mo.html

Demo源碼

void SDLManager::testPlayPCM()
{
    int ret = 0;
    // 音頻結構體
    SDL_AudioSpec sdlAudioSpec;
//    sdlAudioSpec.freq = 44100;
    sdlAudioSpec.freq = 22050;
//    sdlAudioSpec.format = AUDIO_U8; // x
//    sdlAudioSpec.format = AUDIO_S8; // x
//    sdlAudioSpec.format = AUDIO_U16LSB; // x
//    sdlAudioSpec.format = AUDIO_S16LSB; // √
//    sdlAudioSpec.format = AUDIO_U16MSB; // x
//    sdlAudioSpec.format = AUDIO_U16LSB; // x
//    sdlAudioSpec.format = AUDIO_S16MSB; // x
//    sdlAudioSpec.format = AUDIO_U16; // x
    sdlAudioSpec.format = AUDIO_S16; // √
//    sdlAudioSpec.format = AUDIO_S16SYS; // x
//    sdlAudioSpec.format = AUDIO_S32SYS; // x
//    sdlAudioSpec.format = AUDIO_F32SYS; // x
//    sdlAudioSpec.format = AUDIO_F32MSB; // x
    sdlAudioSpec.channels = 1;
    sdlAudioSpec.silence = 0;
    sdlAudioSpec.samples = 1024;    // 致使錯誤512~1024之間
    sdlAudioSpec.callback = callBack_fillAudioData;
    sdlAudioSpec.userdata = 0;

    QString fileName;

#if 0
    fileName = "testPCM/王妃-22050-16位-單通道.pcm";
    sdlAudioSpec.freq = 22050;
    sdlAudioSpec.channels = 1;
    sdlAudioSpec.format = AUDIO_S16;
#endif
#if 1
    fileName = "testPCM/匆匆那年-44100-16位-雙通道.pcm";
    sdlAudioSpec.freq = 44100;
    sdlAudioSpec.channels = 2;
    sdlAudioSpec.format = AUDIO_S16;
#endif
#if 0
    fileName = "testPCM/北京北京8k16bits單聲道.pcm";
    sdlAudioSpec.freq = 8000;
    sdlAudioSpec.channels = 1;
    sdlAudioSpec.format = AUDIO_S16;
#endif
#if 0
    fileName = "testPCM/冰雨片斷48k16bit單聲道.pcm";
    sdlAudioSpec.freq = 48000;
    sdlAudioSpec.channels = 1;
    sdlAudioSpec.format = AUDIO_S16;
#endif
#if 0
    fileName = "testPCM/浪花一朵朵片斷48k16bit單聲道.pcm";
    sdlAudioSpec.freq = 48000;
    sdlAudioSpec.channels = 1;
    sdlAudioSpec.format = AUDIO_S16;
#endif

    QFile file(fileName);
    if(!file.open(QIODevice::ReadOnly))
    {
        LOG << "Failed" << file.exists();
        return;
    }


    // 步驟一：初始化音頻子系統
    ret = SDL_Init(SDL_INIT_AUDIO);
    if(ret)
    {
        LOG << "Failed";
        return;
    }

    // 步驟二：打開音頻設備
    ret = SDL_OpenAudio(&sdlAudioSpec, 0);
    if(ret)
    {
        LOG << "Failed";
        return;
    }

    // 步驟三：開始播放
    SDL_PauseAudio(0);

#if 1
    // 步驟四：一次性讀取全部的數據
    QByteArray data = file.readAll();
    int pos = 0;
    _audioPos = (uint8_t *)data.data();
    _audioLen = data.size();
    pos += data.size();
    while(_audioLen > 0)
    {
        SDL_Delay(1);
    }
#else
    // 步驟四：一次性讀取4096
    int readSize = 4096;
    while(true)
    {
        _audioPos = (uint8_t *)file.read(readSize).data();
        _audioLen = readSize;
        while(_audioLen > 0)
        {
            SDL_Delay(1);
        }
    }
#endif
    // 步驟：播放完畢
    SDL_CloseAudio();

    // 步驟：釋放SDL
    SDL_Quit();


    if(file.isOpen())
    {
        file.close();
        return;
    }
}

void SDLManager::callBack_fillAudioData(void *userdata, uint8_t *stream, int len)
{
    SDL_memset(stream, 0, len);
    if(_audioLen == 0)
    {
        return;
    }
    len = (len > _audioLen ? _audioLen : len);

    SDL_MixAudio(stream, _audioPos, len, SDL_MIX_MAXVOLUME);

    _audioPos += len;
    _audioLen -= len;

    // 每次加載4096
    LOG << len;
}

工程模板：對應版本號v1.1.0

對應版本號v1.1.0：播放裸PCM數據。

上一篇：《SDL開發筆記（一）：SDL介紹、編譯使用以及工程模板》
下一篇：《SDL開發筆記（三）：使用SDL渲染窗口顏色和圖片》

原博主博客地址：https://blog.csdn.net/qq21497936
原博主博客導航：http://www.noobyard.com/article/p-gebpnuxb-mo.html
本文章博客地址：http://www.noobyard.com/article/p-rzssdsnn-mo.html