iOS 实时音频采集与播放

1、前言

在iOS中有很多方法可以进行音视频采集。如 AVCaptureDevice, AudioQueue以及Audio Unit。其中 Audio Unit是最底层的接口，它的优点是功能强大，延迟低; 而缺点是学习成本高，难度大。对于一般的iOS应用程序，AVCaptureDevice和AudioQueue完全够用了。但对于音视频直播，最好还是使用 Audio Unit 进行处理，这样可以达到最佳的效果，著名的 WebRTC 就使用的 Audio Unit 做的音频采集与播放。今天我们就重点介绍一下Audio Unit的基本知识和使用。

下图是 Audio Unit在 iOS架构中所处的位置：

2、基本概念

在介绍 Audio Unit 如何使用之前，先要介绍一下Audio Unit的基本概念，这样更有利于我们理解对它的使用。

Audio Unit的种类
Audio Units共可分为四大类，並可细分为七种，可参考下表：
Audo Unit 的内部结构
参考下图，Audio Unit 内部结构分为两大部分，Scope 与Element。其中 scope 又分三种，分別是 input scope, output scope, global scope。而 element 则是 input scope 或 output scope 內的一部分。

Audio Unit 的输入与输出
下图是一个 I/O type 的 Audio Unit，其输入为麦克风，其输出为喇叭。这是一个最简单的Audio Unit使用范例。
The input element is element 1 (mnemonic device: the letter “I” of the word “Input” has an appearance similar to the number 1)
The output element is element 0 (mnemonic device: the letter “O” of the word “Output” has an appearance similar to the number 0)

3、使用流程概要

描述音频元件

kAudioUnitType_Output
kAudioUnitSubType_RemoteIO
kAudioUnitManufacturerApple

使用 AudioComponentFindNext(NULL,
&descriptionOfAudioComponent) 获得 AudioComponent。 AudioComponent有点像生产 Audio Unit 的工厂。
使用 AudioComponentInstanceNew(ourComponent,

&audioUnit) 获得 Audio Unit 实例。

使用 AudioUnitSetProperty函数为录制和回放开启IO。
使用 AudioStreamBasicDescription 结构体描述音频格式，并使用AudioUnitSetProperty进行设置。
使用 AudioUnitSetProperty 设置音频录制与放播的回调函数。
分配缓冲区。
初始化 Audio Unit。
启动 Audio Unit。

C++音视频学习资料免费获取方法：关注音视频开发T哥，点击「链接」即可免费获取2023年最新C++音视频开发进阶独家免费学习大礼包！

4、初始化

初始化看起来像下面这样。我们有一个 AudioComponentInstance 类型的成员变量，它用于存储 Audio Unit。

下面的音频格式用16位表式一个采样。

#define kOutputBus 0#define kInputBus 1// ...OSStatus status;
AudioComponentInstance audioUnit;// 描述音频元件AudioComponentDescription desc;
desc.componentType = kAudioUnitType_Output;
desc.componentSubType = kAudioUnitSubType_RemoteIO;
desc.componentFlags = 0;
desc.componentFlagsMask = 0;
desc.componentManufacturer = kAudioUnitManufacturer_Apple;// 获得一个元件AudioComponent inputComponent = AudioComponentFindNext(NULL, &desc);// 获得 Audio Unitstatus = AudioComponentInstanceNew(inputComponent, &audioUnit);
checkStatus(status);// 为录制打开 IOUInt32 flag = 1;
status = AudioUnitSetProperty(audioUnit, 
                              kAudioOutputUnitProperty_EnableIO, 
                              kAudioUnitScope_Input, 
                              kInputBus,
                              &flag, 
                              sizeof(flag));
checkStatus(status);// 为播放打开 IOstatus = AudioUnitSetProperty(audioUnit, 
                              kAudioOutputUnitProperty_EnableIO, 
                              kAudioUnitScope_Output, 
                              kOutputBus,
                              &flag, 
                              sizeof(flag));
checkStatus(status);// 描述格式audioFormat.mSampleRate         = 44100.00;
audioFormat.mFormatID           = kAudioFormatLinearPCM;
audioFormat.mFormatFlags        = kAudioFormatFlagIsSignedInteger |                                   kAudioFormatFlagIsPacked;
audioFormat.mFramesPerPacket    = 1;
audioFormat.mChannelsPerFrame   = 1;
audioFormat.mBitsPerChannel = 16;
audioFormat.mBytesPerPacket = 2;
audioFormat.mBytesPerFrame      = 2;// 设置格式status = AudioUnitSetProperty(audioUnit, 
                              kAudioUnitProperty_StreamFormat, 
                              kAudioUnitScope_Output, 
                              kInputBus, 
                              &audioFormat, 
                              sizeof(audioFormat));
checkStatus(status);
status = AudioUnitSetProperty(audioUnit, 
                              kAudioUnitProperty_StreamFormat, 
                              kAudioUnitScope_Input, 
                              kOutputBus, 
                              &audioFormat, 
                              sizeof(audioFormat));
checkStatus(status);// 设置数据采集回调函数AURenderCallbackStruct callbackStruct;
callbackStruct.inputProc = recordingCallback;
callbackStruct.inputProcRefCon = self;
status = AudioUnitSetProperty(audioUnit, 
                              kAudioOutputUnitProperty_SetInputCallback, 
                              kAudioUnitScope_Global, 
                              kInputBus, 
                              &callbackStruct, 
                              sizeof(callbackStruct));
checkStatus(status);// 设置声音输出回调函数。当speaker需要数据时就会调用回调函数去获取数据。// 它是 "拉" 数据的概念。callbackStruct.inputProc = playbackCallback;
callbackStruct.inputProcRefCon = self;
status = AudioUnitSetProperty(audioUnit, 
                              kAudioUnitProperty_SetRenderCallback, 
                              kAudioUnitScope_Global, 
                              kOutputBus,
                              &callbackStruct, 
                              sizeof(callbackStruct));
checkStatus(status);// 关闭为录制分配的缓冲区（我们想使用我们自己分配的）flag = 0;
status = AudioUnitSetProperty(audioUnit, 
                            kAudioUnitProperty_ShouldAllocateBuffer,
                            kAudioUnitScope_Output, 
                            kInputBus,
                            &flag, 
                            sizeof(flag));// 初始化status = AudioUnitInitialize(audioUnit);
checkStatus(status);

开启 Audio Unit

OSStatus status = AudioOutputUnitStart(audioUnit);
checkStatus(status);

关闭 Audio Unit

OSStatus status = AudioOutputUnitStop(audioUnit);
checkStatus(status);

结束 Audio Unit

AudioComponentInstanceDispose(audioUnit);

5、录制回调

static OSStatus recordingCallback(void *inRefCon, 
                                  AudioUnitRenderActionFlags *ioActionFlags, 
                                  const AudioTimeStamp *inTimeStamp, 
                                  UInt32 inBusNumber, 
                                  UInt32 inNumberFrames, 
                                  AudioBufferList *ioData) {    // TODO:
    // 使用 inNumberFrames 计算有多少数据是有效的
    // 在 AudioBufferList 里存放着更多的有效空间

    AudioBufferList *bufferList; //bufferList里存放着一堆 buffers,                                  //buffers的长度是动态的。  

    // 获得录制的采样数据

    OSStatus status;

    status = AudioUnitRender([audioInterface audioUnit], 
                             ioActionFlags, 
                             inTimeStamp, 
                             inBusNumber, 
                             inNumberFrames, 
                             bufferList);
    checkStatus(status);    // 现在，我们想要的采样数据已经在                            // bufferList中的buffers中了。
    DoStuffWithTheRecordedAudio(bufferList);    return noErr;
}

6、播放回调

static OSStatus playbackCallback(void *inRefCon, 
                            AudioUnitRenderActionFlags *ioActionFlags, 
                            const AudioTimeStamp *inTimeStamp, 
                            UInt32 inBusNumber, 
                            UInt32 inNumberFrames, 
                            AudioBufferList *ioData) {    
    // Notes: ioData 包括了一堆 buffers 
    // 尽可能多的向ioData中填充数据，记得设置每个buffer的大小要与buffer匹配好。
    return noErr;
}

7、结束

Audio Unit可以做很多非常棒的的工作。如混音，音频特效，录制等等。它处于 iOS 开发架构的底层，特别合适于音视频直播这种场景中使用。

我们今天介绍的只是 Audio Unit众多功能中的一小点知识，但这一点点知识对于我来说已经够用了。对于那些想了解更多Audio Unit的人，只好自行去google了。

“知识无穷尽，只取我所需”。这就是我的思想，哈！

原文链接：iOS 实时音频采集与播放

展开阅读全文

页面更新：2024-03-05

标签：音频缓冲区下图初始化架构函数元件实时分配知识数据

1 2 3 4 5

iOS 实时音频采集与播放

1、前言

2、基本概念

3、使用流程概要

4、初始化

5、录制回调

6、播放回调

7、结束

科技在线创新有我︱FAST首席科学家李菂：“基础研究是好奇心驱动的”

ACS NANO: 用于高电流密度水氧化的稳健高效电催化剂的超快燃烧合成

阿里一面：说一说Java、Spring、Dubbo三者SPI机制的原理和区别

微软更新WinUI 3 Gallery 帮助开发者创建漂亮的Windows应用

武汉小安科技完成C轮融资，蚂蚁集团战略入股

HTML+CSS小案例之HTML结构布局

SK海力士公告第8代3D NAND：堆叠层数超过300层

无需采血，时刻掌握您的血糖变化趋势，dido G28S智能健康手表体验

ai绘画工具哪最好用

码农末日？与openai合作的Cursor实现自动编程

3000余个传感器，普陀的TA集“数智”场景应用之大成！

福建电信建成全国首个省级天通卫星电话应急管理平台

大内存和大存储全都要，2K预算买手机怎么能鱼和熊掌兼得？

截至去年12月，中国短视频用户规模达10.12亿-今天你“刷”短视频了吗？

虚拟数字人爆发！GPT 杀手级应用，龙头全梳理

恢复出厂设置，并非彻底清除手机数据！3·15提示清理旧手

为什么浓眉带队能力这么不行？用数据说话，数据告诉你

实现缓存和数据库一致性方案实战：mysql+canal+rabbitmq

搭建数据底座，打造新泰外贸新场景

Python定义匿名函数，以及如何捕获变量值？

2022年中国数据库研究报告

3个汤圆=1碗饭？关于汤圆的这些知识你了解吗？

发挥大数据产业乘数效应

网卡发送数据流程

基于 Doris 构建实时统一的现代数据分析平台