从RunTime源码回看autoreleasepool

it2022-05-05  163

文章目录

关于我的仓库前言准备工作最熟悉的陌生人:@autoreleasepool补充知识:RunLoop概念clang编译 AutoreleasePoolPagefind it!数据结构 pushvoid *push()哨兵对象POOL_BOUNDARY详解autoreleaseFastautoreleaseNoPageautoreleaseFullPage poptoken详解releaseUntil卑微工程师 kill()kill()的调用 完整流程2019.8.10 更新:token的来源败者食尘

关于我的仓库

这篇文章是我为面试准备的iOS基础知识学习中的一篇我将准备面试中找到的所有学习资料,写的Demo,写的博客都放在了这个仓库里iOS-Engineer-Interview欢迎star??其中的博客在简书,都有发布博客中提到的相关的代码Demo可以在仓库里相应的文件夹里找到

前言

autoreleasepool中就涉及了autorelease,应该是内存管理中比较难理解的一个方法本文将分析其中的源码,理解pool中的存储数据结构,release时机等问题

准备工作

请准备好750.1版本的objc4源码一份【目前最新的版本】,打开它,找到文章中提到的方法,类型,对象一切请以手中源码为准,不要轻信任何人,任何文章,包括本篇博客文章中的源码都请过了我的删改,建议还是先看看源码源码建议从Apple官方开源网站获取obj4官网上下载下来需要自己配置才能编译运行,如果不想配置,可以在RuntimeSourceCode中clone

最熟悉的陌生人:@autoreleasepool

我们每次编写iOS程序都会有main.m文件,但我们从来没有操作过其中的代码里面的@autoreleasepool我们已经知道是代替了MRC中的autorelease操作,那么到底是怎么实现的呢?

补充知识:RunLoop概念

虽说不深入RunLoop,大概概念还是提一下在编写C语言程序的时候,我们执行完主函数就会return 0,程序就跑完了但是作为一个iOS应用,明显是不应该有"跑完"这回事的,我们就可以将RunLoop视作一个不停跑的死循环放到主函数的问题,其实iOS里的主函数从来不会真正的return哦

clang编译

新建iOS项目,通过clang -rewrite-objc main.m指令得到mian.cpp

搜索UIApplicationMain

int main(int argc, char * argv[]) { /* @autoreleasepool */ { __AtAutoreleasePool __autoreleasepool; return UIApplicationMain(argc, argv, __null, NSStringFromClass(((Class (*)(id, SEL))(void *)objc_msgSend)((id)objc_getClass("AppDelegate"), sel_registerName("class")))); } } //__AtAutoreleasePool结构体就是__autoreleasepool的本质 //查看__AtAutoreleasePool struct __AtAutoreleasePool { __AtAutoreleasePool() {atautoreleasepoolobj = objc_autoreleasePoolPush();} ~__AtAutoreleasePool() {objc_autoreleasePoolPop(atautoreleasepoolobj);} void * atautoreleasepoolobj; }; 就如《高级编程》上的一样,这里主要操作就是一个push,一个pop下面首先来看下相关的数据结构

AutoreleasePoolPage

find it!

打开runtime源码工程,搜索objc_autoreleasePoolPush,再点进AutoreleasePoolPagepush以及pop都是AutoreleasePoolPage这个类的方法

数据结构

static size_t const SIZE = PAGE_MAX_SIZE; //定义内存大小 4096 magic_t const magic; // 16字节 id *next; // 8字节 pthread_t const thread; // 8字节 当前pool所处的线程 // 前一个节点 AutoreleasePoolPage * const parent; // 8字节 // 后一个节点 AutoreleasePoolPage *child; // 8字节 uint32_t const depth; // 4字节 page的深度,首次为0,以后每次初始化一个page都加1。 uint32_t hiwat; // 4字节 这个字段是high water的缩写,这个字段用来计算pool中最多存放的对象个数。在每次执行pop()的时候,会更新一下这个字段。 //剩余的内存就是储存注册到pool里的对象地址 一个AutoreleasePoolPage占据4096个字节,扣除56个字节存储上面的信息外,其余的都用来存储加入到page中的对象地址

根据parent以及child,看出该栈的实现方式是双向链表

关于pool与page的关系我花了一个大致的草图

了解完数据结构我们开始着重分析push与pop的实现

push

void *push()

// push方法 static inline void *push() { id *dest; if (DebugPoolAllocation) { // 区别调试模式 dest = autoreleaseNewPage(POOL_BOUNDARY); // POOL_BOUNDARY就是nil } else { dest = autoreleaseFast(POOL_BOUNDARY); //POOL_BOUNDARY就是nil } return dest; } 其中以Debug 开头的说明是调试模式的内容,会统统忽略先来研究下这个POOL_BOUNDARY是起什么作用的

哨兵对象POOL_BOUNDARY详解

POOL_BOUNDARY直译过来就是POOL的边界首先这个POOL_BOUNDARY就是nil,它的作用是隔开page中的对象假如我们执行了以下代码 push(A, B, C) push2(D, E, F) push3(G, H, I) pop1 //pop了G, H, I pop2 //pop了D, E, F pop3 //pop了A, B, C 也就是说我们pop的时候被pop的最近一次push进来的对象但是并不是每次push与pop之间存进的对象都刚好占满一个page,可能会不满,可能会超过因此这个POOL_BOUNDARY帮助我们分隔每个@autoreleasepool块之间的对象【这也是叫POOL_BOUNDARY的原因】我们看一张图,将其中的POOl_SENTINEL改成POOL_BOUNDARY

会看上面push的代码,其中其实就是调用了autoreleaseFast(POOL_BOUNDARY)此外请注意,push操作是不带参数的,等于就是初始化的时候调用一次,真正压入对象的方法是 static inline id autorelease(id obj) { assert(obj); assert(!obj->isTaggedPointer()); id *dest __unused = autoreleaseFast(obj); assert(!dest || dest == EMPTY_POOL_PLACEHOLDER || *dest == obj); return obj; } 也就是说push调用的autoreleaseFast参数只有POOL_BOUNDARY,请记住

autoreleaseFast

static inline id *autoreleaseFast(id obj) { // hotPage就是当前正在使用的AutoreleasePoolPage //即获取当前在使用的page AutoreleasePoolPage *page = hotPage(); if (page && !page->full()) { // 有hotPage且hotPage不满,将对象添加到hotPage中 return page->add(obj); } else if (page) { // 有hotPage但是hotPage已满 // 使用autoreleaseFullPage初始化一个新页,并将对象添加到新的AutoreleasePoolPage中 return autoreleaseFullPage(obj, page); } else { // 无hotPage // 使用autoreleaseNoPage创建一个hotPage,并将对象添加到新创建的page中 return autoreleaseNoPage(obj); } } 模拟第一次push,无hotPage,看autoreleaseNoPage

autoreleaseNoPage

id *autoreleaseNoPage(id obj) { bool pushExtraBoundary = false; AutoreleasePoolPage *page = new AutoreleasePoolPage(nil); // 将初始化的AutoreleasePoolPage设置成hotPage setHotPage(page); // Push the requested object or pool. // 将对象添加到AutoreleasePoolPage中 return page->add(obj); } 简化完就是创建一个page,设置为HotPage将obj添加到其中

autoreleaseFullPage

id *autoreleaseFullPage(id obj, AutoreleasePoolPage *page) { do { // 如果page->child不为空,那么使用page->child if (page->child) page = page->child; // 否则的话,初始化一个新的AutoreleasePoolPage else page = new AutoreleasePoolPage(page); } while (page->full()); // 将找到的合适的page设置成hotPage setHotPage(page); // 将对象添加到hotPage中 return page->add(obj); } 如果page有child,就使用它来存放如果没有,和上面一样,新建一个来存放

pop

static inline void pop(void *token) { AutoreleasePoolPage *page; id *stop; page = pageForPointer(token); stop = (id *)token; page->releaseUntil(stop); // memory: delete empty children if (DebugPoolAllocation && page->empty()) { } else if (page->child) { if (page->lessThanHalfFull()) { page->child->kill(); } else if (page->child->child) { page->child->child->kill(); } } }

token详解

先来看下Apple在Autorelease pool implementation中写的注释 /*********************************************************************** 自动释放池实现 一个线程的自动释放池是一个指针堆栈。 每个指针要么指向要被释放的对象,要么是POOL_BOUNDARY说明一个pool的边界 token是指向该pool的POOL_BOUNDARY的指针。什么时候池被pop,所有比哨兵hotter的物体都被释放。 pool被分成一个双向指针构成的pages。pages在必要的时候被添加和删除 线程本地存储指针指向hot page,在这里新被autoreleased的objects被存储 Autorelease pool implementation A thread's autorelease pool is a stack of pointers. Each pointer is either an object to release, or POOL_BOUNDARY which is an autorelease pool boundary. A pool token is a pointer to the POOL_BOUNDARY for that pool. When the pool is popped, every object hotter than the sentinel is released. The stack is divided into a doubly-linked list of pages. Pages are added and deleted as necessary. Thread-local storage points to the hot page, where newly autoreleased objects are stored. **********************************************************************/ 这里就讲清楚了toekn本质就是指向POOL_BOUNDARY的指针,存储着每次push时插入的POOL_BOUNDARY的地址请注意,只有第一次push的时候会在page中插入一个POOL_BOUNDARY【或者是中间page刚好满了,要使用新的page了】,并不是page的开头都一定是POOL_BOUNDARY具体是怎么做到的,请注意下push方法返回的dest,一直查看下他的来源,你会有收获的

releaseUntil

这个方法顾名思义,就是将对象一直release,一直到stop【token】 void releaseUntil(id *stop) { // 释放AutoreleasePoolPage中的对象,直到next指向stop while (this->next != stop) { // Restart from hotPage() every time, in case -release // autoreleased more objects // hotPage可以理解为当前正在使用的page AutoreleasePoolPage *page = hotPage(); // fixme I think this `while` can be `if`, but I can't prove it //卑微工程师 while (page->empty()) { page = page->parent; setHotPage(page); } page->unprotect(); // obj = page->next; page->next--; id obj = *--page->next; memset((void*)page->next, SCRIBBLE, sizeof(*page->next)); page->protect(); // POOL_BOUNDARY为nil,是哨兵对象 if (obj != POOL_BOUNDARY) { // 释放obj对象 objc_release(obj); //一直是放到结束 } } // 重新设置hotPage setHotPage(this); }

卑微工程师

这里有不知道哪年的Apple开发人员留下的一句注释// fixme I think this while can be if, but I can’t prove it我非常赞同他的观点,但也忍不住有些悲哀所谓程序员的悲哀,大概就是想改个if都做不到吧。

kill()

releaseUntil把page里的对象进行了释放,但是page本身也会占据很多空间,要通过kill()来处理 // 删除双向链表中的每一个page void kill() { // Not recursive: we don't want to blow out the stack // if a thread accumulates a stupendous amount of garbage AutoreleasePoolPage *page = this; // 找到链表最末尾的page while (page->child) page = page->child; AutoreleasePoolPage *deathptr; // 循环删除每一个page do { deathptr = page; page = page->parent; if (page) { page->unprotect(); page->child = nil; page->protect(); } delete deathptr; } while (deathptr != this); } 具体实现不是很重要,我们关注下kill的调用情况

kill()的调用

if (page->lessThanHalfFull()) { page->child->kill(); } else if (page->child->child) { page->child->child->kill(); } 如果当前page小于一半满,则把当前页的所有孩子都杀掉,否则,留下一个孩子,从孙子开始杀。为什么呢?Apple假设,当前page一半都没满,说明已经够了,把接下来的全kill,如果超过一半,就认为下一页还有存在的必要,所以从孙子开始杀这样子我认为是为了节约创建page操作

完整流程

2019.8.10 更新:token的来源

在pop里面,token等同于是被传进来的参数,而是在哪里调用到这两个方法,将push返回的token传入的呢?如果我们一直查看push方法的callers,最后会找到两个来源,一个是load_images方法,这是程序编译前的加载方法,显然不是我们的目标;而另一个源头就到_objc_autoreleasePoolPush方法,那么是在哪里被调用的呢?

败者食尘

int main(int argc, char * argv[]) { /* @autoreleasepool */ { __AtAutoreleasePool __autoreleasepool; return UIApplicationMain(argc, argv, __null, NSStringFromClass(((Class (*)(id, SEL))(void *)objc_msgSend)((id)objc_getClass("AppDelegate"), sel_registerName("class")))); } } //__AtAutoreleasePool结构体就是__autoreleasepool的本质 //查看__AtAutoreleasePool struct __AtAutoreleasePool { __AtAutoreleasePool() {atautoreleasepoolobj = objc_autoreleasePoolPush();} ~__AtAutoreleasePool() {objc_autoreleasePoolPop(atautoreleasepoolobj);} void * atautoreleasepoolobj; }; 在我们的@autorelease{}里面这是一个结构体,用到了C++中名为构造函数 & 析构函数的技术类的构造函数是类的一种特殊的成员函数,它会在每次创建类的新对象时执行。构造函数的名称与类的名称是完全相同的,并且不会返回任何类型,也不会返回 void。构造函数可用于为某些成员变量设置初始值。类的析构函数是类的一种特殊的成员函数,它会在每次删除所创建的对象时执行。析构函数的名称与类的名称是完全相同的,只是在前面加了个波浪号(~)作为前缀,它不会返回任何值,也不能带有任何参数。析构函数有助于在跳出程序(比如关闭文件、释放内存等)前释放资源。在这里,调用了push与pop,将push返回的值传入了pop

最新回复(0)