找回密码
 立即注册
查看: 338|回复: 3

lua内存泄漏检测工具原理及设计

[复制链接]
发表于 2021-11-18 16:24 | 显示全部楼层 |阅读模式
Google一下“lua内存泄漏检测”,基本都是直接或间接指向云风多年前写的《一个 Lua 内存泄露检查工具》,其思路是给虚拟机做个快照,记录下所有gc对象地址及引用关系,然后通过对比两次快照来分析内存泄漏情况。文章似乎把内存泄漏等同于某个gc对象的新增了。
然而,新增gc对象就代表内存泄漏?看下这段代码:
local no_leak = {}
function innocent()
    no_leak.a = {x = 1}
    no_leak.b = {y = 1}
endinnocent函数每次执行都会新增两个table并持有它们,但这明显不是内存泄漏,而且这是很常见的写法。
不新增gc对象就代表没内存泄漏?也不是:
local local_leak = {}
function make_leak()
    table.insert(local_leak, 1)
end这种泄漏文章提供的工具貌似就无能为力。它只记录gc对象及gc对象间的引用关系。但数字不是gc对象。
带GC语言的内存泄漏
C/C++这类语言的内存泄漏,是分配了内存忘了释放,但GC会帮我们自动释放这类内存。而在带GC的语言的内存泄漏,则是往一个容器里头塞东西忘了删掉。
往一个容器里头塞东西忘了删掉会导致什么现象?
当然是导致这容器变大,所以疑似内存泄漏检测就变成了容器大小(是否递增)检测。
这在lua里头又特别简单,因为。。lua只有一种容器--table。
lua内存泄漏检查
核心代码十分简单,只有十来行C代码:
typedef void (*TableSizeReport) (const void *p, int size);
LUA_API void xlua_report_table_size(lua_State *L, TableSizeReport cb, int fast)
{
        GCObject *p = G(L)->allgc;
        while (p != NULL)
        {
                if (p->tt == LUA_TTABLE)
                {
                        Table *h = gco2t(p);
                        cb(h, table_size(h, fast));
                }
                p = p->next;
        }
}遍历所有对象,如果是table,则把指针和size报告给调用者。
这个C代码将由C#调用,并记录下table的size信息,也灰常简单:
static Data getSizeReport(LuaEnv env)
{
    Data data = new Data();
    data.Memroy = env.Memroy;

    LuaDLL.Lua.xlua_report_table_size(env.L, (IntPtr p, int size) => {
        data.TableSizes.Add(p, size);
    }, 0);

    return data;
}
好了,接下来对比前后size信息,就可以找出可能存在内存泄漏的table的指针了,这里就不贴代码了,文章中所有代码都可以在xLua开源项目中找到。
table详细信息
光拿table的指针是没啥用的,我们要得到更多信息才定位。
一般而言,table顺其引用链往上找,都能归结到三个地方:
1、upvalue,比如你在lua脚本定义的local xx = {};
2、全局变量;
3、c侧共用的一个特殊table:registry;
当然,栈也可能引用table,但我们是在C#调用C代码,当时没跑lua,栈应该是空的,而且仅仅栈指向的对象,我们可以先不管,这对象要么是临时的,要么后面还是被上面三个地方引用。
table详细信息思路
1、获取对象引用关系,生成反向索引表;
2、从反向索引表查找到疑似泄漏table,然后根据反向索引往上找,一直找到上述的三个根,生成路径
一个典型泄漏信息报告是这样的:
total memroy: 87
potential leak(180) in {leak2.lua:local anthor_leak.a[1].b,_R.ref_anthor_leak.a[1].b}
potential leak(181) in {_G.global_leak}
potential leak(180) in {leak1.lua:local local_leak}
第一个行表示有个大小为180的疑似泄漏table,它被两个地方引用了
一个是leak2.lua文件的局部变量anthor_leak,位于这个局部变量的a[1].b子节点
一个是registry表(上面的第三个地方),ref_anthor_leak.a[1].b子节点
快泄漏和慢泄漏
如果程序中存在一个泄漏很快以及一个泄漏很慢的地方,我们两次对比table size信息,很可慢的因为没涨而被无视。
这也没关系,当你找到泄漏快的地方,解决了快的,慢的就能被检查出来了。
测试例子也展示这这种情况。

就说这么多,更详细的情况看代码就好了:
发表于 2021-11-18 16:29 | 显示全部楼层
不错,但是只被全局变量统计到的泄漏不好直接定位到代码行,查查代码里的变量名应该能找到。我以前采用hook每行执行看内存增长多少的方法,缺点是无法直接区分临时内存,得在统计报告里可肉眼分析,还有不少性能代价
发表于 2021-11-18 16:33 | 显示全部楼层
table_size 方法的实现呢?
发表于 2021-11-18 16:38 | 显示全部楼层
文章后面有所有源码的链接
懒得打字嘛,点击右侧快捷回复 【右侧内容,后台自定义】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Unity开发者联盟 ( 粤ICP备20003399号 )

GMT+8, 2024-11-25 11:03 , Processed in 0.093908 second(s), 25 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表