[MTK] crash使用教程
文摘 Kernel MediaTek 2020-10-24 阅读:9834什么是Crash?
当linux系统内核发生崩溃的时候,可以通过KEXEC+KDUMP等方式收集内核崩溃之前的内存,生成一个转储文件vmcore。内核开发者通过分析该vmcore文件就可以诊断出内核崩溃的原因,从而进行操作系统的代码改进。那么Crash就是一个被广泛使用的内核崩溃转储文件分析工具。
对调试来讲,gdb是非常适合的,但gdb始终是调试native的工具,不支持kernel信息显示,比如task信息之类的。crash补足了这个短板,由Dave Anderson开发和维护的一个内存转储分析工具,是基于GDB开发的 (GDB适用于用户进程的coredump,而Crash扩展了GDB,使其适用于linux kernel coredump),目前它的最新版本是7.2.3。在没有统一标准的内存转储文件的格式的情况下,Crash工具支持众多的内存转储文件格式,包括:
- Live linux系统
- kdump产生的正常的和压缩的内存转储文件
- 由makedumpfile命令生成的压缩的内存转储文件
- 由Netdump生成的内存转储文件
- 由Diskdump生成的内存转储文件
- 由Kdump生成的Xen的内存转储文件
- IBM的390/390x的内存转储文件
- LKCD生成的内存转储文件
- Mcore生成的内存转储文件
而MTK在KE时会抓取full dump文件:SYS_COREDUMP,则可以用crash来调试。
参考
Crash工具主页
使用 Crash 工具分析 Linux dump 文件
github上的crash
Analyzing Linux kernel crash dumps with crash - The one tutorial that has it all
安装/使用方法
crash是开源工具,因此需要自己下载代码编译成linux可执行文件。
请参考:【FAQ13939】搭建crash分析kernel ramdump平台
启动
根据前面的文章,我们已经自己编译了crash可执行程序,共2个,一个是调试ARM的,一个是ARM64的,看你要调试的target是ARM还是ARM64,再决定用哪个。这里我将调试ARM的crash命名为crash,将调试ARM64的命名为crash64。
启动crash需要2样东西,一个是vmlinux,一个是coredump,这里是SYS_COREDUMP。将vmlinux和SYS_COREDUMP放入crash可执行程序的同一目录中,启动ARM64的启动命令为:
- ./crash64 vmlinux SYS_COREDUMP
- 结果如下:
- 这时就可以输入各种调试命令了。
常用命令
crash使用gdb作为它的内部引擎,crash中的很多命令和语法都与gdb相同。如果曾经使用过gdb,就会发现crash并不是很陌生。如果想获得crash更多的命令和相关命令的详细说明,可以使用crash的内部命令help来获取:
命令 | 说明 | 例子 |
---|---|---|
* | 指针的快捷方式,用于代替struct/union | *page 0xc02943c0:显示0xc02943c0地址的page结构体 |
files | 显示已打开的所有文件的信息 | files 462:显示进程462的已打开文件信息 |
mach | 显示与机器相关的参数信息 | mach:显示CPU型号,核数,内存大小等 |
sys | 显示特殊系统的数据 | sys config:显示CONFIG_xxx配置宏状态 |
timer | 无参数。按时间的先后顺序显示定时器队列的数据 | timer:显示详细信息 |
mod | 显示已加载module的详细信息 | mod:列出所有已加载module信息 |
runq | 显示runqueue信息 | runq:显示所有runqueue里的task |
tree | 显示基数树/红黑树结构 | tree -t rbtree -o vmap_area.rb_node vmap_area_root:显示所有红黑树vmap_area.rb_node节点地址 |
fuser | 显示哪些task使用了指定的文件/socket | fuser /usr/lib/libkfm.so.2.0.0:显示使用了该文件的所有进程 |
mount | 显示已挂载的文件系统信息 | mount:当前已挂载的文件系统信息 |
ipcs | 显示System V IPC信息 | ipcs:显示系统中System V IPC信息 |
ps | 显示进程状态 | ps:类似ps命令 |
struct | 显示结构体的具体内容 | struct vm_area_struct c1e44f10:显示c1e44f10结构 |
union | 显示联合体的具体内容,用法与struct一致 | union bdflush_param:显示bdflush_param结构 |
waitq | 列出在等待队列中的所有task。参数可以指定队列的名称、内存地址等 | waitq buffer_wait:显示buffer_wait等待队列信息 |
irq | 显示中断编号的所有信息 | irq 18:显示中断18的信息 |
list | 显示链表的内容 | list task_struct.p_pptr c169a000:显示c169a000地址所指task里p_pptr链表 |
log | 显示内核的日志,以时间的先后顺序排列 | log -m:显示kernel log |
dev | 显示数据关联着的块设备分配,包括端口使用、内存使用及PCI设备数据 | dev:显示字符/块设备相关信息 |
sig | 显示一个或者多个task的signal-handling数据 | sig 8970:显示进程8970的信号处理相关信息 |
task | 显示指定内容或者进程的task_struct的内容 | task -x:显示当前进程task_struct等内容 |
swap | 无参数。显示已配置好的交换设备信息 | swap:交换设备信息 |
search | 在给定范围的用户、内核虚拟内存或者物理内存搜索值 | search -u deadbeef:在用户内存搜索0xdeadbeef |
bt | 显示调用栈信息 | bt:显示当前调用栈 |
net | 显示各种网络相关的数据 | net:显示网络设备列表 |
vm | 显示task的基本虚拟内存信息 | vm:类似于/proc/self/maps |
btop | 把一个16进制地址转换成它的分页号 | N/A |
ptob | 该命令与btop相反,是把一个分页号转换成地址 | N/A |
vtop | 显示用户或内核虚拟内存所对应的物理内存 | N/A |
ptov | 该命令与vtop相反。把物理内存转换成虚拟内存 | N/A |
pte | 16进制页表项转换为物理页地址和页的位设置 | N/A |
alias | 显示或建立一个命令的别名 | alias kp kmem -p:以后用kp命令相当于kmem -p |
foreach | 用指定的命令枚举 | foreach bt:显示所有进程的调用栈 |
repeat | 循环执行指定命令 | repeat -1 p jiffies:每个1s执行p jiffies |
ascii | 把16进制表示的字符串转化成ascii表示的字符串 | ascii 62696c2f7273752f:结果为/usr/lib |
set | 设置要显示的内容,内容一般以进程为单位,也可以设置当前crash的内部变量 | set -p:切换到崩溃进程的上下文环境 |
p | print的缩写,打印表达式的值。表达式可以为变量,也可以为结构体 | N/A |
dis | disassemble的缩写。把一个命令或者函数分解成汇编代码 | dis sys_signal:反汇编sys_signal函数 |
whatis | 搜索数据或者类型的信息 | whatis linux_binfmt:显示linux_binfmt结构体 |
eval | 计算表达式的值,及把计算结果或者值显示为16、10、8和2进制 | N/A |
kmem | 显示当前kernel使用内存状况 | kmem -i:显示kernel使用内存状况 |
sym | 显示符号所在的虚拟地址,或虚拟地址对应的符号 | sym jiffies:显示jiffies地址 |
rd | 显示指定内存的内容。缺少的输出格式是十六进制输出 | rd -a linux_banner:显示linux_banner内容 |
wr | 根据参数指定的写内存。在定位系统出错的地方时,一般不使用该命令 | wr my_debug_flag 1:修改my_debug_flag值为1 |
gdb | 执行GDB原生命令 | gdb help:执行gdb的help命令 |
extend | 动态装载或卸载crash额外的动态链接库 | N/A |
q | 退出 | N/A |
exit | 同q,退出 | N/A |
help | 帮助命令 | N/A |
扩展命令
crash支持扩展命令,具体请看crash扩展命令说明
其中有2个命令有助于分析问题:
命令 | 说明 | 例子 |
---|---|---|
trace | 导出ftrace | trace show > FTRACE:导出ftrace到FTRACE文件 |
gcore | 导出user process coredump | gcore -f 255 1:导出init进程的coredump |
使用扩展命令前,需要先编译好对应的so库,下面介绍如何编译扩展命令的库。
编译扩展命令库
在官网扩展命令网站上下载对应的源码,放入crash源码里的extensions目录,比如将trace.c放入extensions目录。然后在crash源码目录下输入如下命令:
make extensions
编译好后,就有so库生成,文件放在extensions目录,比如trace.so。
扩展命令
crash支持扩展命令,具体请看crash扩展命令说明
其中有2个命令有助于分析问题:
命令 | 说明 | 例子 |
---|---|---|
trace | 导出ftrace | trace show > FTRACE:导出ftrace到FTRACE文件 |
gcore | 导出user process coredump | gcore -f 255 1:导出init进程的coredump |
使用扩展命令前,需要先编译好对应的so库,下面介绍如何编译扩展命令的库。
编译扩展命令库
在官网扩展命令网站上下载对应的源码,放入crash源码里的extensions目录,比如将trace.c放入extensions目录。然后在crash源码目录下输入如下命令:
make extensions
编译好后,就有so库生成,文件放在extensions目录,比如trace.so。
使用扩展命令
进入crash后,在crash命令行添加扩展
extend <path-to>/xxx.so
crash即可支持对应的命令了。