Linux学习之内核Oops详解

2023-11-11

什么是Oops?从语言学的角度说,Oops应该是一个拟声词。当出了点小事故,或者做了比较尴尬的事之后,你可以说"Oops",翻译成中国话就叫做哎呦哎呦,对不起,对不起,我真不是故意打碎您的杯子的。看,Oops就是这个意思。
  在Linux内核开发中的Oops是什么呢?其实,它和上面的解释也没什么本质的差别,只不过说话的主角变成了Linux。当某些比较致命的问题出现时,我们的Linux内核也会抱歉的对我们说:哎呦(Oops),对不起,我把事情搞砸了Linux内核在发生kernel panic时会打印出Oops信息,把目前的寄存器状态、堆栈内容、以及完整的Call traceshow给我们看,这样就可以帮助我们定位错误。
  下面,我们来看一个实例。为了突出本文的主角--Oops,这个例子唯一的作用就是造一个空指针引用错误。
  #include #include static int __init hello_init(void){
  int *p = 0;
  *p = 1;
  return 0;}static void __exit hello_exit(void){
  return;}module_init(hello_init);module_exit(hello_exit);MODULE_LICENSE("GPL");
  很明显,错误的地方就是第8行。
  接下来,我们把这个模块编译出来,再用insmod来插入到内核空间,正如我们预期的那样,Oops出现了。
  [ 100.243737] BUG: unable to handle kernel NULL pointer dereference at (null)
  [ 100.244985] IP: [] hello_init+0x5/0x11 [hello]
  [ 100.262266] *pde = 00000000
  [ 100.288395] Oops: 0002 [#1] SMP
  [ 100.305468] last sysfs file: /sys/devices/virtual/sound/timer/uevent
  [ 100.325955] Modules linked in: hello(+) vmblock vsock vmmemctl vmhgfs acpiphp snd_ens1371 gameport snd_ac97_codec ac97_bus snd_pcm_oss snd_mixer_oss snd_pcm snd_seq_dummy snd_seq_oss snd_seq_midi snd_rawmidi snd_seq_midi_event snd_seq snd_timer snd_seq_device ppdev psmouse serio_raw fbcon tileblit font bitblit softcursor snd parport_pc soundcore snd_page_alloc vmci i2c_piix4 vga16fb vgastate intel_agp agpgart shpchp lp parport floppy pcnet32 mii mptspi mptscsih mptbase scsi_transport_spi vmxnet
  [ 100.472178] [ 100.494931] Pid: 1586, comm: insmod Not tainted (2.6.32-21-generic #32-Ubuntu) VMware Virtual Platform
  [ 100.540018] EIP: 0060:[] EFLAGS: 00010246 CPU: 0
  [ 100.562844] EIP is at hello_init+0x5/0x11 [hello]
  [ 100.584351] EAX: 00000000 EBX: fffffffc ECX: f82cf040 EDX: 00000001
  [ 100.609358] ESI: f82cf040 EDI: 00000000 EBP: f1b9ff5c ESP: f1b9ff5c
  [ 100.631467] DS: 007b ES: 007b FS: 00d8 GS: 00e0 SS: 0068
  [ 100.657664] Process insmod (pid: 1586, ti=f1b9e000 task=f137b340 task.ti=f1b9e000)
  [ 100.706083] Stack:
  [ 100.731783] f1b9ff88 c0101131 f82cf040 c076d240 fffffffc f82cf040 0072cff4 f82d2000
  [ 100.759324]<0>fffffffc f82cf040 0072cff4 f1b9ffac c0182340 f19638f8 f137b340 f19638c0
  [ 100.811396]<0>00000004 09cc9018 09cc9018 00020000 f1b9e000 c01033ec 09cc9018 00015324
  [ 100.891922] Call Trace:
  [ 100.916257] [] ? do_one_initcall+0x31/0x190
  [ 100.943670] [] ? hello_init+0x0/0x11 [hello]
  [ 100.970905] [] ? sys_init_module+0xb0/0x210
  [ 100.995542] [] ? syscall_call+0x7/0xb
  [ 101.024087] Code:05 00 00 00 00 01 00 00 00 5d c3 00 00 00 00 00 00 00 00 00 00
  [ 101.079592] EIP: [] hello_init+0x5/0x11 [hello] SS:ESP 0068:f1b9ff5c
  [ 101.134682] CR2: 0000000000000000
  [ 101.158929] ---[ end trace e294b69a66d752cb ]---
  Oops首先描述了这是一个什么样的bug,然后指出了发生bug的位置,即“IP: [] hello_init+0x5/0x11 [hello]”
  在这里,我们需要用到一个辅助工具objdump来帮助分析问题。objdump可以用来反汇编,命令格式如下:
  objdump -S hello.o
  下面是hello.o反汇编的结果,而且是和C代码混排的,非常的直观。
  hello.o: file format elf32-i386Disassembly of section .init.text:00000000:#include #includestatic int __init hello_init(void){
  0: 55 push %ebp int *p = 0;
  *p = 1;
  return 0;}
  1: 31 c0 xor %eax,%eax#include #includestatic int __init hello_init(void){
  3: 89 e5 mov %esp,%ebp int *p = 0;
  *p = 1;
  5: c7 05 00 00 00 00 01 movl $0x1,0x0
  c: 00 00 00
  return 0;}
  f: 5d pop %ebp 10: c3 ret Disassembly of section .exit.text:00000000:static void __exit hello_exit(void){
  0: 55 push %ebp 1: 89 e5 mov %esp,%ebp 3: e8 fc ff ff ff call 4<CLEANUP_MODULE+0X4>
  return;}
  8: 5d pop %ebp 9: c3 ret
  对照Oops的提示,我们可以很清楚的看到,出错的位置hello_init+0x5的汇编代码是:
  5:c7 05 00 00 00 00 01 movl $0x1,0x0
  这句代码的作用是把数值1存入0这个地址,这个操作当然是非法的。
  我们还能看到它对应的c代码是:
  *p = 1;
  Bingo!Oops的帮助下我们很快就解决了问题。
  我们再回过头来检查一下上面的Oops,看看Linux内核还有没有给我们留下其他的有用信息。
  Oops: 0002 [#1]
  这里面,0002表示Oops的错误代码(写错误,发生在内核空间)#1表示这个错误发生一次。
  Oops的错误代码根据错误的原因会有不同的定义,本文中的例子可以参考下面的定义(如果发现自己遇到的Oops和下面无法对应的话,最好去内核代码里查找)
  * error_code: * bit 0 == 0 means no page found, 1 means protection fault * bit 1 == 0 means read, 1 means write * bit 2 == 0 means kernel, 1 means user-mode * bit 3 == 0 means data, 1 means instruction
  有时候,Oops还会打印出Tainted信息。这个信息用来指出内核是因何种原因被tainted(直译为玷污”)。具体的定义如下:
  1: 'G' if all modules loaded have a GPL or compatible license, 'P' if any proprietary module has been loaded. Modules without a MODULE_LICENSE or with a MODULE_LICENSE that is not recognised by insmod as GPL compatible are assumed to be proprietary.
  2: 'F' if any module was force loaded by "insmod -f", ' ' if all modules were loaded normally.
  3: 'S' if the oops occurred on an SMP kernel running on hardware that hasn't been certified as safe to run multiprocessor. Currently this occurs only on various Athlons that are not SMP capable.
  4: 'R' if a module was force unloaded by "rmmod -f", ' ' if all modules were unloaded normally.
  5: 'M' if any processor has reported a Machine Check Exception, ' ' if no Machine Check Exceptions have occurred.
  6: 'B' if a page-release function has found a bad page reference or some unexpected page flags.
  7: 'U' if a user or user application specifically requested that the Tainted flag be set, ' ' otherwise.
  8: 'D' if the kernel has died recently, i.e. there was an OOPS or BUG.
  9: 'A' if the ACPI table has been overridden.
  10: 'W' if a warning has previously been issued by the kernel. (Though some warnings may set more specific taint flags.)
  11: 'C' if a staging driver has been loaded.
  12: 'I' if the kernel is working around a severe bug in the platform firmware (BIOS or similar).
  基本上,这个Tainted信息是留给内核开发者看的。用户在使用Linux的过程中如果遇到Oops,可以把Oops的内容发送给内核开发者去debug,内核开发者根据这个Tainted信息大概可以判断出kernel panic时内核运行的环境。如果我们只是debug自己的驱动,这个信息就没什么意义了。
  本文的这个例子非常简单,Oops发生以后没有造成宕机,这样我们就可以从dmesg中查看到完整的信息。但更多的情况是Oops发生的同时系统也会宕机,此时这些出错信息是来不及存入文件中的,关掉电源后就无法再看到了。我们只能通过其他的方式来记录:手抄或者拍照。
  还有更坏的情况,如果Oops信息过多的话,一页屏幕显示不全,我们怎么来查看完整的内容呢?第一种方法,在grub里用vga参数指定更高的分辨率以使屏幕可以显示更多的内容。很明显,这个方法其实解决不了太多的问题;第二种方法,使用两台机器,把调试机的Oops信息通过串口打印到宿主机的屏幕上。但现在大部分的笔记本电脑是没有串口的,这个解决方法也有很大的局限性;第三种方法,使用内核转储工具kdump把发生Oops时的内存和CPU寄存器的内容dump到一个文件里,之后我们再用gdb来分析问题。
  开发内核驱动的过程中可能遇到的问题是千奇百怪的,调试的方法也是多种多样,OopsLinux内核给我们的提示,我们要用好它。

来源:51CTO
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Linux学习之内核Oops详解 的相关文章

  • 面向对象基础2-关键字

    目录 前言 一 private关键字 二 private关键字的使用 三 this关键字 四 public关键字 五 protected 六 default 总结 前言 一 private关键字 private属于私有访问权限 用于修饰类的
  • ImportError: /opt/ros/kinetic/lib/python2.7/dist-packages/cv2.so: undefined symbol: PyCObject_Type

    1 问题描述 ubuntu系统中安装好anaconda后 又继而安装了ROS 并通过命令 pip install opencv python 安装opencv的情况下 此时安装的opencv python包是存放在anaconda下的 而在
  • Linux中的一些指令及./详解

    在 Linux 中有许多常见的指令用于执行各种任务 以下是一些常见的 Linux 指令及其用法的总结 ls 列出目录中的文件和子目录 用法 ls 选项 目录 cd 改变当前工作目录 用法 cd 目录 pwd 显示当前工作目录的路径 用法 p
  • js逆向案例三

    目录 零 概述 一 请求参数 Cookie Referer校验 二 参数响应加密解密AES DES RSA 三 其它js混淆 1 案例7 百变ip eval 2 案例8 聚合图床 sojson v6 3 案例9 SH行政处罚 sojson
  • varest插件使用

  • 数据结构学习——顺序栈和链式栈的简单实现和解析(C语言版)

    数据结构 栈的简单解析和实现 一 概念 二 入栈 push 三 出栈 pop 四 顺序栈简单实现 1 进栈操作 2 出栈操作 一 概念 本篇所讲解的栈和队列属于逻辑结构上的划分 逻辑结构分为线性结构 非线性结构 线性结构 有且仅有一个开始节
  • GD32E230芯片无法识别

    GD32E230芯片无法识别 GD32E230板子回来后 开始接上jlink烧录 但是板子第一次能烧录然后第二次就不行的了 换了好几个板子都是 搞了好几个小时 整个人都快崩溃了 后面也是经过不断的尝试 终于搞好了 总结了一下 主要要注意的问
  • Qt的connect槽函数

    一 connect 函数的不同参数形式 以及其区别 优略 除2 未知 之外 总体分为三种形式 1 3信号和槽转为字符串形参的connect函数 4 5 6 7 8信号和槽转为可调用对象的connect函数 9转到槽函数 1 将信号连接到另一
  • 视觉算法工程师面试问题集锦,从基础到进阶,会介绍细节,持续更新中......

    引言 简历上写项目的流程 项目背景是什么 应用场景在什么地方 目的是什么 创造了什么价值 你做了什么事情 遇到困难时 又是怎么解决的 面试需要准备的内容 一 项目描述与项目细节提问 主要描述项目背景 项目实现的功能与方法流程等 面试官会针对
  • 基于STM32的OLED屏显示AHT20采集的温湿度数据

    文章目录 一 实现温湿度数据采集并通过串口显示 二 实现将温湿度采集数据显示到OLED屏 1 代码下载 2 部分代码的编写 3 编译并烧录 4 运行结果 三 小结 四 参考链接 本实验使用的工具 STM32野火mini开发板 AHT20温湿
  • mysql没有写入权限_解决Errcode: 13——mysql写文件权限问题

    mysql没有写入权限 解决Errcode 13 mysql写文件权限问题 一 问题 二 权限错误 Errcode 13 解决方法 三 原理 一 问题 在数据库中select into outfile home mysql data sql
  • Three.js入门之做一个简单的3D场景内添加标点的功能

    什么是Three js 百度百科上是这么说的 Three js是JavaScript编写的WebGL第三方库 提供了非常多的3D显示功能 运行在浏览器中的 3D 引擎 你可以用它创建各种三维场景 包括了摄影机 光影 材质等各种对象 你可以在
  • 数据结构第一次上机 第一章

    数据结构第一次上机 第一章 实验题2 常见算法时间函数的增长趋势分析 目的 理解常见算法时间函数的增长情况 内容 编写一个程序exp1 2 cpp 对于1 n的每个整数n 输出log2 n n Alt 41420出根号 n nlog2 n
  • 20050621:松一口气

    今天把业务日志的数据 恢复 上去了 不管怎么样 X姐放了一罐椰奶在我桌子上 我猜大概不会收到投诉了 因为这事情她也有责任 从某种意义上说是我帮她 摆平 了 但是下午X姐的本性又露出来了 不停的冒一些点子出来 客户总是这样 喜欢出些点子 并暗
  • ARTS挑战打卡第十周

    Algorithm 一周至少一道算法题 Review 阅读并点评至少一篇英文技术文章 Tip 学习至少一个技术技巧 总结和归纳在日常工作中所遇到的知识点 Share 分享一篇有观点和思考的技术文章 01 Algorthm https lee
  • 什么是面向对象

    面向对象 定义 面向对象 Object Oriented 是软件开发方法 一种编程范式 对象来自某一个类 同时又给类赋值而实例化 面向对象编程中执行一个功能的代码叫方法 method 举例 作为团队负责人 分管好各个部门的负责人就行 不需要
  • 【TensorFlow】激活函数(Activation Functions)原理解析(十二)

    神经网络结构的输出为所有输入的加权和 这导致整个神经网络是一个线性模型 如果将每一个神经元的输出通过一个非线性函数 那么整个神经网络的模型也就不再是线性的了 使得神经网络可以更好地解决较为复杂的问题 这个非线性函数也就是激活函数 神经网络中
  • elementUI一条el-form-item控制两个必填项

    实现效果 申请日期是日期跟时段拼接的
  • Qt 文件操作

    文件操作是应用程序必不可少的部分 Qt 作为一个通用开发库 提供了跨平台的文件操作能力 Qt5 新增加了一个QFileDevice类 途中所涉及的类及其用途简要说明如下 QFlie 访问本地文件或者嵌入资源 QTemporaryFile 创
  • 动态规划之在二叉树中使用DP

    二叉树染色 题目描述 文章目录 二叉树染色 题目描述 详细思路 个人走的弯路 可略 正确思路 代码实现 传送门 小扣有一个根结点为 root 的二叉树模型 初始所有结点均为白色 可以用蓝色染料给模型结点染色 模型的每个结点有一个 val 价

随机推荐

  • Python爬虫(一):学习路线

    Python爬虫一 学习路线 前言 打铁还需自身硬 前置要求 掌握Python基础知识 知识点 案例 为驱动 第一阶段 爬虫核心 爬虫的前导知识 爬虫网络请求模块 uellib requests 数据解析 正则 xpath bas4 第二阶
  • CentOS6.5菜鸟之旅:文件权限详解

    一 前言 Linux下所有资源 设备均被视作文件来操作 而文件权限则是决定用户可各文件操作的范围 无论是平时使用Linux 还是写程序均涉及这方面 以下为个人学习的整理 供以后查阅 二 三种权限 1 普通权限 权限 文件 目录 r 读权限
  • 深度学习下的医学图像分析

    转 https www leiphone com news 201706 xwSoWmhNgkn34iGS html https www leiphone com news 201706 UvZxrlbedfT7Meid html http
  • 编译器与平台相关性

    每种处理器都可能会有自己的汇编语言编译器 而对于同一款处理器来说 针对不同的平台 比如 Windows 和 Linux 也会有不同版本的汇编语言编译器 理论上 不管用的是什么操作系统 Windows 也好 DOS 也好 Linux 也好 只
  • Ansible 介绍安装及其使用(基础)

    Ansible 介绍安装及其使用 基础 1 介绍 Ansible 是一个 IT 自动化工具 它能配置系统 部署软件 编排更复杂的 IT 任务 如连续部署或零停机时间滚动更新 Ansible 用 Python 编写 尽管市面上已经有很多可供选
  • uni-app h5公众号 上传多张图片问题

    因uni app的api不支持安卓手机上传多张图片所以要单独引入用到jssdk uni app的底层不是jssdk 第一步 引入jssdk npm i weixin js sdk 文档 https developers weixin qq
  • 【STM32】cubeMX配置HAL库驱动L298N控制直流有刷电机

    目录 1 电机为什么需要驱动板呢 为什么不能用控制器直接控制电机呢 2 H桥电路介绍 3 L298N原理介绍 4 实物接线图 5 CUBEMX配置 6 代码 7 演示视频 L298N是常用来驱动小型直流有刷电机 两个 和步进电机 一个 的电
  • 求开发代码,ESP32 网络收音机、网络对讲机(使用蓝牙耳机输出输入)

    参考链接 ESP32S2小项目 FM 网络时钟 电台 Arduino开发环境 哔哩哔哩 https www eefocus com circuit 1180016 html https www eefocus com circuit 118
  • 基于ASP的反垃圾邮件管理系统的设计与实现

    随着Internet的迅速普及 电子邮件以其快捷 方便 低成本的特点逐渐成为人们进行信息交流的主要媒介之一 但是随之而来的垃圾邮件也越来越泛滥 垃圾邮件占用了有限的存储 计算和网络资源 耗费了用户大量的处理时间 影响和干扰了用户的正常工作
  • Python 数据文件与网络数据序列化存储详解

    1 ETL简介 大部分可用数据都是存放于文本文件中的 这些数据可以是非结构化文本 如一篇推文或文学作品 也可以是比较结构化的数据 其每一行都是一条记录 多个字段之间由特殊字符分隔 如逗号 制表符或管道符号 文本文件有可能会很大 一个数据集可
  • Oracle绑定执行计划

    Oracle绑定执行计划 在Oracle中时长会出现一直运行正常的SQL突然运行的很慢 检查发现执行计划发生了改变 这时候就需要绑定执行计划 在Oracle 10G以后的版本中可以使用SQL profile或SPM 11g以后 来绑定执行计
  • LaTeX公式保姆级教程

    文章目录 希腊字母 上下标 直立与斜体 分式 根式 普通运算符 函数 大型运算符 标注符号 向量 平均值等 箭头 括号与定界符 多行公式 大括号 矩阵 实例仅供参考 希腊字母 pi pi delta
  • Loadrunner11.0安装与简单使用

    Loadrunner下载 https pan baidu com s 1TtBlfp9W7FM8MVjmxa5Irw 提取码 96d0 1 解压loadrunner与破解包 2 打开文件夹运行setup exe 3 点击loadrunner
  • 【华为OD机试真题 Python】英文句子倒序

    前言 本专栏将持续更新华为OD机试题目 并进行详细的分析与解答 包含完整的代码实现 希望可以帮助到正在努力的你 关于OD机试流程 面经 面试指导等 如有任何疑问 欢迎联系我 wechat steven moda email nansun09
  • hive报错:Call from hostname/127.0.1.1 to localhost:9000 failed on connection exception.主节点9000端口拒绝访问.

    1 美图 2 背景 启动hadoop base lcc lcc hadoop 2 7 4 sh sbin start all sh This script is Deprecated Instead use start dfs sh and
  • windows server 2012 r2关于vmtools安装失败以及KB2919355安装

    windows server 2012 r2关于vmtools安装失败以及KB2919355安装 前言 VMware workstation15安装windows server 2012 r2 安装不了vmtools 解决方法 1 安装低版
  • OpenCV中QR二维码的生成与识别(CIS摄像头解析)

    1 QR概述 QR Quick Response 属于二维条码的一种 意思是快速响应的意思 QR码不仅信息容量大 可靠性高 成本低 还可表示汉字及图像等多种文字信息 其保密防伪性强而且使用非常方便 更重要的是QR码这项技术是开源的 在移动支
  • python 注解annotation_Annotation注解(一)- 基础

    这篇博客 主要讲解关于注解的一些基本知识 包括注解的概念 分类 作用 常见注解的定义及其解析方式等 Annotation的概念 1 概念 关于Annotation注解的概念 我们可以看下官方的解释 Annotations a form of
  • 大数据:大规模文件系统及map-reduce

    大数据 大规模文件系统及map reduce 下面是我看 大数据 互联网大规模数据挖掘与分布式处理 一书第二章的总结 1 分布式文件系统 distributed file system 文件多副本存储 计算任务分多个 容错 文件非常大 TB
  • Linux学习之内核Oops详解

    什么是Oops 从语言学的角度说 Oops应该是一个拟声词 当出了点小事故 或者做了比较尴尬的事之后 你可以说 Oops 翻译成中国话就叫做 哎呦 哎呦 对不起 对不起 我真不是故意打碎您的杯子的 看 Oops就是这个意思 在Linux内核