本文 linux 源码版本为 2.6.11。本文涉及到 GCC 内联汇编的知识,可以参考我翻译的文章 GCC Inline Assembly HOWTO[译]

linux 中进程切换涉及到一个调用链:

schedule() –> context_switch() –> switch_to –> __switch_to()

本文对 switch_to 宏和 __switch_to 函数进行分析。

先是 switch_to 宏:

#define switch_to(prev,next,last) do {		\
	unsigned long esi,edi;			\
	asm volatile("pushfl\n\t"  \ 
		     "pushl %%ebp\n\t" \
		     "movl %%esp,%0\n\t" 	\
		     "movl %5,%%esp\n\t" \
		     "movl $1f,%1\n\t" \
		     "pushl %6\n\t" \
		     "jmp __switch_to\n" \
		     "1:\t"	 \
		     "popl %%ebp\n\t" \
		     "popfl" \
		     :"=m" (prev->thread.esp),"=m" (prev->thread.eip),	\
		      "=a" (last),"=S" (esi),"=D" (edi)	\
		     :"m" (next->thread.esp),"m" (next->thread.eip),	\
		      "2" (prev), "d" (next));	\
} while (0)

由于 switch_to 宏使用了内联汇编,为了便于理解,将其转换成可读性较强的汇编形式(语法上会有些许差别)。下面逐句分析:

pushfl

将 eflags 寄存器压到 prev 进程的内核栈中。

pushl %ebp 

由于 switch_to 是 context_switch() 中的一个宏替换,所以这一步是将 context_switch() 的栈桢起始位置压到 prev 进程的内核栈中。

movl %esp, [prev->thread.esp]

保存栈定位置。

movl [next->thread.esp], %esp

将 next->thread.esp 恢复到当前 CPU 的 esp 寄存器中,此时已经切换到了 next 进程的内核栈。

movl $1f, [prev->thread.eip]

1:
  popl %ebp
  popfl

这是为了以后恢复 prev 作下铺垫,下面将会看到它在 next 中起到的作用。

pushl [next->thread.eip]

将 1: 处的指令地址压入 next 的内核栈的栈顶。到这里已经完成了内核栈的切换,下面的工作就是在 __switch_to() 中对 next 进程进行一些设置。

执行 jmp __switch_to 跳转(注意这里没有使用call指令,文末解释原因):

struct task_struct fastcall * 
__switch_to(struct task_struct *prev_p, struct task_struct *next_p)
{
	struct thread_struct *prev = &prev_p->thread,
				 *next = &next_p->thread;
	int cpu = smp_processor_id();
	struct tss_struct *tss = &per_cpu(init_tss, cpu);
	__unlazy_fpu(prev_p);
	load_esp0(tss, next);
	load_TLS(next, cpu);
	asm volatile("movl %%fs,%0":"=m" (*(int *)&prev->fs));
	asm volatile("movl %%gs,%0":"=m" (*(int *)&prev->gs));
	if (unlikely(prev->fs | prev->gs | next->fs | next->gs)) {
		loadsegment(fs, next->fs);
		loadsegment(gs, next->gs);
	}
	if (unlikely(next->debugreg[7])) {
		loaddebug(next, 0);
		loaddebug(next, 1);
		loaddebug(next, 2);
		loaddebug(next, 3);
		loaddebug(next, 6);
		loaddebug(next, 7);
	}
	if (unlikely(prev->io_bitmap_ptr || next->io_bitmap_ptr))
		handle_io_bitmap(next, tss);
	return prev_p;
}

这个函数运行在 next 的内核栈上。因为现在 CPU 已经切换到了 next 进程,所以需要重新设置 CPU 的一些数据。例如 TSS:

load_esp0(tss, next);
load_TLS(next, cpu);

最后执行 return prev_p 将栈顶(prev->thread.eip)恢复到 eip 中。执行:

1:
  popl %ebp
  popfl

恢复 next 进程的 ebp 和 eflags 寄存器。与 prev 一样,这些寄存器是被切换之前保存下来的。接下来 CPU 就运行在 next 进程上了。下面配上一张图也许能加深理解:

最后在说一下为什么要执行 jmp __switch_to,而不是执行 call __switch_to。因为 call 指令会将下一条指令的地址压栈作为返回地址,这是多余的。因为我们需要的返回地址已经通过 switch_to 中 pushl %6 压入栈了。从上图也能看出,__switch_to 栈桢上面就是我们自己压入的返回地址。

最后总结一下。其实 linux 中进程切换与 xv6 中的切换大致原理想通,这是我阅读 xv6 进程调度时的写一篇笔记: xv6: 锁与进程调度。上下文都是存放在栈顶。一个进程被调离 CPU 后,保存好自己到上下文信息,和内核栈中到调用链。以便再次被调度后,能恢复执行。