You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
105 lines
7.3 KiB
105 lines
7.3 KiB
6 years ago
|
---
|
||
|
Linux 综述
|
||
|
---
|
||
|
|
||
|
#### 目录
|
||
|
|
||
|
1. Linux 内核系统结构
|
||
|
2. 系统调用
|
||
|
- 进程管理
|
||
|
- 内存管理
|
||
|
- 文件管理
|
||
|
- 异常处理和信号处理
|
||
|
- 进程间通信
|
||
|
- 网络通信
|
||
|
|
||
|
#### Linux 内核体系结构
|
||
|
|
||
|
Linux 内核可以分为六大块,分别是:
|
||
|
|
||
|
1. 系统调用子系统
|
||
|
|
||
|
操作系统的功能调用的统一入口。
|
||
|
|
||
|
2. 进程管理子系统
|
||
|
|
||
|
对执行的程序进行生命周期和资源管理。
|
||
|
|
||
|
3. 内存管理子系统
|
||
|
|
||
|
对操作系统的内存进行管理、分配、回收、隔离。
|
||
|
|
||
|
4. 文件子系统
|
||
|
|
||
|
对文件进行管理。
|
||
|
|
||
|
5. 设备子系统
|
||
|
|
||
|
对输入输出设备进行管理。
|
||
|
|
||
|
6. 网络子系统
|
||
|
|
||
|
网络协议栈和收发网络包。
|
||
|
|
||
|
![](https://i.loli.net/2019/05/28/5ced1431bbbec82878.jpg)
|
||
|
|
||
|
#### 系统调用
|
||
|
|
||
|
系统调用可以为了几块:进程管理、内存管理、文件管理、网络通信、进程间通信已经信号处理。
|
||
|
|
||
|
##### 进程管理
|
||
|
|
||
|
创建进程的系统调用叫 fork,译为 "分支"。在 Linux 里,要创建一个新的进程,需要一个老的进程调用 fork 来实现,其中老的进程叫做父进程,新的进程叫子进程。当父进程调用 fork 创建进程的时候,子进程将各个子系统为父进程创建的数据结构也全部拷贝里一份,甚至连程序代码也是拷贝过来的。按理说,如果不进行特殊处理,父进程和子进程都按相同的程序代码进行下去,这样就没有什么意义了。
|
||
|
|
||
|
Linux 会根据 fork 系统调用的返回值来决定如何处理,如果当前进程是子进程,就返回 0;如果当前进程是父进程,就返回子进程的进程号。这样就可以根据返回来来区分,如果是父进程,还接着做原来的事情,如果是子进程,需要请求另一个系统调用 execve 来执行另外一个程序,这个时候,子进程和父进程就彻底分道扬镳了,也就产生了一个分支(fork)了。
|
||
|
|
||
|
有时候,父进程要关心子进程的运行情况,父进程可以调用一个系统调用 waitpid,将子进程的进程号作为参数传给它,这样父进程就知道子进程运行完了没有,成功与否。
|
||
|
|
||
|
##### 内存管理
|
||
|
|
||
|
对于进程的内存空间来讲,放程序代码的这部分,称为代码段(Code Segment),放进程运行中产生数据的这部分,称为数据段(Data Segment)。其中局部变量的部分,在当前函数执行的时候起作用,当进入另一个函数时,这个变量就释放了;也有动态分配的,会较长时间保存,指明才销毁的,这部分称为堆(Heap)。堆里面分配内存有两个系统调用:brk 和 mmap。当分配的内存数据比较小的时候,使用 brk,分配内存数量比较大时,使用 mmap。
|
||
|
|
||
|
##### 文件管理
|
||
|
|
||
|
对于文件的操作,有六个系统调用最重要了:open、close、creat、lseek、read、write。对于已经有的文件,可以使用 open 打开这个文件,close 关闭这个文件;对于没有的文件,可以使用 creat 创建文件;打开文件以后,可以使用 lseek 跳到文件的某个位置;可以对文件的内容进行读写,对应的系统调用即 read 和 write。
|
||
|
|
||
|
但是别忘了,Linux 里有一个特点,那就是**一切皆文件**。
|
||
|
|
||
|
启动一个进程,需要一个程序文件,这是一个二进制文件;启动的时候,要加载一些配置文件,例如 yml、properties 等,这是文本文件;启动之后会打印一些日志,如果写到磁盘上,也是文本文件;但是如果把日志打印到交互控制台上,这其实是标准输出 stdout 文件;这个进程的输出可以作为另一个进程的输入,这种方式称为管道,管道也是一个文件。进程可以通过网络和其他进程进行通信,建立的 Socket,也是一个文件;进程需要访问外部设备,设备也是一个文件;文件都被存储在文件夹里面,其实文件夹也是一个文件;进程运行起来,要想看到进程运行的情况,会在 /proc 下面有对应的进程号,还是一系列文件;
|
||
|
|
||
|
每个文件,Linux 都会分配一个文件描述符(File Descriptor),这是一个整数。有了这个文件描述符,就可以使用1调用,查看或者干预进程运行的方方面面。
|
||
|
|
||
|
所以说,文件操作是贯穿始终的,这也是 "一切皆文件" 的优势,就是统一了操作的入口,提供了极大的便利。
|
||
|
|
||
|
##### 异常处理和信号处理
|
||
|
|
||
|
进程的运行不一定是一帆风顺的,很可能遇到各种异常情况,这时候就需要发送一个信号(Signal)给系统,经常遇到的信号有以下几种:
|
||
|
|
||
|
1. 在执行一个程序的时候,键盘输入 "CTRL+C",这就是中断的信号,正在执行的命令就会中止退出。
|
||
|
2. 非法访问内存
|
||
|
3. 硬件故障
|
||
|
4. 用户进程通过 kill 函数,将一个用户信号发送给另一个进程
|
||
|
|
||
|
对于一些不严重的信号,可以忽略,但是像 SIGKILL(用于终止一个进程的信号)和 SIGSTOP(用于中止一个进程的信号)是不能忽略的,可以执行对于该信号的默认动作。每种信号都定义了默认的动作,例如硬件故障,默认终止;也可以提供信号处理函数,可以通过 sigaction 系统调用,注册一个信号处理函数。
|
||
|
|
||
|
##### 进程间通信
|
||
|
|
||
|
首先就是发个消息,不需要一段很长的数据,这种方式称为消息队列(Message Queue)。可以通过 msgget 创建一个消息队列,msgsnd 将消息发送到消息队列,而消息接收方可以使用 msgrcv 从队列中取消息。
|
||
|
|
||
|
当两个进程间需要交互的信息比较大时,可以使用共享内存的方式,也就是两个进程共享同一块内存。可以通过 shmget 创建一个共享内存块,通过 shmat 将共享内存映射到自己的内存空间,然后就可以读写了。
|
||
|
|
||
|
但是,如果两个进程共同访问同一块内存空间,同时修改同一块数据,就存在数据竞争的问题了。为了让不同的进程能够排他的访问,这就是信号量的机制 Semaphore。
|
||
|
|
||
|
信号量机制比较复杂,但是可以简化为:对于只允许一个进程访问的数据,我们可以将信号量设为 1。当一个进程要访问的时候,先调用 sem_wait,如果这个时候没有进程访问,则占有这个信号量,该进程就可以开始访问了。如果这个时候又有另外一个进程要访问,也会调用 sem_wait。由于前一个进程已经在访问了,所有后面的进程就必须等待上一个进程访问完之后才能访问。当上一个进程访问完毕之后,会调用 sem_post 将信号量释放,于是下一个进程就可以访问这个资源了。
|
||
|
|
||
|
##### 网络通信
|
||
|
|
||
|
不同机器通过网络相互通信,要遵循相同的网络协议,也即 TCP/IP 网络协议栈。Linux 内核里有对于网络协议栈的实现。如何暴露出服务给进程使用呢?
|
||
|
|
||
|
网络服务是通过套接字 Socket 来提供服务的,Socket 可以作为 "插口" 或 "插槽" 讲。虽然我们是写软件程序,但是你可以想象成弄一根网线,一头插在客户端,一头插在服务端,然后进行通信。因此,在通信之前,双方都要建立一个 Socket。
|
||
|
|
||
|
我们可以通过 Socket 系统调用建立一个 Socket,Socket 也是一个文件,也有一个文件描述符,也可以通过读写函数进行通信。
|
||
|
|
||
|
##### 总结
|
||
|
|
||
|
![](https://i.loli.net/2019/05/28/5ced3eae61bc578116.jpg)
|