GMP模型

golang version: Go SDK 1.20.3
GMP在源代码中分散的位置很多，然后我是根据ChatGPT搜索到sr/runtime/proc.go这个文件中，然后找到了m, g 的使用，然后根据m, g找到了其定义文件src/runtime/runtime2.go

在proc.go文件的最开始的注释里，我们可以了解到Goroutine Scheduler概念，以及GMP具体含义是什么。
G - Goroutine
M - worker thread, or machine
P - processor, a resource that is required to execute Go code. M must have an associate P to execute Go code, however it can be blocked or in a syscall w/o an associated P.

用户程序进行的系统调用都会被Runtime进行拦截，以此帮助runtime进行调度以及垃圾回收等相关工作。

graph TB subgraph GoProcess[Go可执行文件] program[GO Program] runtime[runtime] program <-.内存分配.->runtime program <-.chanel通信.->runtime program <-.goroutine创建.->runtime program <-.IO.->runtime end kenel[OS Kenenl] runtime -.系统调用.-> kenel program <-.线程创建.->runtime

1. GMP具体实现

首先要明确的一点是，Goroutine是执行的基本单元，但不是执行实体，一个Goroutine执行需要有一个空闲的P and M，如果只有空闲的M，没有P，那么Goroutine是不能执行，如果有空闲的P，没有空闲的M，在条件允许的情况下创建一个新的M，进行执行当前这个Goroutine。

graph TD subgraph "Go Runtime Scheduler" GlobalQueue["Global Queue (全局队列)"] subgraph P1 ["Processor (P)"] LRQ1["Local Run Queue (本地队列)"] M1["Machine (M)"] G1["Goroutine (G)"] end subgraph P2 ["Processor (P)"] LRQ2["Local Run Queue (本地队列)"] M2["Machine (M)"] G2["Goroutine (G)"] end end GlobalQueue -.-> LRQ1 GlobalQueue -.-> LRQ2 M1 --- G1 M2 --- G2 P1 --- M1 P2 --- M2

G

G就代表着一个goroutine。是执行function的载体。

G的状态有10中，分别是：

_Gidle:表示该goroutine只是被创建，只是创建了一个rutime.g的结构体，还没有被初始化。然后将该g放入到gFree队列当中。
_Grunable：表示该goroutine已经在运行队列当中了，此时已经给该goroutine分配了stack，但是没有访问权限。
_Grunning:表示该goroutine可以执行用户代码，此时该goroutine有对自己的stack有访问权限，比如BP,SP已经放入到CPU的寄存器当中，此时它不在运行队列当中，它被分配了一个P和M。
_Gsyscall：表示该goroutine正在执行一个系统调用。此时它不能继续执行用户代码，此时该goroutine有自己的栈空间。此时它不会被分配到运行队列当中，它被保存在当前的M中。
_Gwating: 表示该goroutine被设置为阻塞状态。此时它不能执行任何用户代码，也不在运行队列当中。但是应该被记录在其它地方，比如：chanel wait 队列当中。此时它没有对自己的stack有访问权限。
_Gmoribund_unused：目前不被使用，但是已经被硬编码到了gdb脚本中。
_Gdead:表示该goroutine没有被运行，也许该goroutine退出了或者刚刚初始化。此时该goroutine不能执行任何代码，此时它有可能有已经分配好的stack，也有可能没有。如果一个goroutine刚被分配完stack,那么它的状态就是_Gdead,如果一个goroutine已经执行完用户代码退出了,那么此时的状态也是_Gdead此时goroutine的stack如果大于2kb那么重新创建新的stack,如果没有,那么直接使用之前的stack.但是会清理该goroutine的相关参数信息.
_Genqueue_unused：该状态没有被使用.
_Gcopy_stack:此时goroutine是不能被运行,表示当前goroutine的stack被调度器正在扩容中.处于这个状态的 G 既不在运行，也不在等待队列。它被“锁死”在当前的 M 上（或由 GC 线程操作中）。
_Gpreempted:它标志着 Goroutine 处于 “被异步抢占” 的挂起态。

P

P是一种资源，是运行Go代码所需的所有上下文资源。

如果没有P,那么M只能通过全局运行队列去获取G，由于所有M共享这个G，所以就需要给这个全局运行队列加锁，这样做，效率大打折扣，所以才有P这个概念，每个P都维护一个属于自己的本地队列LRQ。

P都包含的资源：

本地运行队列（LRQ）：存储最多256个等待运行的G。
内存分配缓存（mcache）:为了实现高效的微小对象分配，每个P都有自己的内存缓存，这样M在分配内存的时候不需要加锁。
自由G列表：当一个G执行完或者被销毁时，可以复用g结构体，减少创建G的开销。
调度计数器：记录调度次数，用于触发抢占。

P是可以动态绑定M的，如果没有P的话，M执行G，如果G阻塞了，那么M也就阻塞了，M上的其它G都会被阻塞。引入P之后，当当前M阻塞了，P会绑定到其它空闲M上或者新创建一个M然后绑定。

M

M是对OS线程的一种抽象，其与OS线程一一对应，但是也保存了自己的资源。M是绑定P的，如果没有绑定P是不能执行任何G的。

如果M阻塞因为G执行了系统调用而阻塞了，那么M会被挂起，G的状态从_Grunning变为_Gsyscall状态并且依然留在当前这个M中，然后P会被解绑，sysmon线程会将该P绑定到其它空闲线程或者新创建一个线程执行P中的其它G。

当G系统调用完成之后，G被唤醒，M会会优先去获取之前的那个P，如果该P没有被其它M绑定，直接绑定该P，然后直接执行当前的这个G，因为M中已经有了这个G，所以不需要将他放在P的本地队列当中。省区了从该本地队列获取G的时间。

如果之前的P已经被其它M所绑定，然后当前M会在全局P的队列中获取空闲的P，然后绑定，之后继续运行当前的G，然后再运行P中的其它G。

如果没有获取到任何P，那么M会将G的_Gsyscall状态转变为_Grunnalbe，放置到全局运行队列当中。

goroutine的创建过程

首先main函数的goroutine是在程序运行开始就已经创建好了,然后如果在main所在的goroutine创建goroutine时:

当你执行go func(){}()的时候,runtime从gFree队列中获取一个状态为_Gidle或者_Gdead的G,并且初始化.
G的状态变为_Grunnable.
当前M尝试将这个新的G放入与它绑定的P的runnext中.如果runnext没有G放入,如果有则将这个G放在P的本地运行队列当中.

graph LR G P M subgraph LRQ[本地运行队列] G1 G2 G3 end P --> LRQ P -.获取G执行.->M subgraph gFree[gFree队列] G:idle G:dead end gFree -.G:runable.-> G G -.获取到G.-> M M -.尝试存入到P的runnext中.->P

goroutine阻塞

当一个goroutine执行网络IO、锁、chanel操作时，goroutine的状态变为_Gwaiting状态，它会被存入到与操作相关的队列当中。

网络IO:存入到NetPoller管理的逻辑队列当中。该netPoller底层使用了操作系统的epoll，如果有数据到了，则会通知netpoller哪一个goroutine有数据，然后sysmon线程会遍历netPoller队列看是否有goroutine可以被唤醒了，如果有则将该goroutine的状态变为_Grunnable然后放入到P的runnext中，或者P的运行队列当中。
chanel阻塞：
- 发送阻塞： G会被封装为一个sudog结构，存入channel的内部sendq队列当中。
- 接收阻塞：G封装称为sudog结构，然后存入到recvq中。
此时G与Channel绑定，一旦Channel另一端就绪，会由另一端的goroutine负责唤醒该队列的第一个G。
锁阻塞当你的goroutine竞争锁失败的时候，会阻塞时：
- 存放位置：go运行时维护了一个全局的信号量中心senaRoot它是一个哈希表，内部通过平衡树来管理等待的goroutine。
- 逻辑：G进入到对应地址的信号量等待队列当中，等待锁的释放者调用runtime_Semrelease唤醒。
定时器阻塞：存放在P的timers堆中当你执行time.Sleep或计时器的时候：
- 存放位置：G会被放入其当前绑定的P的本地timer堆中。
- 逻辑：每个P都有一个timer最小堆，调度器或者sysmon会检查堆顶的时间戳，到期后将对应的G唤醒。

M获取G

首先要知道M运行G的前提条件是绑定P，如果没有绑定P那么M是无法执行G的。

M获取G的大致流程如下：

graph TD Start([M 开始查找任务 findrunnable]) --> Check61{schedtick%61 ==0 ?} %% 61次检查逻辑 Check61 -- 是 --> GetGRQ_Pre[从全局队列 GRQ 获取任务] GetGRQ_Pre --> Found_Pre{是否获取成功?} Found_Pre -- 成功 --> Execute([执行任务]) Found_Pre -- 失败 --> CheckRunNext %% 本地队列逻辑 Check61 -- 否 --> CheckRunNext[检查 P.runnext 特权位] CheckRunNext --> Found_Next{是否有 G?} Found_Next -- 有 --> Execute Found_Next -- 无 --> CheckLRQ[检查 P.runq 本地运行队列] CheckLRQ --> Found_LRQ{是否有 G?} Found_LRQ -- 有 --> Execute %% 全局队列逻辑 Found_LRQ -- 无 --> CheckGRQ[检查全局队列 GRQ] CheckGRQ --> Found_GRQ{是否有 G?} Found_GRQ -- 有 --> Execute %% 网络轮询逻辑 Found_GRQ -- 无 --> CheckNetpoll[检查 Netpoll 网络轮询器 - 非阻塞] CheckNetpoll --> Found_Net{是否有就绪 G?} Found_Net -- 有 --> Execute %% 窃取逻辑 Found_Net -- 无 --> Stealing[尝试 Work Stealing - 从其他 P 偷取] Stealing --> Found_Steal{是否偷到 G?} Found_Steal -- 有 --> Execute %% 最后尝试与休眠 Found_Steal -- 无 --> LastCheck[最后检查: Netpoll / GC 标记任务] LastCheck --> Found_Last{是否有任务?} Found_Last -- 有 --> Execute Found_Last -- 无 --> SpinEnd[自旋结束, M 进入休眠]

当实在没有任务的时候，M会进入到休眠状态，它会被放置在全局的空闲线程队列（schedt.midle）当中。schedt.midle队列存储了所有休眠的M结构体。这是一个全局共享资源，受全局锁sched.lock保护。

M是如何休眠的：

Linux：使用futex系统调用（futex_wait）。
作用：这让M对应的线程从CPU上切走，然后进入到阻塞状态挂起。此时这个M不会消耗任何CPU周期，直到被内核唤醒。

总结：其实为了避免锁带来的消耗，其实可以包装一层资源层将全局资源变成本地资源。合理的运用自旋锁，不要轻易的将线程或者协程挂起，可以先自旋一段时间，如果还没有获取到资源再挂起休眠等操作。

foreverool

GMP基本概念

GMP模型

1. GMP具体实现

G

P

M

goroutine的创建过程

goroutine阻塞

M获取G

目录