回到本真,代码到底是什么?

本文特指Linux操作系统下和静态编译性语言

代码即文本


我们写的「代码」只是个普通的文本文件,因为编译器等方式得以转化为二进制代码。代码文本从最早期的「二进制代码」演化到现在“百花齐放”的「编程语言代码」,粗略演化路线:

  • 二进制代码:初期二进制代码文本并不具备可读性,假如让你直接编写二进制代码,“也许你一辈子都在调试代码错误??”

  • 汇编代码:为了让代码更易于人们编写和阅读,产生了「汇编代码」

  • 编程语言代码:然而编写汇编代码也不是一件简单的事情,随着编程技术的发展,诞生了众多编程语言,比如C、C++、Go等等,进一步提升了代码的:

    • 可读性(语法、面向对象等等)

    • 可复用(库、面向对象等等)

    • 性能和效率等(内存分配器、垃圾回收器、协程调度器等等)

    • 等等

点击查看大图

5ece8ad4fcc8d4332937e49d224b7dc5.png

现代编程语言语言,可以让我们更加高效编写程序。

以Go语言为例,最终Go代码汇编「编译器」转化为「汇编代码」,再到「二进制代码」文件。

我们的代码文本都包含了什么?

代码包含CPU指令和预置数据


为了简化理解,粗略来看代码主要分为两部分:

  • 指令部分:CPU可执行的指令

  • 数据部分:常量等

41f34937303777afa1c01e6dcbc3225f.png

代码逻辑类型对应CPU指令类型
传输数据逻辑:比如你平常写的代码一个变量的数据或者常量赋值到另个变量数据传输指令MOV
算术运算逻辑:代码文本里描述的四则运算等等运算指令
条件分支逻辑:代码文本里各种if的判断等等JMP跳转指令
函数调用逻辑:代码文本里各种的调用函数CALL/RETURN指令
等等...

1a1fb6164cdab83128c28017d3c28805.png

当二进制代码文件被执行时:

  • 指令被加载进内存

  • 预置数据被加载进内存

f6360d15e18a1837006e7f3488f6c53f.png

同样被加载到内存中的「代码」也主要分为两部分:

  • 指令部分:传输、算术、跳转JMP、函数调用CALL/退出RETURN等指令

  • 数据部分:文本代码中预置的数据,比如常量等

a7eb8c71523e638387765b693e912360.png

CPU读取指令


二进制代码被加载到内存之后,中央处理器CPU就可以从内存中读取指令、解析并执行指令。同时,如果当前指令操作了全局变量,执行指令过程中「中央处理器CPU」从内存中读取代码中预置数据(常量等)。其次,这里代码运行过程就是我们通常说到的「运行时 runtime」。

43c0f3d48adadefc843b25810fc2525d.png

总结


  1. 计算机自动运行核心:CPU自动执行指令

  2. 指令来源:CPU从内存读取指令

  3. 内存中指令来源:内存中的指令来源于被执行的二进制文件

  4. 代码中指令来源:二进制文件由源代码文本经过编译等方式转化而来

  5. 二进制文件来源:程序员根据需求编写源代码文本

4e8381205d8bcb468dee1febc8f47aa1.png

所以综上所述,我们写的代码到底是什么?

 答:包含CPU指令和预置数据的文本文件。

预告


下篇文章我们就来看看:

程序是如何运行的?


Go轻松进阶系列 更多文章

a2fdb06e323bda99c50b5600b1eeed7c.png

cedc016dd8270e85c08392ecc089261c.gif


版权声明:本文为github_38773259原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。