基于LLVM的编译原理简明教程: 写一个自己的编译器​ 您所在的位置:网站首页 安卓开发编译器有哪些 基于LLVM的编译原理简明教程: 写一个自己的编译器​

基于LLVM的编译原理简明教程: 写一个自己的编译器​

2024-07-16 15:40| 来源: 网络整理| 查看: 265

LLVM简介 进入21世纪,新的编程语言如雨后春笋一样不停地冒出来。需求当然是重要的驱动力量,但是在其中起了重要作用的就是工具链的改善。

2000年,UIUC的Chris Lattner主持开发了一套称为LLVM(Low Level Virtual Machine)的编译器工具库套件。后来,LLVM的scope越来越大,Low Level Virtual Machine已经不足以表示LLVM的全部,于是,LLVM就变成了正式的名字。LLVM可以用于常规编译器,JIT编译器,汇编器,调试器,静态分析工具等一系列跟编程语言相关的工作。

后来,Chris Lattner又主持开发了Clang,针对C/C++/Objective-C的前端。这个编译器直接挑战了GCC的统治地位。成为Apple系统的主要编译器,在Android中,指名使用Clang的模块也越来越多。2012年,LLVM荣获美国计算机学会ACM的软件系统大奖,跟UNIX,WWW,TCP/IP,TeX,Java等经典系统作伴。

另外再八卦几句LLVM的主要作者和架构师Chris Lattner。这哥们生于1978年。2005年,Chris Lattner加入Apple。因为Apple对于GCC支持Objective-C不力的不满,LLVM和Clang成为Apple替代GCC的杀手级武器。2010年,Chris Lattner又开始主持开发Swift语言。

LLVM简介

LLVM(wiki  chs)是开源跨平台的编译器基础设施,包含一系列模块化的编译器组件和工具链,用来开发编译器前端和后端。源代码见:github  也可从官网下载代码    注:LLVM本身并不是编译器

LLVM架构提供了完整编译系统的中间层,与绝大多数编译器一样,LLVM架构也使用经典三段式的结构设计。

868017c45767e4be86ca1860fc9714a3.png

① 前端(Frontend)负责分析源代码【词法分析】,可以检查语法级错误【语法分析】,构建针对该语言的抽象语法树(Abstract Syntax Tree,AST)【语义分析】 ,并将代码编译成LLVM IR【IR生成】

② 抽象语法树可以进一步转换为优化,最终转为新的表示方式, 然后再交给优化器

③ 最终由后端生成可执行的机器码   注:如果需要增加一种处理器架构(如:arm64、x86等),只需要增加一种后端

Clang及许多GCC工具链都支持LLVM架构,能输出LLVM IR代码。LLVM已经成为多个编译器和代码生成相关子项目的母项目。  注:Clang是类C语言的编译器前端,是LLVM的一个子项目。

LLVM前端已支持的编程语言:C、C++、ActionScript、Ada、D语言、Fortran、GLSL、Haskell、Java字节码、Objective-C、Swift、Python、Ruby、Crystal、Rust、Scala以及C#等

LLVM后端已支持指令集架构:x86、x86-64、ARM、MIPS、PowerPC以及RISC-V等

bdad6154c8f25757bb2f75810a4a93fc.png

相比之下,GCC的前端和后端没分得太开,耦合在一起。这使得GCC支持一门新的语言或新的目标平台,变得特别麻烦

LLVM的核心是IR语言(Intermediate Representation),一种类似汇编的底层语言。

IR是一种强类型的精简指令集(Reduced Instruction Set Computing,RISC),并对目标指令集进行了抽象。

LLVM IR有3种表示形式:

text:便于阅读的文本格式。扩展名为.llbitcode:二进制格式。扩展名为.bcmemory:内存格式

LLVM其他子项目

lld链接器

lld链接器子项目旨在为LLVM开发一个内置的,平台独立的链接器,去除对所有第三方链接器的依赖。

2017.5,lld已经支持ELF、PE/COFF和Mach-O可执行文件格式。

在lld支持不完全的情况下,用户可以使用其他项目,如GNU ld链接器、bfd链接器(ld.bfd)、gold链接器。    注:ld.gold是google在GNU ld上改进的链接器

C++标准库

LLVM项目包含一个叫做libc++的C++标准库的实现   注:GNU的为Libstdc++

lldb调试器

lldb(wiki)是LLVM的调试子项目,目前已支持C、C++及Objective-C。XCode5+、Android Studio缺省使用LLDB进行调试,LLDB也被VS Code、Eclipse等IDE使用。

参考

The Architecture of Open Source Applications: LLVM 

LLVM IR语言参考

深入剖析 iOS 编译 Clang / LLVM   (github链接)

好了,言归正传。首先我们想说明的是,跟学院派的厚书给大家的印象不同,其实用LLVM写个简单的编译器是件容易的事情,因为大部分事情LLVM都替我们做了。

用LLVM做个简单的编译器

我们先看一个使用LLVM工具之后,实现一门编程语言的简图:

ee5d2501a3239ec84796665782b4551e.png

编译器简图

完全需要我们手工,或者依靠其他工具如lex, yacc来做的事情,是从源代码到token的词法分析和从token到AST的语法分析。也就是前端的主要部分需要我们来实现,毕竟我们是这门语言的定义者。在介绍LLVM的书里,讲前端的部分都是只占很小的篇幅的,所以大家可以take it easy.

在LLVM的万花筒语言例子里,带有注释的词法分析和语法分析也不过400行。大家如果觉得还复杂,后面我会带大家做一些更简单的,先完成一小部分功能,然后迭代式开发。区区百余行代码,不需要学习编译原理。

比如Clang就是一个实现了C/C++/Objective-C的前端。

4e16f5598fd689f2202fb3657bfad412.png

从AST转LLVM开始,LLVM就开始提供一系列的工具帮助我们快速开发。从IR(中间指令代码)到DAG(有向无环图)再到机器指令,针对常用的平台,LLVM有完善的后端。也就是说,我们只要完成了到IR这一步,后面的工作我们就享有和Clang一样的先进生产力了。

口说无凭,有例子为证,这是将二元表达式AST转成IR的函数:

Value *BinaryExprAST::codegen() { ... switch (Op) { case '+': return Builder.CreateFAdd(L, R, "addtmp"); case '-': return Builder.CreateFSub(L, R, "subtmp"); case '*': return Builder.CreateFMul(L, R, "multmp"); case ' dump(); return 0; }

输出结果如下:

; ModuleID = 'hello,llvm' source_filename = "hello,llvm" 如何链接LLVM的库

使用LLVM库的话,需要一大堆参数.下面是在我的电脑上的参数:

-I/Users/ziyingliuziying/lusing/llvm/llvm/include -I/Users/ziyingliuziying/lusing/llvm/llvm/build/include -fPIC -fvisibility-inlines-hidden -Wall -W -Wno-unused-parameter -Wwrite-strings -Wcast-qual -Wmissing-field-initializers -pedantic -Wno-long-long -Wcovered-switch-default -Wnon-virtual-dtor -Wdelete-non-virtual-dtor -Werror=date-time -std=c++11 -fcolor-diagnostics -fno-exceptions -fno-rtti -D__STDC_CONSTANT_MACROS -D__STDC_FORMAT_MACROS -D__STDC_LIMIT_MACROS -L/Users/ziyingliuziying/lusing/llvm/llvm/build/lib -Wl,-search_paths_first -Wl,-headerpad_max_install_names -lLLVMCore -lLLVMSupport -lcurses -lz -lm

每次都这么写吓死人了啊。于是LLVM为我们提供了llvm-config工具。刚才我那一大串,是用下面的命令行生成的:

llvm-config --cxxflags --ldflags --system-libs --libs core

完整的编译命令可以这么写:

clang++ -g toy.cpp `llvm-config --cxxflags --ldflags --system-libs --libs core` -o toy


【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有