[006] 了解 Roslyn 编译器
維基百科對編譯器的解釋是:編譯器是一種程序,它將某種編程語言編寫的源代碼(原始語言)轉換成另一種編程語言(目標語言)。編譯是從源代碼(通常為高階語言)到能直接被計算機或虛擬機執行的目標代碼(通常為低階語言或機器語言)的翻譯過程。
在 .NET 平臺中,在執行模型的不同階段有兩個不同的編譯器:一個叫 Roslyn 編譯器,負責把 C# 和 VB 代碼編譯為程序集;另一個叫 RyuJIT 編譯器,負責把程序集中的 IL(中間語言) 代碼編譯為機器碼。
本文先介紹 Roslyn 編譯器。我們不必深入研究它的工作原理,但要了解它的工作機制,要知道它可以用來做什么事情。
最初 C# 語言的編譯器是用 C++ 編寫的,后來微軟推出了一個新的用 C# 自身編寫的編譯器:Roslyn,它屬于自舉編譯器。
所謂自舉編譯器就是指,某種編程語言的編譯器就是用該語言自身來編寫的。自舉編譯器的每個版本都是用該版本之前的版本來編譯的,但它的第一個版本必須由其它語言編寫的編譯器來編譯,比如 Roslyn 的第一個版本是由 C++ 編寫的編譯器來編譯的。很多編程語言發展成熟后都會用該語言本身來編寫自己的編譯器,比如 C# 和 Go 語言。
在 .NET 平臺,Roslyn 編譯器負責將 C# 和 VB 代碼編譯為程序集。
大多數現有的傳統編譯器都是“黑盒”模式,它們將源代碼轉換成可執行文件或庫文件,中間發生了什么我們無法知道。與之不同的是,Roslyn 允許你通過 API 訪問代碼編譯過程中的每個階段。
它的工作機制是管道式的,整個工作管道包含四個階段,每個階段都是一個獨立的模塊,每個模塊都提供了相應的 API。集成開發環境(IDE)可以利用這些 API 提供方便的工具以提高開發效率,如代碼高亮、智能提示、重構工具、性能分析工具等。此外,通過 Roslyn,開發者可以在自己的程序中使用編譯器,將編譯器作為一種服務來使用。
下圖描繪了 Roslyn 工作管道的各個階段和各階段對應的 API,以及各 API 可為 IDE 提供的對應功能:
來源:bit.ly/3AKnWybParser(解析)階段,根據語言語法對源代碼進行解析,將源代碼轉換為層次化的標記集合,形成語法樹。語法樹 API 用于在源代碼編輯器中格式化、著色和代碼大綱。
Declaration(聲明)階段,分析所有引用和導入的元數據,形成層次化的符號表。在編輯器和對象瀏覽器中的 Navigation To 特性使用這個 API。
Bind(綁定)階段,對標記集合和符號表進行匹配。編輯器中的 Find All References、Rename、Quick Info 和 Extract Method 等特性使用這個 API。
Emit(生成)階段,生成 IL 托管模塊,將一個或多個 IL 托管模塊和嵌入資源合并成程序集。編輯器中的 Edit and Continue 利用這個特性完成一次新的編譯。
Roslyn 是少數幾個讓你有機會觀察所有編譯階段和中間結果的編譯器之一,它提供的這些 API 可以為語言服務實現豐富的功能。例如,代碼高亮使用語法樹,對象瀏覽器使用分層符號表。
下面我們來做一個簡單的示例,利用 Roslyn 提供的 API 來動態生成代碼。
創建一個控制臺應用程序 ConsoleApp,編輯 Program.cs 的代碼如下:
using System;namespace?ConsoleApp {partial?class?Program{static?void?Main(string[] args){HelloFrom("Generated Code");Console.ReadKey();}static?partial?void?HelloFrom(string name);} }再創建一個 .NET Standard 類庫,取名 MyGenerator,并添加兩個 NuGet 包,項目文件內容如下:
<Project?Sdk="Microsoft.NET.Sdk"><PropertyGroup><TargetFramework>netstandard2.0</TargetFramework></PropertyGroup><ItemGroup><PackageReference?Include="Microsoft.CodeAnalysis.Analyzers"?Version="3.3.2" /><PackageReference?Include="Microsoft.CodeAnalysis.CSharp"?Version="3.10.0" /></ItemGroup></Project>然后在 MyGenerator 項目中添加一個 Generator.cs 文件,代碼如下:
using Microsoft.CodeAnalysis;namespace?MyGenerator {[Generator]public?class?Generator : ISourceGenerator{public?void?Initialize(GeneratorInitializationContext context){}public?void?Execute(GeneratorExecutionContext context){// find the main methodvar mainMethod = context.Compilation.GetEntryPoint(context.CancellationToken);// build up the source codestring source = $@" using System;namespace {mainMethod.ContainingNamespace.Name} {{public static partial class {mainMethod.ContainingType.Name}{{static partial void HelloFrom(string name){{Console.WriteLine($""Generator says: Hi from '{{name}}'"");}}}} }} ";// add the source code to the compilationcontext.AddSource("generatedSource", source);}} }這里的 source 是我們的動態組裝的代碼,在實際應用中還可以從數據庫或文本中讀取代碼片段。
最后在 ConsoleApp 項目中引用 MyGenerator 類庫,并參照如下代碼設置 OutputItemType 和 ReferenceOutputAssembly 屬性:
<ItemGroup><ProjectReference?Include="..\MyGenerator\MyGenerator.csproj"OutputItemType="Analyzer"ReferenceOutputAssembly="false" /></ItemGroup>運行 ConsoleApp,可以看到控制臺輸出如下內容:
Roslyn 的功能非常強大,這個示例只是演示了 Roslyn 的一個非常簡單的功能和用途。
Roslyn 不只是一個編譯器,還是一個現成的框架,它使得在 .NET 平臺上創建自己的語言服務變得更加容易。你可以使用 Roslyn 編譯器的 API 在 .NET 平臺上開發一個完整的應用程序,甚至創建你自己的 IDE、編寫你自己的編譯器、解釋器或分析器來編譯和運行你自己的編程語言。
加入我們,一起踏上.NET大牛成長之路↓
總結
以上是生活随笔為你收集整理的[006] 了解 Roslyn 编译器的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: C# 对接微信支付时生成符合 RFC33
- 下一篇: [007] 详解 .NET 程序集