Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

字面量表达式

Syntax
LiteralExpression
      CHAR_LITERAL
    | STRING_LITERAL
    | RAW_STRING_LITERAL
    | BYTE_LITERAL
    | BYTE_STRING_LITERAL
    | RAW_BYTE_STRING_LITERAL
    | C_STRING_LITERAL
    | RAW_C_STRING_LITERAL
    | INTEGER_LITERAL
    | FLOAT_LITERAL
    | true
    | false

字面量表达式 是由单个 词法单元 组成的表达式,而不是一系列 词法单元 ,它立即并直接地表示它所求得的值,而不是通过名称或其他求值规则来引用它。

字面量是 常量表达式 的一种形式,因此(主要)在编译时求值。

前面描述的每种词法 字面量 形式都可以构成字面量表达式,关键字 truefalse 也是如此。

#![allow(unused)]
fn main() {
"hello";   // 字符串类型
'5';       // 字符类型
5;         // 整数类型
}

在下面的描述中, 词法单元 的 字符串表示 是指输入中与 词法分析器 语法片段中的 词法单元 生成式匹配的字符序列。

注意

此字符串表示永远不会包含紧跟在 U+000D (CR) 之后的字符 U+000A (LF): 这对字符之前会被转换为单个 U+000A (LF)。

转义

下面对文本字面量表达式的描述使用了几种形式的 转义

每种形式的转义都具有以下特征:

  • 转义序列 : 一个字符序列,总是以 U+005C (\) 开头
  • 转义值 : 单个字符或空字符序列

在下面的转义定义中:

  • 八进制数字 是范围 [0-7] 中的任何字符。
  • 十六进制数字 是范围 [0-9], [a-f], 或 [A-F] 中的任何字符。

简单转义

下表第一列中出现的每个字符序列都是一个转义序列。

在每种情况下,转义值都是第二列相应条目中给出的字符。

转义序列转义值
\0U+0000 (NUL)
\tU+0009 (HT)
\nU+000A (LF)
\rU+000D (CR)
\"U+0022 (QUOTATION MARK)
\'U+0027 (APOSTROPHE)
\\U+005C (REVERSE SOLIDUS)

8位转义

转义序列由 \x 后跟两个十六进制数字组成。

转义值是其 Unicode 标量值 为将转义序列中的最后两个字符解释为十六进制整数的结果的字符,就像通过基数为 16 的 u8::from_str_radix 处理一样。

注意

因此,转义值具有 u8 范围内的 Unicode 标量值

7位转义

转义序列由 \x 后跟一个八进制数字,然后是一个十六进制数字组成。

转义值是其 Unicode 标量值 为将转义序列中的最后两个字符解释为十六进制整数的结果的字符,就像通过基数为 16 的 u8::from_str_radix 处理一样。

Unicode 转义

转义序列由 \u{, 后跟一系列字符(每个字符都是十六进制数字或 _ ), 最后跟 } 组成。

转义值是其 Unicode 标量值 为将转义序列中包含的十六进制数字解释为十六进制整数的结果的字符,就像通过基数为 16 的 u32::from_str_radix 处理一样。

注意

CHAR_LITERALSTRING_LITERAL 词法单元 的允许形式确保存在这样的字符。

字符串续行转义

转义序列由 \ 紧跟 U+000A (LF) 组成,以及在下一个非空白字符之前的所有后续空白字符。 为此,空白字符为 U+0009 (HT), U+000A (LF), U+000D (CR), 和 U+0020 (SPACE)。

转义值是一个空字符序列。

注意

这种形式的转义效果是字符串续行会跳过后续的空白字符,包括额外的换行符。因此 a, bc 是相等的:

#![allow(unused)]
fn main() {
let a = "foobar";
let b = "foo\
         bar";
let c = "foo\

     bar";

assert_eq!(a, b);
assert_eq!(b, c);
}

跳过额外的换行符(如示例 c 所示)可能会令人困惑且出乎意料。此行为将来可能会进行调整。在做出决定之前,建议避免依赖于通过行续行跳过多个换行符。有关更多信息,请参阅 此问题

字符字面量表达式

字符字面量表达式由单个 CHAR_LITERAL 词法单元 组成。

该表达式的类型是原始 char 类型。

词法单元 必须没有后缀。

词法单元 的 字面量内容 是该 词法单元 的字符串表示中第一个 U+0027 (') 之后且最后一个 U+0027 (') 之前的字符序列。

字面量表达式的 表示字符 按如下方式从字面量内容导出:

  • 否则,表示字符是构成字面量内容的单个字符。

该表达式的值是与表示字符的 Unicode 标量值 对应的 char

注意

CHAR_LITERAL 词法单元 的允许形式确保这些规则总是产生单个字符。

字符字面量表达式的示例:

#![allow(unused)]
fn main() {
'R';                               // R
'\'';                              // '
'\x52';                            // R
'\u{00E6}';                        // 拉丁文小写字母 AE (U+00E6)
}

字符串字面量表达式

字符串字面量表达式由单个 STRING_LITERALRAW_STRING_LITERAL 词法单元 组成。

该表达式的类型是向原始 str 类型的共享引用(具有 static 生命周期)。 也就是说,类型是 &'static str

词法单元 必须没有后缀。

词法单元 的 字面量内容 是该 词法单元 的字符串表示中第一个 U+0022 (") 之后且最后一个 U+0022 (") 之前的字符序列。

字面量表达式的 表示字符串 是按如下方式从字面量内容导出的字符序列:

  • 如果 词法单元 是 RAW_STRING_LITERAL ,则表示字符串与字面量内容完全相同。

该表达式的值是一个指向静态分配的 str 的引用,该字符串包含表示字符串的 UTF-8 编码。

字符串字面量表达式的示例:

#![allow(unused)]
fn main() {
"foo"; r"foo";                     // foo
"\"foo\""; r#""foo""#;             // "foo"

"foo #\"# bar";
r##"foo #"# bar"##;                // foo #"# bar

"\x52"; "R"; r"R";                 // R
"\\x52"; r"\x52";                  // \x52
}

字节字面量表达式

字节字面量表达式由单个 BYTE_LITERAL 词法单元 组成。

该表达式的类型是原始 u8 类型。

词法单元 必须没有后缀。

词法单元 的 字面量内容 是该 词法单元 的字符串表示中第一个 U+0027 (') 之后且最后一个 U+0027 (') 之前的字符序列。

字面量表达式的 表示字符 按如下方式从字面量内容导出:

  • 如果字面量内容是以下形式之一的转义序列,则表示字符是该转义序列的转义值:
  • 否则,表示字符是构成字面量内容的单个字符。

该表达式的值是表示字符的 Unicode 标量值

注意

BYTE_LITERAL 词法单元 的允许形式确保这些规则总是产生单个字符,其 Unicode 标量值在 u8 范围内。

字节字面量表达式的示例:

#![allow(unused)]
fn main() {
b'R';                              // 82
b'\'';                             // 39
b'\x52';                           // 82
b'\xA0';                           // 160
}

字节串字面量表达式

字节串字面量表达式由单个 BYTE_STRING_LITERALRAW_BYTE_STRING_LITERAL 词法单元 组成。

该表达式的类型是对一个元素类型为 u8 的数组的共享引用(具有 static 生命周期)。 也就是说,类型是 &'static [u8; N] ,其中 N 是下面描述的表示字符串中的字节数。

词法单元 必须没有后缀。

词法单元 的 字面量内容 是该 词法单元 的字符串表示中第一个 U+0022 (") 之后且最后一个 U+0022 (") 之前的字符序列。

字面量表达式的 表示字符串 是按如下方式从字面量内容导出的字符序列:

  • 如果 词法单元 是 BYTE_STRING_LITERAL ,则字面量内容中出现的以下任何形式的每个转义序列都将被替换为该转义序列的转义值。

    这些替换按从左到右的顺序进行。 例如, 词法单元 b"\\x41" 被转换为字符 \ x 4 1

该表达式的值是一个指向静态分配数组的引用,该数组按相同顺序包含表示字符串中字符的 Unicode 标量值

注意

BYTE_STRING_LITERALRAW_BYTE_STRING_LITERAL 词法单元 的允许形式确保这些规则总是产生 u8 范围内的数组元素值。

字节串字面量表达式的示例:

#![allow(unused)]
fn main() {
b"foo"; br"foo";                     // foo
b"\"foo\""; br#""foo""#;             // "foo"

b"foo #\"# bar";
br##"foo #"# bar"##;                 // foo #"# bar

b"\x52"; b"R"; br"R";                // R
b"\\x52"; br"\x52";                  // \x52
}

C字符串字面量表达式

C 字符串字面量表达式由单个 C_STRING_LITERALRAW_C_STRING_LITERAL 词法单元 组成。

该表达式的类型是对标准库 CStr 类型的共享引用(具有 static 生命周期)。 也就是说,类型是 &'static core::ffi::CStr

词法单元 必须没有后缀。

词法单元 的 字面量内容 是该 词法单元 的字符串表示中第一个 " 之后且最后一个 " 之前的字符序列。

字面量表达式的 表示字节 是按如下方式从字面量内容导出的字节序列:

  • 如果 词法单元 是 RAW_C_STRING_LITERAL ,则表示字节是字面量内容的 UTF-8 编码。

注意

C_STRING_LITERALRAW_C_STRING_LITERAL 词法单元 的允许形式确保表示字节永远不会包含空字节。

该表达式的值是一个指向静态分配的 CStr 的引用,其字节数组包含表示字节,后跟一个空字节。

C 字符串字面量表达式的示例:

#![allow(unused)]
fn main() {
c"foo"; cr"foo";                     // foo
c"\"foo\""; cr#""foo""#;             // "foo"

c"foo #\"# bar";
cr##"foo #"# bar"##;                 // foo #"# bar

c"\x52"; c"R"; cr"R";                // R
c"\\x52"; cr"\x52";                  // \x52

c"æ";                                // 拉丁文小写字母 AE (U+00E6)
c"\u{00E6}";                         // 拉丁文小写字母 AE (U+00E6)
c"\xC3\xA6";                         // 拉丁文小写字母 AE (U+00E6)

c"\xE6".to_bytes();                  // [230]
c"\u{00E6}".to_bytes();              // [195, 166]
}

整数字面量表达式

整数字面量表达式由单个 INTEGER_LITERAL 词法单元 组成。

如果 词法单元 具有 后缀 ,则后缀必须是 原始整数类型 之一的名称: u8, i8, u16, i16, u32, i32, u64, i64, u128, i128, usize, 或 isize ,并且表达式具有该类型。

如果 词法单元 没有后缀,则表达式的类型通过类型推导确定:

  • 如果可以从周围的程序上下文中 唯一 确定整数类型,则该表达式具有该类型。
  • 如果程序上下文对类型的约束不足,则默认为有符号 32 位整数 i32
  • 如果程序上下文对类型的约束过度,则被视为静态类型错误。

整数字面量表达式的示例:

#![allow(unused)]
fn main() {
123;                               // 类型 i32
123i32;                            // 类型 i32
123u32;                            // 类型 u32
123_u32;                           // 类型 u32
let a: u64 = 123;                  // 类型 u64

0xff;                              // 类型 i32
0xff_u8;                           // 类型 u8

0o70;                              // 类型 i32
0o70_i16;                          // 类型 i16

0b1111_1111_1001_0000;             // 类型 i32
0b1111_1111_1001_0000i64;          // 类型 i64

0usize;                            // 类型 usize
}

该表达式的值从 词法单元 的字符串表示中按如下方式确定:

  • 通过检查字符串的前两个字符来选择整数基数,如下所示:

    • 0b 表示基数 2
    • 0o 表示基数 8
    • 0x 表示基数 16
    • 否则基数为 10。
  • 如果基数不是 10,则从字符串中移除前两个字符。
  • 从字符串中移除任何后缀。
  • 从字符串中移除任何下划线。
  • 字符串被转换为 u128 值,就像通过具有所选基数的 u128::from_str_radix 处理一样。 如果值不适合 u128 ,则是编译器错误。
  • u128 值通过 数值强转 转换为表达式的类型。

注意

如果字面量的值不适合表达式的类型,最终的强转将截断该值。 rustc 包含一个名为 overflowing_literalslint 检查 ,默认为 deny ,它会拒绝发生这种情况的表达式。

注意

例如, -1i8求负运算符 对字面量表达式 1i8 的应用,而不是单个整数字面量表达式。有关表示有符号类型的最小负值(绝对值最大)的注意事项,请参阅 溢出

浮点数字面量表达式

浮点数字面量表达式具有以下两种形式之一:

如果 词法单元 具有 后缀 ,则后缀必须是 原始浮点类型 之一的名称: f32f64 ,并且表达式具有该类型。

如果 词法单元 没有后缀,则表达式的类型通过类型推导确定:

  • 如果可以从周围的程序上下文中 唯一 确定浮点类型,则该表达式具有该类型。
  • 如果程序上下文对类型的约束不足,则默认为 f64
  • 如果程序上下文对类型的约束过度,则被视为静态类型错误。

浮点数字面量表达式的示例:

#![allow(unused)]
fn main() {
123.0f64;        // 类型 f64
0.1f64;          // 类型 f64
0.1f32;          // 类型 f32
12E+99_f64;      // 类型 f64
5f32;            // 类型 f32
let x: f64 = 2.; // 类型 f64
}

该表达式的值从 词法单元 的字符串表示中按如下方式确定:

  • 从字符串中移除任何后缀。
  • 从字符串中移除任何下划线。

注意

例如, -1.0求负运算符 对字面量表达式 1.0 的应用,而不是单个浮点数字面量表达式。

注意

infNaN 不是字面量 词法单元 。可以使用 f32::INFINITY, f64::INFINITY, f32::NAN, 和 f64::NAN 常量来代替字面量表达式。在 rustc 中,大到足以被求值为无穷大的字面量将触发 overflowing_literals lint 检查。

布尔字面量表达式

布尔字面量表达式由关键字 truefalse 之一组成。

该表达式的类型是原始 布尔类型 ,其值为:

  • 如果关键字是 true ,则为 true
  • 如果关键字是 false ,则为 false