ECMAScript 双月报告：findLast 提案成功进入到 Stage 4

本次会议中，findLast 提案成功进入到了 Stage 4，这是第二个由中国开发者推动进入到 Stage 4 的提案。另外，较受关注的 String Dedent 与 JSON.parse source text access 等提案也在本次会议中取得了阶段性进展。

Stage 3 → stage 4

从 Stage 3 进入到 Stage 4 有以下几个门槛：

必须编写与所有提案内容对应的 tc39/test262 测试，用于给各大 JavaScript 引擎和 transpiler 等实现检查与标准的兼容程度，并且 test262 已经合入了提案所需要的测试用例；
至少要有两个实现能够兼容上述 Test 262 测试，并发布到正式版本中；
发起了将提案内容合入正式标准文本 tc39/ecma262 的 Pull Request，并被 ECMAScript 编辑签署同意意见。

findFromLast

提案链接：https://tc39.es/proposal-array-find-from-last/index.html

这一提案为数组（Array 与 TypedArray）引入了两个新方法 findLast 与 findLastIndex，来支持从数组的结尾开始查找一个元素，以及它在数组中位于倒数第几项（如 -1、-2）。

我们知道 JavaScript 中 Array.find 方法会返回第一个符合条件的数组成员，如果我们想做的是获取最后一个符合条件的成员（如多次操作中取最后一次操作），就需要复制一个数组，调用 reverse 方法，然后才能进行搜索：

[...[]].reverse().find();

这意味着你需要额外创建一个数组并进行操作。

类似的，Array.findIndex 方法也会返回第一个符合条件的数组成员的索引，如果你希望获得最后一个符合条件成员的索引，也需要进行数组的复制和反转，然后配合数组的长度进行计算：

const arr = [
1, 
2, 
3, 
4];


arr.length - 
1 - [...arr].reverse().findIndex(
i => i % 
2 === 
1); 
// 2
arr.length - 
1 - [...arr].reverse().findIndex(
i => i % 
2 === 
10); 
// 4，错误

在第二处调用中，由于 findIndex 会在没有找到符合条件成员时返回 -1，此时就需要进行额外的处理。

基于此提案引入的方法，你可以使用符合直觉的方式来找到最后一个满足条件的成员：

const arr = [
1, 
2, 
3, 
4];


arr.findLast(
i => i % 
2 === 
1); 
// 3
arr.findLastIndex(
i => i % 
2 === 
1); 
// 2
arr.findLastIndex(
i => i % 
2 === 
10); 
// -1

目前，我们已经可以在 Chrome 97 中使用这些 API 了。另外，现在也可以通过 core-js 和 es-shims 来使用这两个方法。

Stage 2 → Stage 3

提案从 Stage 2 进入到 Stage 3 有以下几个门槛：

撰写了包含提案所有内容的标准文本，并有指定的 TC39 成员审阅并签署了同意意见；
ECMAScript 编辑签署了同意意见。

Symbol as WeakMap Keys

提案链接：https://github.com/tc39/proposal-symbols-as-weakmap-keys

这一提案支持了在 WeakMap 中使用 Symbol 类型作为键，此前 WeakMap 中只允许对象类型作为键。这一特性实际上是为了允许在 Records 与 Tuples 数据类型中引用对象。

Records 与 Tuples 提案为 JavaScript 引入了两个新的数据类型，它们的特性是基于值比较来判断相等性，如对于两个 Tuple 的比较中， #[1, 2,3] === #[1, 2, 3] 是成立的，因为内部的成员值完全一致。然而，这一基于值比较的特性导致了无法在 Record 与 Tuple 中使用基于引用地址比较的对象类型。而如果我们能够在 WeakMap 中使用 Symbol 类型作为键，就可以在 Record 与 Tuple 中使用 Symbol 存放引用，间接地实现对象类型值的存储。

对于 Map 与 WeakMap 的差异，我们知道 Map 类型是通过两个数组来分别存储键和键值的，这两个数组对于其中对象类型键/键值的引用始终存在，从而导致即使已经不存在其它的引用也无法回收处理。因此，WeakMap 持有的引用为弱引用，在对象类型不存在其它引用时，能正确地执行能垃圾回收。

正是因为弱引用的要求，WeakMap 的键是无法枚举的，且需要是唯一的值。对象类型很好地满足了这个要求，两个完全一样的对象类型实际上也拥有着不同的引用。你肯定会想到 Symbol 也具有这种“唯一”的特性，这也是为何此提案想要允许 Symbol 作为 WeakMap 的键。

同时，Symbol 也能够起到比对象类型更好的标识作用：

const weakMap = 
newWeakMap();


const key = 
Symbol(
'ref for data');

const data = { };


weakMap.set(key, data);

在 ECMAScript 中，Symbol 也有多种类型：

Unique Symbol，比如我们通过 Symbol(description) 创建的 Symbol 就是全局唯一的值；
Well-known Symbol，比如 Symbol.iterator，是预知的、在语言特性中广泛使用的 Symbol 值；
Registered Symbol，比如我们通过 Symbol.for(description) 注册的 Symbol，同样也是全局唯一的值，但是每次获取的都是同一个 Symbol 值。

在提案的方案中，Unique Symbol 与 Well-known Symbol 都是可以作为 WeakMap 的键值的，但是 Registered Symbol 不能作为 WeakMap 的键值。这是因为 Registered Symbol 实际上是无法观测到垃圾回收的，而不能观测到垃圾回收的值类型作为 WeakMap Key 没有实际意义。而 Well-known Symbol 虽然也是实际意义上无法被垃圾回收，但是这些 Symbol 是一个确定的列表，无法动态添加删除，所以也被允许作为 WeakMap 键值。

JSON.parse source text access

提案链接：https://github.com/tc39/proposal-json-parse-with-source

JavaScript 中对 JSON 的自定义类型支持一直都不是特别全面，如 JSON.parse 中存在的大数精度丢失问题，以及 JSON.stringify 中无法转换 JSON 中不存在的类型（如函数、Date 等），而 Stringify replacer 的输出会被再次序列化等问题。

// 大数精度丢失
JSON.parse(
" 9999999999999999")

// → 10000000000000000

// reviver 函数的参数中，val 是一个已经被解析过的值，而非原始值
JSON.parse(
" 9999999999999999", (key, val) => BigInt(val))

// → 10000000000000000n

// 前后值不一致
JSON.parse(
JSON.stringify(
newDate(
"2018-09-25T14:00:00Z")))

// → "2018-09-25T14:00:00.000Z"

// 字符串被再次序列化，加上了引号
JSON.stringify(
9999999999999999n, (key, val) => 
String(val))

// → "\"9999999999999999\""

// 无法序列化的值类型会导致报错
JSON.stringify(
9999999999999999n, (key, val) => val)

// → TypeError

为了解决 JSON.parse 中 reviver 函数的 val 参数是已经解析过（parsed）的值这一问题，此提案为 JSON.parse 的 reviver 函数引入了第三个参数 sourceText，以支持在 parse 过程中基于原来的值进行处理：

const tooBigForNumber = BigInt(
Number.MAX_SAFE_INTEGER) + 
2n;

// 第三个参数 source 
const intToBigInt = 
(key, val, {source}) =>typeof val === 
"number" && val % 
1 === 
0 ? BigInt(source) : val;

const roundTripped = 
JSON.parse(
String(tooBigForNumber), intToBigInt);

tooBigForNumber === roundTripped; 
// → true

对于 JSON.stringify 的序列化问题，此提案新增了 JSON.rawJson 方法来在 JSON.stringify 的 replacer 序列化过程中标记已经完成序列化的 JSON 值，而不必被二次序列化：

JSON.stringify(
9999999999999999n, (key, val) => 
JSON.rawJSON(val))

// → "9999999999999999"

Regular Expression Pattern Modifiers for ECMAScript

提案链接：https://github.com/tc39/proposal-regexp-modifiers

我们在使用正则表达式时，可以指定多种执行模式，包含 i（大小写通配），m（多行匹配），s（单行匹配），还有目前同样作为 TC39 提案的 x（增强模式，见对应的提案 RegExp X Mode）。但是这些模式均为全量应用，即只能对整个正则表达式启用，并不能控制只对于其中的某一个部分生效。

为了解决这一问题，RegExp Modifiers 提案为正则表达式引入了子表达式，来实现局部范围内的模式启用与禁用。最初此提案包括 self-bounded 与 unbounded 两种模式，unbounded 模式在 21 年 12 月的 TC39 会议上被移除，目前仅有 self-bounded 模式，即自约束。

自约束（self-bounded）的基础语法为 (?imsx-imsx:subexpression) ，其使用 - 来在子表达式作用域内启用或禁用 flag 对应的模式。如(?-i:A(?i:B)C) 匹配 ABC 与 AbC，但是不能匹配 aBC 或 ABc，其使用示例如下：

// 为 [a-z] 表达式取消大小写通配模式
const re1 = 
/^[a-z](?-i:[a-z])$/i;

re1.test(
"ab"); 
// true
re1.test(
"Ab"); 
// true
re1.test(
"aB"); 
// false

Stage 1 → Stage 2

从 Stage 1 进入到 Stage 2 需要完成撰写包含提案所有内容的标准文本的初稿。

Duplicate named capturing groups

提案链接：https://github.com/tc39/proposal-duplicate-named-capturing-groups

在正则表达式中，我们可以使用捕获组（Capturing Group）来对匹配模式中的某一部分做独立的匹配，如 es+ 会匹配 essss 与 esssss（+ 代表匹配一次或更多），而使用匹配组，我们可以将 es 作为一个匹配部分，如 (es)+ 会匹配 es 以及 eseses 等。

我们也可以对捕获组进行命名，如 ?<name> 这样的形式，常见的一个场景是结合 str.match 方法：

const dateRegexp = 
/(?<year>[0-9]{4})-(?<month>[0-9]{2})-(?<day>[0-9]{2})/;

const str = 
"2022-06-01";


const groups = str.match(dateRegexp).groups;


groups.year; 
// 2022
groups.month; 
// 06
groups.day; 
// 01

每个捕获组的命名都需要是唯一的，这就使得我们无法使用同名捕获组匹配一组联合模式，如日期格式还可能是 06-01-2022，我们希望能这么使用联合模式：

const dateRegexp = 
/(?<year>[0-9]{4})-(?<month>[0-9]{2})-(?<day>[0-9]{2})|(?<day>[0-9]{2})-(?<month>[0-9]{2})-(?<year>[0-9]{4})/;

但由于捕获组的命名唯一约束，上面这个表达式是不合法的。

为了解决这一问题，此提案提出允许捕获组的命名不唯一，以此来支持如上面在联合模式中使用捕获组的场景。

String Dedent

提案链接：https://github.com/tc39/proposal-string-dedent

String dedent 提案在 21 年 9 月的 TC39 会议上从 Stage 0 进入到 Stage 1，它引入了 String.dedent 方法来优化多行模板字符串下的行首空格表现。

举例来说，如果我们希望生成多行顶格的字符串，可能会这么写：

classFoo{

  methodA() {

const foo = 
`create table student(

  id int primary key,

  name text

)`;

return foo;

  }

}

createtable student(

idint primary 
key,

nametext
)

虽然最终结果是正常的，但是这种使用方式会导致代码中与实际结果的字符串格式不一致，在缩进较深的情况下显得尤为怪异。

如果使用 String.dedent 方法，我们可以确保代码中与实际结果的格式一致：


classFoo{

  methodA() {

const foo = 
String.dedent(
`

      create table student(

        id int primary key,

        name text

      )

      `);

return foo;

  }

}

String.dedent 的核心功能就是移除所有非空内容行的公共缩进，同时删除开头、结尾的文字换行符，来使模板字符串的代码与最终结果完全一致。

你也可以通过 Playground 进行更多尝试。

Stage 0 → Stage 1

从 Stage 0 进入到 Stage 1 有以下门槛：

找到一个 TC39 成员作为 champion 负责这个提案的演进；
明确提案需要解决的问题与需求和大致的解决方案；
有问题、解决方案的例子；
对 API 形式、关键算法、语义、实现风险等有讨论、分析。
Stage 1 的提案会有可预见的比较大的改动，以下列出的例子并不代表提案最终会是例子中的语法、语义。

Import Reflection

提案链接：https://github.com/tc39/proposal-import-reflection

此提案的原名为 Evaluator Attributes 提案，在 2021 年 10 月会议上已进入到 Stage 1，本次属于更名的同时进行了提案内容的更新。

Import Reflection 提案为 import 语句支持了使用 as 关键字来声明导入反射属性（元数据）的能力，如：

import x 
from"<specifier>"as"<reflection-type>";

这一标注会改变 import 语句的对于目标模块的执行方式，以此提案的主要驱动场景之一为例，为 WebAssembly 模块指定额外的类型，如实例导入（WebAssembly.Instance）与模块导入(WebAssembly.Module)。

import FooModule 
from"./foo.wasm"as"wasm-module";

FooModule 
instanceof WebAssembly.Module; 
// true

// WASI 是适用于 WebAssembly 的模块化系统调用规范
import { WASI } 
from'wasi';

const wasi = 
new WASI({ args, env, preopens });


// 实例化 WebAssembly 模块，并与 WASI 实现链接
const fooInstance = 
await WebAssembly.instantiate(FooModule, {

wasi_snapshot_preview1: wasi.wasiImport

});


// 执行
wasi.start(fooInstance);

以上示例使用了 wasm-module 作为反射信息，以改变对一个已编译完毕（但尚未链接）的 WebAssembly 模块对象的导入行为。

与另外一个在 import 语法中引入新语法的提案 Import Assertion 对比，其在导入语句中新增了断言语法，使得我们可以将模块断言为指定的类型，来提高引擎对模块导入的处理效率。以派生自 Import Assertion 提案的 JSON Modules 提案为例，其语法大致如下：

import json 
from"./foo.json" assert { 
type: 
"json" };

import(
"foo.json", { 
assert: { 
type: 
"json" } });

对于 Import Assertion，不同的断言并不会影响其解析结果。这也是其与 Import Reflection 的核心差异之一。

Regular Expression Atomic Operators for ECMAScript

提案链接：https://github.com/tc39/proposal-regexp-atomic-operators

这一提案将为 ECMAScript 中的正则表达式引入新的原子操作符（Atomic Operators）支持，包括原子组 ?> 与占有式量词 n*+、n++ 等，来解决正则表达式匹配时的回溯问题。

举例来说，正则表达式 /a(bc|b)c/ 能同时匹配到 abcc 与 abc，在前者中，我们依次匹配 a、bc、c，但对于 abc 的情况则并不完全符合直觉，我们依次匹配 a、bc，由于匹配到 bc 耗尽了字符串的剩余部分，导致剩下的正则表达式 c 无法进行匹配。此时执行会重新回到 (bc|b) 的位置，改为匹配 b，然后才匹配到 c。

也就是说，在这种联合模式匹配时，如果其中的某一种匹配模式会导致整个正则表达式匹配失败，那么实际执行时会重新回溯，尝试切换到另一种匹配模式，以尽可能完成对整个正则表达式的匹配。我们可以使用原子组将原来的表达式改写为 a(?>bc|b)c ，此时如果联合模式中的某一部分成功匹配上了，那么即使在后续执行过程中正则表达式匹配失败，也不会再次回到此联合模式尝试重新匹配。也就是说在这种模式下，abc 将不再会被匹配。

原子组的作用是在联合模式成功匹配时避免后续可能的回溯匹配，而占有式量词则用于在满足某些条件时才阻止回溯匹配，其可以被视为原子组的语法糖。如 atom*+ 等价于 (?>atom*) ，atom++ 等价于 (?>atom+)，atom{n,m}+ 等价于 (?>atom{n,m}) 等。

Faster Promsie Adoption

提案链接：https://github.com/tc39/proposal-faster-promise-adoption

Promise 的优化一直是引擎与 JavaScript 开发者关注的重点问题之一。比如 V8 团队曾经对 await 的标准行为提议了优化，去除了一个多余的 Promise Wrap 即去除了一次多余的异步循环 Tick 以降低 await 行为的损耗。

而这次，同样也是期望降低特定场景下使用 Promise 时的 tick 次数：

const outer = 
newPromise(
res => {

const inner = 
Promise.resolve(
1);

  res(inner);

});


outer.then(log);

比如对于上面这段代码片段，其中 outer 这个 Promise 会需要 2 轮 tick 才能转换为 "resolve" 状态。即当你在 Promise 构造器的 resolve 方法中返回另一个的 Promise inner 时（Promise.resolve(1)），它实际上会在下一个 tick 才调用这个 Promise inner 的 then 方法；然后在再下一个 tick 时将 Promise outer 的状态设置为 "resolve" 状态；再在下一次 tick 时才会执行 Promise outer 的 then 方法。

也就是说，上面这个代码片段相当于：

NEXT_TICK(
() => inner.then(settleOuter));

NEXT_TICK(
() => settleOuter(inner.[[Res]]));

NEXT_TICK(
() => log(outer.[[Res]]));

这在 async/await 已经非常流行的 JavaScript 来说，比如我们经常会写以下代码片段，带来额外 tick 的成本是非常可观的：

// 在 async 函数中返回一个 promise 需要 2 次 tick 才会完成 `direct` 的 resolve。
const direct = 
(async () =>Promise.resolve(
1))();

为了解决这一问题，这一提案提出让一个 promise 可以快速获得另外一个 promise 的状态，而无需额外 tick 周期的方案：

// 如果 inner 是个 Promise，不再需要一次额外的 tick 调用
inner.then(settleOuter);

NEXT_TICK(
() => settleOuter(inner.[[Res]]));

NEXT_TICK(
() => log(outer.[[Res]]));

结语

由贺师俊牵头，阿里巴巴前端标准化小组等多方参与组建的 JavaScript 中文兴趣小组（JSCIG，JavaScript Chinese Interest Group）在 GitHub 上开放讨论各种 ECMAScript 的问题，非常欢迎有兴趣的同学参与讨论：https://github.com/JSCIG/es-discuss/discussions 。

关注「Alibaba F2E」微信公众号把握阿里巴巴前端新动向

继续阅读

阅读原文