哪些字符可以用来命名JavaScript变量?

我想为工作中的非javascript用户创建一个小型的“扩展库”(当涉及到这种语言时,他们似乎都很拘谨)。我喜欢jQuery和Prototype都使用$ dollar符号,因为我使用jQuery,所以我正在寻找另一个很好的单字符符号来使用。

我意识到我可以只测试一些字符,但我希望缩小字符列表的范围(考虑到未来可能与另一个流行库集成)。


当前回答

JavaScript变量可以有字母、数字、美元符号($)和下划线(_)。不能以数字开头。

通常库使用$和_作为你在任何地方都会用到的函数的快捷方式。虽然名称$或_没有意义,但它们的简短是有用的,因为您将在任何地方使用该函数,因此希望知道它们的含义。

如果你的库不包括让一个函数在任何地方都被使用,我建议你使用更有意义的名称,因为这些名称将帮助你和其他人理解你的代码在做什么,而不必牺牲源代码的美观性。

例如,您可以看看了不起的DateJS库和它所允许的语法糖,而不需要任何符号或短名称变量。

你应该首先让你的代码实用,并且只有在试着让它漂亮之后。

其他回答

据我所知,公认的答案将排除许多有效的标识符。下面是一个符合规范的正则表达式(参见7.6章关于标识符)。使用RegexBuddy创建它,您可以在http://samples.geekality.net/js-identifiers上找到解释的导出。

^[$_\p{L}][$_\p{L}\p{Mn}\p{Mc}\p{Nd}\p{Pc}\u200C\u200D]*+$

且名称不能为以下保留字。

Break, do, instanceof, typeof, case, else, new, var, catch, finally, return, void, continue, for, switch, while, debugger, function, this, with, default, if, throw, delete, in, try, class, enum, extends, super, const, export, import, implements, let, private, public, yield, interface, package, protected, static, null, true, false

JavaScript变量

可以用任意字母、$或_字符作为变量的开头。只要不是以数字开头,你也可以包含数字。

开始:[a-z], $, _

包含:[a-z], [0-9], $, _

jQuery

你可以在你的库中使用_,这样它就可以和jQuery并肩作战了。但是,可以设置一个配置,使jQuery不使用$。它将使用jQuery。要做到这一点,只需设置:

jQuery.noConflict();

本页解释了如何做到这一点。

JavaScript 1.5之前:^[a-zA-Z_$][0-9a-zA-Z_$]*$

在英语中:必须以美元符号、下划线或26个字符中的一个字母开头,大写或小写。后续字符(如果有)可以是这些字符中的任意一个,也可以是十进制数字。

JavaScript 1.5及以后*:^ [\ p {L} \ p{问}$ _][\ p {L} \ p{问}$ \ p {Mn} \ p {Mc} \ p{和}\ p{电脑}]*美元

这在英语中更难以表达,但它在概念上类似于旧的语法,只是字母和数字可以来自任何语言。在第一个字符之后,还允许有额外的类似下划线的字符(统称为“连接符”)和额外的字符组合标记(“修饰符”)。(其他货币符号不包括在这个扩展集。)

JavaScript 1.5及更高版本还允许Unicode转义序列,前提是结果是在上述正则表达式中允许的字符。

标识符也不能是当前的保留字,也不能是将来使用的保留字。

标识符的长度没有实际限制。(浏览器各不相同,但你可以拥有1000个字符,甚至更多数量级。)

字符类别的链接:

字母:Lu, Ll, Lt, Lm, Lo, Nl(在上述正则表达式中合并为“L”) 组合符号(“修饰语”):Mn, Mc 数字:Nd 连接器:电脑


*注意。这个Perl正则表达式仅用于描述语法——它在JavaScript中不起作用,因为JavaScript(目前)还不支持Unicode属性。(有一些第三方软件包声称添加了这种支持。)

我采纳了Anas Nakawa的想法并加以改进。首先,没有理由实际运行被声明的函数。我们想知道它是否正确地解析,而不是代码是否工作。其次,对于我们的目的来说,文字对象是一个比var XXX更好的上下文,因为它更难摆脱。

    function isValidVarName( name ) {
    try {
        return name.indexOf('}') === -1 && eval('(function() { a = {' + name + ':1}; a.' + name + '; var ' + name + '; }); true');
    } catch( e ) {
        return false;
    }
    return true;
}

// so we can see the test code
var _eval = eval;
window.eval = function(s) {
    console.log(s);
    return _eval(s);
}

console.log(isValidVarName('name'));
console.log(isValidVarName('$name'));
console.log(isValidVarName('not a name'));
console.log(isValidVarName('a:2,b'));
console.log(isValidVarName('"a string"'));

console.log(isValidVarName('xss = alert("I\'m in your vars executin mah scrip\'s");;;;;'));
console.log(isValidVarName('_;;;'));
console.log(isValidVarName('_=location="#!?"'));

console.log(isValidVarName('ᾩ'));
console.log(isValidVarName('ĦĔĽĻŎ'));
console.log(isValidVarName('〱〱〱〱'));
console.log(isValidVarName('जावास्क्रिप्ट'));
console.log(isValidVarName('KingGeorgeⅦ'));
console.log(isValidVarName('}; }); alert("I\'m in your vars executin\' mah scripts"); true; // yeah, super valid'));
console.log(isValidVarName('if'));

实际上,ECMAScript在第15页上说: 标识符可以以$、下划线或UnicodeLetter开头,然后继续(就在它下面)指定UnicodeLetter可以是Unicode类别Lo、Ll、Lu、Lt、Lm和Nl中的任何字符。 当你查阅这些分类时,你会发现它提供了比拉丁字母更多的可能性。只要在谷歌中搜索“Unicode类别”,你就可以找到它们。