根据操作系统的不同,在哪里可以找到文件名中允许的字符列表? (例如,在Linux中,字符:被允许出现在文件名中,但在Windows中不允许)


当前回答

你应该从Wikipedia文件名页面开始。它有一个相当大的表(文件名限制的比较),列出了相当多文件系统的保留字符。

它还拥有关于每个文件系统的大量其他信息,包括保留文件名,例如MS-DOS下的CON。我之所以提到这一点,只是因为有一次我把一个包含文件从conn .h缩短为con.h,并花了半个小时弄清楚为什么编译器挂起。

事实证明DOS忽略了设备的扩展名,因此con.h与con(输入控制台)完全相同(当然,这意味着编译器在继续之前会等我输入头文件)。

其他回答

你应该从Wikipedia文件名页面开始。它有一个相当大的表(文件名限制的比较),列出了相当多文件系统的保留字符。

它还拥有关于每个文件系统的大量其他信息,包括保留文件名,例如MS-DOS下的CON。我之所以提到这一点,只是因为有一次我把一个包含文件从conn .h缩短为con.h,并花了半个小时弄清楚为什么编译器挂起。

事实证明DOS忽略了设备的扩展名,因此con.h与con(输入控制台)完全相同(当然,这意味着编译器在继续之前会等我输入头文件)。

与其试图识别所有不需要的字符, 除了可接受的字符,你可以寻找任何东西。这里有一个正则表达式,用于除posix字符以外的任何字符: Cleaned_name = re.sub(r'[^[:alnum:]。_-]', ", name)

对于“English locale”文件名,这很有效。我用这个来消毒上传的文件名。文件名并不意味着要链接到磁盘上的任何东西,它是在文件下载时使用的,因此没有路径检查。

$file_name = preg_replace('/([^\x20-~]+)|([\\/:?"<>|]+)/g', '_', $client_specified_file_name);

基本上,它会删除Windows和其他操作系统中所有不可打印和保留的字符。您可以轻松地扩展该模式以支持其他地区和功能。

更准确地说,MacOS X(现在称为MacOS) / in the Finder被解释为:在Unix文件系统中。

这样做是为了向后兼容苹果从经典Mac操作系统。

在Finder中的文件名中使用/是合法的,在终端中查看相同的文件时,它将显示一个:。

它也可以用另一种方式工作:你不能在终端的文件名中使用/,但是a:是可以的,并且会在Finder中显示为/。

有些应用程序可能会更加严格,禁止使用这两个字符,以避免混淆,或者因为它们保留了以前经典Mac OS的逻辑,或者为了平台之间的名称兼容性。

我采取了不同的方法。我不检查字符串是否只包含有效字符,而是查找无效/非法字符。

注意:我需要验证一个路径字符串,而不是一个文件名。但是如果您需要检查文件名,只需将/添加到该集合。

def check_path_validity(path: str) -> bool:
    # Check for invalid characters
    for char in set('\?%*:|"<>'):
        if char in path:
            print(f"Illegal character {char} found in path")
            return False
    return True