为什么Rust有String和str?String和str之间有什么区别?什么时候使用String而不是str,反之亦然?其中一个被弃用了吗?
当前回答
这里有一个简单快捷的解释。
字符串-可增长的、可拥有的堆分配数据结构。它可以强制为&str。
str是(现在,随着Rust的发展)可变的固定长度字符串,存在于堆或二进制文件中。只能通过字符串切片视图(如&str)将str作为借用类型进行交互。
使用注意事项:
如果您想拥有或变异字符串,请首选字符串,例如将字符串传递给另一个线程等。
如果希望字符串的只读视图,请首选&str。
其他回答
这里有一个简单快捷的解释。
字符串-可增长的、可拥有的堆分配数据结构。它可以强制为&str。
str是(现在,随着Rust的发展)可变的固定长度字符串,存在于堆或二进制文件中。只能通过字符串切片视图(如&str)将str作为借用类型进行交互。
使用注意事项:
如果您想拥有或变异字符串,请首选字符串,例如将字符串传递给另一个线程等。
如果希望字符串的只读视图,请首选&str。
简单地说,String是存储在堆上的数据类型(就像Vec一样),您可以访问该位置。
&str是一种切片类型。这意味着它只是对堆中某个已经存在的String的引用。
&str在运行时不进行任何分配。因此,出于内存原因,可以在字符串上使用&str。但是,请记住,在使用&str时,您可能需要处理显式的生存期。
它们实际上完全不同。首先,str只是一个类型级别的东西;它只能在类型级别进行推理,因为它是所谓的动态大小类型(DST)。str所占的大小在编译时无法得知,并且取决于运行时信息-它不能存储在变量中,因为编译器需要在编译时知道每个变量的大小。str在概念上只是一行u8字节,并保证它形成有效的UTF-8。这排有多大?在运行时之前没有人知道,因此它不能存储在变量中。
有趣的是,在运行时确实存在一个&str或任何其他指向str的指针,如Box<str>。这就是所谓的“胖指针”;它是一个带有额外信息的指针(在本例中是指它所指向的对象的大小),因此它的大小是它的两倍。事实上,&str非常接近字符串(但不是&String)。A&str是两个单词;一个指针指向str的第一个字节,另一个数字描述str的长度。
与所说的相反,str不需要是不可变的。如果您可以获取一个&mut str作为str的独占指针,那么您可以对它进行变异,并且所有变异它的安全函数都可以保证支持UTF-8约束,因为如果违反了这一约束,那么我们就有未定义的行为,因为库假定此约束为真,并且不检查它。
那么什么是字符串?这是三个字;两个与&str相同,但它添加了第三个字,即堆上str缓冲区的容量,总是在堆上(str不一定在堆上),它在填充之前管理,并且必须重新分配。String基本上拥有一个str;它控制它,可以调整大小,并在合适时重新分配。因此,正如所说,字符串更接近&str而不是str。
另一件事是Box<str>;它还拥有一个str,其运行时表示形式与&str相同,但它也拥有与&str不同的str,但它无法调整其大小,因为它不知道其容量,所以基本上Box<str>可以被视为一个固定长度的字符串,无法调整大小(如果要调整大小,可以始终将其转换为String)。
[T]和Vec<T>之间存在非常相似的关系,只是没有UTF-8约束,它可以容纳任何大小不是动态的类型。
在类型级别上使用str主要是使用&str;它存在于类型级别,以便能够方便地书写特征。理论上,str作为一种类型的东西不需要存在,只需要&str,但这意味着需要编写很多额外的代码,这些代码现在可以是通用的。
&str非常有用,可以在不复制的情况下拥有一个字符串的多个不同子字符串;正如所说,String拥有它管理的堆上的str,如果您只能用新的String创建String的子字符串,则必须复制它,因为Rust中的所有内容只能有一个所有者来处理内存安全问题。例如,您可以对字符串进行切片:
let string: String = "a string".to_string();
let substring1: &str = &string[1..3];
let substring2: &str = &string[2..4];
我们有两个相同字符串的不同子字符串str。字符串是拥有堆上实际完整str缓冲区的字符串,&str子字符串只是堆上缓冲区的胖指针。
对于C#和Java用户:
Rust‘String==StringBuilderRust的&str==(不可变)字符串
我喜欢将&str视为字符串的视图,就像Java/C#中的一个内部字符串,您不能更改它,只能创建一个新字符串。
std::字符串只是u8的向量。您可以在源代码中找到它的定义。它是堆分配的,可以生长。
#[derive(PartialOrd, Eq, Ord)]
#[stable(feature = "rust1", since = "1.0.0")]
pub struct String {
vec: Vec<u8>,
}
str是一种原始类型,也称为字符串切片。字符串切片具有固定大小。像let test=“hello world”这样的文本字符串具有&‘static str类型。test是对这个静态分配字符串的引用。&str不能被修改,
let mut word = "hello world";
word[0] = 's';
word.push('\n');
str确实具有可变切片&mut str,例如:pub-fn-split_at_mut(&mut自身,mid:usize)->(&mut字符串,&mut字符串)
let mut s = "Per Martin-Löf".to_string();
{
let (first, last) = s.split_at_mut(3);
first.make_ascii_uppercase();
assert_eq!("PER", first);
assert_eq!(" Martin-Löf", last);
}
assert_eq!("PER Martin-Löf", s);
但是,对UTF-8的一个小改动可以改变它的字节长度,并且一个切片不能重新分配它的引用。
推荐文章
- c#:如何获得一个字符串的第一个字符?
- String类中的什么方法只返回前N个字符?
- 我可以将c#字符串值转换为转义字符串文字吗?
- 如何将字节(u8)的矢量转换为字符串?
- 在c#中解析字符串为日期时间
- 字符串中的单词大写
- string.ToLower()和string.ToLowerInvariant()
- PHP字符串中的花括号
- 为什么不鼓励接受字符串(&String), Vec (&Vec)或盒子(&Box)作为函数参数的引用?
- 如何删除字符串的第一个和最后一个字符
- String, StringBuffer和StringBuilder
- 快速提取正则表达式匹配
- 比较在Java中声明为final的==字符串
- 创建独立变量字典的简单方法?
- 用JavaScript创建一个基于字符串的十六进制颜色