我来自Java背景,已经开始使用C++中的对象。但我想到的一件事是,人们经常使用指向对象的指针,而不是对象本身,例如这样的声明:

Object *myObject = new Object;

而不是:

Object myObject;

或者不用函数,让我们说testFunc(),如下所示:

myObject.testFunc();

我们必须写下:

myObject->testFunc();

但我不明白我们为什么要这样做。我认为这与效率和速度有关,因为我们可以直接访问内存地址。我说得对吗?


当前回答

在C++中,堆栈上分配的对象(使用Object对象;块内的语句)将只存在于声明的范围内。当代码块完成执行时,声明的对象将被销毁。而如果使用Object*obj=new Object()在堆上分配内存,则它们将继续驻留在堆中,直到调用delete obj。

如果我想在堆上创建一个对象,而不仅仅是在声明/分配该对象的代码块中使用该对象。

其他回答

前言

Java与C++完全不同,这与大肆宣传相反。Java炒作机器希望您相信,因为Java具有类似C++的语法,所以语言是相似的。没有什么比事实更离谱了。这种错误信息是Java程序员在不理解代码含义的情况下使用C++并使用类似Java的语法的部分原因。

我们继续前进

但我不明白我们为什么要这样做。我想是吧与效率和速度有关,因为我们可以直接访问存储器地址。我说得对吗?

事实上恰恰相反。堆比堆栈慢得多,因为与堆相比,堆栈非常简单。自动存储变量(也称为堆栈变量)一旦超出作用域,就会调用其析构函数。例如:

{
    std::string s;
}
// s is destroyed here

另一方面,如果使用动态分配的指针,则必须手动调用其析构函数。delete为您调用这个析构函数。

{
    std::string* s = new std::string;
    delete s; // destructor called
}

这与C#和Java中流行的新语法无关。它们用于完全不同的目的。

动态分配的好处

1.您不必事先知道阵列的大小

许多C++程序员首先遇到的问题之一是,当他们接受用户的任意输入时,只能为堆栈变量分配固定大小。也不能更改数组的大小。例如:

char buffer[100];
std::cin >> buffer;
// bad input = buffer overflow

当然,如果改用std::string,std::字符串会在内部调整自身大小,这样就不会有问题。但本质上解决这个问题的方法是动态分配。您可以根据用户的输入分配动态内存,例如:

int * pointer;
std::cout << "How many items do you need?";
std::cin >> n;
pointer = new int[n];

附带说明:许多初学者犯的一个错误是可变长度数组。这是GNU扩展,也是Clang中的一个扩展因为它们反映了GCC的许多扩展。因此,以下内容不应依赖int arr[n]。

因为堆比堆栈大得多,所以可以任意分配/重新分配所需的内存,而堆栈有限制。

2.数组不是指针

你问这是什么好处?一旦您了解了数组和指针背后的困惑/迷思,答案就会变得清晰。人们通常认为它们是相同的,但事实并非如此。这个神话来自这样一个事实,即指针可以像数组一样下标,因为数组在函数声明中会衰减到顶层的指针。然而,一旦数组衰减为指针,指针就会丢失其大小信息。因此sizeof(指针)将以字节为单位给出指针的大小,在64位系统中通常为8字节。

不能分配给数组,只能初始化它们。例如:

int arr[5] = {1, 2, 3, 4, 5}; // initialization 
int arr[] = {1, 2, 3, 4, 5}; // The standard dictates that the size of the array
                             // be given by the amount of members in the initializer  
arr = { 1, 2, 3, 4, 5 }; // ERROR

另一方面,你可以用指针做任何你想做的事情。不幸的是,因为指针和数组之间的区别在Java和C#中是手动的,所以初学者不理解它们之间的区别。

3.多态性

Java和C#具有允许您将对象视为另一个对象的功能,例如使用as关键字。因此,如果有人想将实体对象视为Player对象,可以执行Playerplayer=EntityasPlayer;如果您打算在仅应应用于特定类型的同构容器上调用函数,这非常有用。功能可通过以下类似方式实现:

std::vector<Base*> vector;
vector.push_back(&square);
vector.push_back(&triangle);
for (auto& e : vector)
{
     auto test = dynamic_cast<Triangle*>(e); // I only care about triangles
     if (!test) // not a triangle
        e.GenericFunction();
     else
        e.TriangleOnlyMagic();
}

所以,假设只有Triangles有一个Rotate函数,那么如果您试图在类的所有对象上调用它,那么这将是一个编译器错误。使用dynamic_cast,可以模拟as关键字。要明确的是,如果强制转换失败,它将返回一个无效的指针。所以test本质上是检查测试是否为NULL或无效指针的简写,这意味着强制转换失败。

自动变量的优点

在看到了动态分配可以做的所有伟大的事情之后,您可能会想为什么没有人不一直使用动态分配?我已经告诉过你一个原因,堆很慢。如果你不需要所有的记忆,你就不应该滥用它。所以这里有一些不按特定顺序排列的缺点:

它容易出错。手动分配内存是危险的,并且容易发生泄漏。如果你不熟练使用调试器或valgrind(一种内存泄漏工具),你可能会抓狂。幸运的是,RAII习语和智能指针稍微缓解了这一点,但您必须熟悉诸如“三法则”和“五法则”之类的实践。这是一个需要学习的大量信息,初学者如果不知道或者不在乎,就会陷入这个陷阱。这是没有必要的。与Java和C#不同,在C++中,到处使用新关键字是一种习惯,只有在需要的时候才应该使用它。当初学者开始使用C++时,他们害怕指针,并习惯性地学习使用堆栈变量,而Java和C#程序员开始使用指针时却不懂它!这实际上是踩错了脚。你必须放弃你所知道的一切,因为语法是一回事,学习语言是另一回事。

1.(N)RVO-Aka,(命名)返回值优化

许多编译器进行的一种优化是省略和返回值优化。这些东西可以避免不必要的复制,这对于非常大的对象(例如包含许多元素的向量)非常有用。通常,通常的做法是使用指针来转移所有权,而不是复制大型对象来移动它们。这导致了移动语义和智能指针的出现。

如果使用指针,则不会发生(N)RVO。如果您担心优化,那么利用(N)RVO而不是返回或传递指针会更有益,也更不容易出错。如果函数的调用方负责删除动态分配的对象等,则可能发生错误泄漏。如果指针像烫手山芋一样四处传递,则很难跟踪对象的所有权。只需使用堆栈变量,因为它更简单、更好。

使用指针的另一个好理由是用于前向声明。在一个足够大的项目中,它们确实可以加快编译时间。

但我不明白为什么我们要这样使用它?

如果您使用:

Object myObject;

在函数内部,此函数返回后,myObject将被销毁。因此,如果您不需要函数外的对象,这很有用。此对象将放在当前线程堆栈上。

如果在函数体内部写入:

 Object *myObject = new Object;

那么,一旦函数结束,myObject指向的Object类实例将不会被销毁,并且分配在堆上。

现在,如果您是Java程序员,那么第二个示例更接近于对象分配在Java下的工作方式。此行:Object*myObject=new Object;等效于java:Object myObject=new Object();。不同的是,在javamyObject下,它将被垃圾收集,而在c++下,它不会被释放,您必须在某处显式调用“delete myObject;”否则会导致内存泄漏。

自从c++11以来,您可以通过在shared_ptr/unique_ptr中存储值来使用安全的动态分配方式:新对象。

std::shared_ptr<std::string> safe_str = make_shared<std::string>("make_shared");

// since c++14
std::unique_ptr<std::string> safe_str = make_unique<std::string>("make_shared"); 

此外,对象通常存储在容器中,如map-s或vector-s,它们将自动管理对象的生命周期。

“需要是发明之母。”我想指出的最重要的区别是我自己编码经验的结果。有时需要将对象传递给函数。在这种情况下,如果您的对象是一个非常大的类,那么将其作为对象传递将复制其状态(您可能不希望..AND可以是big OVERHEAD),从而导致复制对象的开销。而指针是固定的4字节大小(假设为32位)。上面已经提到了其他原因。。。

C++提供了三种传递对象的方法:通过指针、引用和值。Java限制您使用后一种类型(唯一的例外是int、boolean等原始类型)。如果你想使用C++而不仅仅是一个奇怪的玩具,那么你最好了解这三种方式之间的区别。

Java假装不存在“谁和什么时候应该销毁这个?”这样的问题。答案是:《垃圾收集器》,棒极了。然而,它不能提供100%的内存泄漏保护(是的,java可以泄漏内存)。实际上,GC给你一种错误的安全感。你的SUV越大,离撤离者的距离就越长。

C++让您面对面地了解对象的生命周期管理。好吧,有一些方法可以解决这个问题(智能指针家族、Qt中的QObject等等),但它们都不能像GC那样以“火即忘”的方式使用:您应该始终记住内存处理。你不仅应该关心破坏一个物体,还必须避免多次破坏同一个物体。

还不害怕吗?好的:循环引用——你自己处理,人类。记住:每一个对象都要被精确地杀死一次,我们C++运行时不喜欢那些处理尸体的人,只留下死去的人。

所以,回到你的问题。

当您通过值(而不是指针或引用)传递对象时,每次执行“=”操作时,都会复制对象(整个对象,无论是几个字节还是一个巨大的数据库转储-您足够聪明,可以避免后者,不是吗?)。要访问对象的成员,请使用“”(点)。

当通过指针传递对象时,只复制几个字节(32位系统为4个,64位系统为8个),即该对象的地址。为了向所有人展示这一点,当您访问成员时,可以使用这个花哨的“->”运算符。或者可以使用“*”和“.”的组合。

当你使用引用时,你会得到一个伪装成值的指针。这是一个指针,但您可以通过“.”访问成员。

还有,再一次让你大跌眼镜:当你声明几个用逗号分隔的变量时,然后(注意指针):

每个人都有类型值/指针/引用修饰符是单独的

例子:

struct MyStruct
{
    int* someIntPointer, someInt; //here comes the surprise
    MyStruct *somePointer;
    MyStruct &someReference;
};

MyStruct s1; //we allocated an object on stack, not in heap

s1.someInt = 1; //someInt is of type 'int', not 'int*' - value/pointer modifier is individual
s1.someIntPointer = &s1.someInt;
*s1.someIntPointer = 2; //now s1.someInt has value '2'
s1.somePointer = &s1;
s1.someReference = s1; //note there is no '&' operator: reference tries to look like value
s1.somePointer->someInt = 3; //now s1.someInt has value '3'
*(s1.somePointer).someInt = 3; //same as above line
*s1.somePointer->someIntPointer = 4; //now s1.someInt has value '4'

s1.someReference.someInt = 5; //now s1.someInt has value '5'
                              //although someReference is not value, it's members are accessed through '.'

MyStruct s2 = s1; //'NO WAY' the compiler will say. Go define your '=' operator and come back.

//OK, assume we have '=' defined in MyStruct

s2.someInt = 0; //s2.someInt == 0, but s1.someInt is still 5 - it's two completely different objects, not the references to the same one