关于数据库，每个开发人员应该知道些什么?

不管我们喜欢与否，我们开发人员中的许多人(如果不是大多数的话)都经常使用数据库，或者有一天可能不得不使用数据库。考虑到大量的误用和滥用，以及每天出现的大量与数据库相关的问题，公平地说，有一些概念是开发人员应该知道的——即使他们今天不设计或使用数据库。

关于数据库，开发人员和其他软件专业人员应该知道的一个重要概念是什么?

当前回答

我认为每个开发人员都应该理解数据库需要不同的范例。

在编写查询以获取数据时，需要一种基于集的方法。许多具有交互背景的人对此感到困惑。然而，当他们接受它时，他们可以获得更好的结果，即使解决方案可能不是第一次出现在他们以迭代为中心的思想中的解决方案。

其他回答

基本的索引

当看到一个表或整个数据库没有索引，或者索引是任意的/无用的时，我总是感到震惊。即使你不是在设计数据库，只是需要编写一些查询，至少理解以下内容仍然是至关重要的:

数据库中索引了什么，没有索引什么: 扫描类型之间的差异，它们是如何选择的，以及您编写查询的方式如何影响这种选择; 覆盖率的概念(为什么你不应该只写SELECT *); 聚类索引和非聚类索引之间的区别; 为什么更多/更大的指数不一定更好; 为什么应该尽量避免在函数中包装筛选器列。

设计人员还应该注意常见的索引反模式，例如:

Access反模式(逐个索引每一列) Catch-All反模式(在所有或大多数列上建立一个大型索引，显然是在错误的印象中创建的，认为它会加速涉及这些列的所有可以想象的查询)。

数据库索引的质量——以及您在编写查询时是否利用了它——是迄今为止最重要的性能部分。在SO和其他论坛上发布的抱怨性能不佳的问题中，10个问题中有9个总是被证明是由于索引不好或表达式不sargable。

我只是想指出一个观察结果——似乎大多数的回答都假设数据库与关系数据库是可以互换的。还有对象数据库，平面文件数据库。评估当前软件项目的需求是很重要的。从程序员的角度来看，数据库决策可以推迟到以后。另一方面，数据建模可以在早期实现，并带来很大的成功。

我认为数据建模是一个关键组件，是一个相对较老的概念，但它已经被软件行业中的许多人遗忘了。数据建模，尤其是概念建模，可以揭示系统的功能行为，并可作为开发的路线图。

另一方面，所需的数据库类型可以根据许多不同的因素来确定，包括环境、用户数量和可用的本地硬件(如硬盘空间)。

三件事是一个神奇的数字:

数据库也需要版本控制。游标很慢，您可能不需要它们。触发器是邪恶的*

*几乎总是

归一化

我总是很沮丧地看到有人努力编写一个过度复杂的查询，而这个查询用标准化的设计可以完全简单明了(“显示每个地区的总销售额。”)。

如果您在一开始就理解了这一点，并相应地进行设计，您将在以后为自己省去许多痛苦。在规范化之后，很容易对性能进行反规范化;要规范化一个从一开始就不是这样设计的数据库并不容易。

至少，您应该知道3NF是什么以及如何实现它。对于大多数事务性数据库，这是使查询易于编写和保持良好性能之间的一个很好的平衡。

我希望每个人，包括dba和开发人员/设计人员/架构师，都能更好地理解如何正确地对业务领域建模，以及如何将业务领域模型映射/转换为规范化的数据库逻辑模型、优化的物理模型和适当的面向对象类模型(每种模型由于各种原因(可能)不同)，并理解何时、为什么以及它们(或应该)如何彼此不同。

推荐文章