是使用各有一个模式的多个数据库更好，还是使用一个数据库有多个模式更好?

在对我的一个问题进行了评论之后，我在想是否使用X模式的数据库更好，反之亦然。

我正在开发一个web应用程序，当人们注册时，我创建(实际上)一个数据库(不，这不是一个社交网络:每个人都必须访问自己的数据，永远不会看到其他用户的数据)。这就是我在我的应用程序的前一个版本(仍然在MySQL上运行)中使用的方式:通过Plesk API，对于每个注册，我做:

创建权限有限的数据库用户; 创建一个只能由之前创建的用户和超级用户访问的数据库(用于维护) 填充数据库

现在，我需要对PostgreSQL做同样的事情(项目越来越成熟，MySQL不能满足所有的需求)。我需要让所有数据库/模式备份独立:pg_dump在两种方式下都能完美工作，对于可以配置为只访问一个模式或一个数据库的用户也是如此。

那么，假设你是比我更有经验的PostgreSQL用户，你认为对我的情况最好的解决方案是什么，为什么?使用$x数据库而不是$x模式会有性能差异吗?将来维护哪种解决方案(可靠性)更好?我的所有数据库/模式总是具有相同的结构!

对于备份问题(使用pg_dump)，可能更好的方法是使用一个数据库和多个模式，一次性转储所有模式:恢复将非常简单，在开发机器中加载主转储，然后转储和恢复所需的模式:有一个额外的步骤，但转储所有模式似乎比逐个转储更快。

更新2012

在过去的两年里，应用程序的结构和设计发生了很大的变化。我仍然使用“一个数据库与多个模式”的方法，但仍然，我的应用程序的每个版本都有一个数据库:

Db myapp_01
    \_ my_customer_foo_schema
    \_ my_customer_bar_schema
Db myapp_02
    \_ my_customer_foo_schema
    \_ my_customer_bar_schema

对于备份，我定期转储每个数据库，然后将备份移动到开发服务器上。我还使用了PITR/WAL备份，但是，正如我前面所说的，我不太可能必须一次恢复所有数据库。所以今年它可能会被取消(在我的情况下，这不是最好的方法)。

从现在起，即使应用程序结构完全改变，单数据库多模式方法也非常适合我。我几乎忘了:我所有的数据库/模式总是具有相同的结构!现在，每个模式都有自己的结构，可以根据用户数据流动态变化。

当前回答

我会说，使用多个数据库和多个模式:)

PostgreSQL中的模式很像Oracle中的包，如果你熟悉它们的话。数据库用于区分整个数据集，而模式更像是数据实体。

例如，您可以为整个应用程序拥有一个数据库，其模式为“UserManagement”、“LongTermStorage”等等。“UserManagement”将包含“User”表，以及用户管理所需的所有存储过程、触发器、序列等。

数据库是整个程序，模式是组件。

其他回答

在PostgreSQL上下文中，我建议使用一个数据库与多个模式，因为你可以(例如)跨模式的UNION ALL，但不能跨数据库。因此，一个数据库实际上完全与另一个数据库隔离，而模式与同一数据库中的其他模式并没有隔离。

如果您(出于某种原因)将来必须跨模式合并数据，那么在多个模式上这样做将很容易。对于多个数据库，您将需要多个数据库连接，并根据应用程序逻辑“手动”收集和合并来自每个数据库的数据。

后者在某些情况下具有优势，但在主要情况下，我认为单数据库多模式方法更有用。

PostgreSQL的“模式”与MySQL的“数据库”大致相同。在PostgreSQL上安装许多数据库可能会出现问题;拥有许多模式可以毫无困难地工作。因此，您肯定希望使用一个数据库，并在该数据库中使用多个模式。

这取决于如何设计系统的可用性和连接性。存储在这些数据库中的数据是什么?如果它们是链接的数据，它们可以保存在单个DB实例上，但如果它们是部分链接的，并且可以在一个系统宕机时部分运行，那么它必须在不同的实例上。

详细解释:

1)当你使用一个数据库实例，你使用多个数据库，然后你会遇到这样的问题，如果你的连接宕机(由于系统崩溃或mysql服务器宕机)，所有的数据库，因为他们在同一个实例也宕机，所以你所有的应用程序都会受到影响。

2)当你为每个数据库分离DB实例时，如果任何一个数据库系统宕机，你的其他应用程序不会受到影响。因此，其他应用程序只能运行依赖于down DB的应用程序。

此外，在这两种情况下，我认为你还必须使用复制机制，以便负载平衡可以在从数据库上完成。

许多模式应该比许多数据库更轻量级，尽管我找不到证实这一点的参考文献。

但是如果你真的想让事情非常独立(而不是重构web应用程序，让一个“customer”列添加到你的表中)，你可能仍然想使用单独的数据库:我断言，你可以更容易地恢复一个特定客户的数据库——而不打扰其他客户。

我会说，使用多个数据库和多个模式:)

PostgreSQL中的模式很像Oracle中的包，如果你熟悉它们的话。数据库用于区分整个数据集，而模式更像是数据实体。

数据库是整个程序，模式是组件。

推荐文章