在对我的一个问题进行了评论之后,我在想是否使用X模式的数据库更好,反之亦然。
我正在开发一个web应用程序,当人们注册时,我创建(实际上)一个数据库(不,这不是一个社交网络:每个人都必须访问自己的数据,永远不会看到其他用户的数据)。这就是我在我的应用程序的前一个版本(仍然在MySQL上运行)中使用的方式:通过Plesk API,对于每个注册,我做:
创建权限有限的数据库用户;
创建一个只能由之前创建的用户和超级用户访问的数据库(用于维护)
填充数据库
现在,我需要对PostgreSQL做同样的事情(项目越来越成熟,MySQL不能满足所有的需求)。我需要让所有数据库/模式备份独立:pg_dump在两种方式下都能完美工作,对于可以配置为只访问一个模式或一个数据库的用户也是如此。
那么,假设你是比我更有经验的PostgreSQL用户,你认为对我的情况最好的解决方案是什么,为什么?使用$x数据库而不是$x模式会有性能差异吗?将来维护哪种解决方案(可靠性)更好?我的所有数据库/模式总是具有相同的结构!
对于备份问题(使用pg_dump),可能更好的方法是使用一个数据库和多个模式,一次性转储所有模式:恢复将非常简单,在开发机器中加载主转储,然后转储和恢复所需的模式:有一个额外的步骤,但转储所有模式似乎比逐个转储更快。
更新2012
在过去的两年里,应用程序的结构和设计发生了很大的变化。我仍然使用“一个数据库与多个模式”的方法,但仍然,我的应用程序的每个版本都有一个数据库:
Db myapp_01
\_ my_customer_foo_schema
\_ my_customer_bar_schema
Db myapp_02
\_ my_customer_foo_schema
\_ my_customer_bar_schema
对于备份,我定期转储每个数据库,然后将备份移动到开发服务器上。我还使用了PITR/WAL备份,但是,正如我前面所说的,我不太可能必须一次恢复所有数据库。所以今年它可能会被取消(在我的情况下,这不是最好的方法)。
从现在起,即使应用程序结构完全改变,单数据库多模式方法也非常适合我。我几乎忘了:我所有的数据库/模式总是具有相同的结构!现在,每个模式都有自己的结构,可以根据用户数据流动态变化。
当然,我将采用单数据库多模式的方法。这允许我转储所有的数据库,但只恢复一个非常容易,在许多方面:
转储数据库(所有的模式),在一个新的db中加载转储,只转储我需要的模式,并恢复到主db中。
一个接一个地单独转储模式(但我认为这样机器会更痛苦——我预计会有500个模式!)
除此之外,我在谷歌上发现没有自动复制模式的过程(使用一个模式作为模板),但很多人建议这样做:
创建一个模板模式
需要复制时,用新名称重命名
把它倾倒
重新命名
恢复转储
魔法完成了。
我用Python写了两行;我希望他们可以帮助别人(在2秒内编写代码,不要在生产中使用它):
import os
import sys
import pg
# Take the new schema name from the second cmd arguments (the first is the filename)
newSchema = sys.argv[1]
# Temperary folder for the dumps
dumpFile = '/test/dumps/' + str(newSchema) + '.sql'
# Settings
db_name = 'db_name'
db_user = 'db_user'
db_pass = 'db_pass'
schema_as_template = 'schema_name'
# Connection
pgConnect = pg.connect(dbname= db_name, host='localhost', user= db_user, passwd= db_pass)
# Rename schema with the new name
pgConnect.query("ALTER SCHEMA " + schema_as_template + " RENAME TO " + str(newSchema))
# Dump it
command = 'export PGPASSWORD="' + db_pass + '" && pg_dump -U ' + db_user + ' -n ' + str(newSchema) + ' ' + db_name + ' > ' + dumpFile
os.system(command)
# Rename back with its default name
pgConnect.query("ALTER SCHEMA " + str(newSchema) + " RENAME TO " + schema_as_template)
# Restore the previous dump to create the new schema
restore = 'export PGPASSWORD="' + db_pass + '" && psql -U ' + db_user + ' -d ' + db_name + ' < ' + dumpFile
os.system(restore)
# Want to delete the dump file?
os.remove(dumpFile)
# Close connection
pgConnect.close()