SQL Server上插入或更新的解决方案

假设MyTable的表结构(KEY, datafield1, datafield2…)

通常，我希望更新现有记录，或者插入不存在的新记录。

从本质上讲:

IF (key exists)
  run update command
ELSE
  run insert command

最好的写法是什么?

做一个选择，如果你得到一个结果，更新它，如果没有，创建它。

2008-09-20 15:02:26

IF EXISTS (SELECT * FROM [Table] WHERE ID = rowID)
UPDATE [Table] SET propertyOne = propOne, property2 . . .
ELSE
INSERT INTO [Table] (propOne, propTwo . . .)

编辑:

唉，即使对我自己不利，我也必须承认，没有选择的解决方案似乎更好，因为它们少了一步就完成了任务。

2008-09-20 15:02:30

做一个UPSERT:

UPDATE MyTable SET FieldA=@FieldA WHERE Key=@Key

IF @@ROWCOUNT = 0
   INSERT INTO MyTable (FieldA) VALUES (@FieldA)

http://en.wikipedia.org/wiki/Upsert

2008-09-20 15:04:03

不要忘记事务。性能很好，但是简单的方法(IF EXISTS..)非常危险。当多个线程将尝试执行插入或更新时，您可以轻松地获取主键冲突。

由@Beau Crawford和@Esteban提供的解决方案显示了大致的想法，但容易出错。

为了避免死锁和PK违规，你可以使用如下方法:

begin tran
if exists (select * from table with (updlock,serializable) where key = @key)
begin
   update table set ...
   where key = @key
end
else
begin
   insert into table (key, ...)
   values (@key, ...)
end
commit tran

begin tran
   update table with (serializable) set ...
   where key = @key

   if @@rowcount = 0
   begin
      insert into table (key, ...) values (@key,..)
   end
commit tran

2008-09-20 15:06:11

做一个if存在…其他的……至少要做两个请求(一个检查，一个采取行动)。下面的方法在记录存在时只需要一个，如果需要插入则需要两个:

DECLARE @RowExists bit
SET @RowExists = 0
UPDATE MyTable SET DataField1 = 'xxx', @RowExists = 1 WHERE Key = 123
IF @RowExists = 0
  INSERT INTO MyTable (Key, DataField1) VALUES (123, 'xxx')

2008-09-20 15:07:36

我通常会像其他几个帖子说的那样，先检查它是否存在，然后再做任何正确的路径。在这样做时，您应该记住的一件事是，sql缓存的执行计划对于一个路径或另一个路径可能不是最优的。我认为最好的方法是调用两个不同的存储过程。

FirstSP:
If Exists
   Call SecondSP (UpdateProc)
Else
   Call ThirdSP (InsertProc)

现在，我不经常听从自己的建议，所以对我的建议半信半疑。

2008-09-20 15:08:03

如果你使用ADO。NET, DataAdapter处理这个。

如果你想自己处理，方法如下:

确保在键列上有一个主键约束。

然后你:

进行更新如果更新失败是因为已经存在具有键的记录，则执行插入操作。如果更新没有失败，您就完成了。

你也可以反过来做，即先做插入，然后在插入失败时进行更新。通常第一种方法更好，因为更新比插入更频繁。

2008-09-20 15:08:51

在SQL Server 2008中，您可以使用MERGE语句

2008-09-20 15:39:39

如果你想一次UPSERT多个记录，你可以使用ANSI SQL:2003 DML语句MERGE。

MERGE INTO table_name WITH (HOLDLOCK) USING table_name ON (condition)
WHEN MATCHED THEN UPDATE SET column1 = value1 [, column2 = value2 ...]
WHEN NOT MATCHED THEN INSERT (column1 [, column2 ...]) VALUES (value1 [, value2 ...])

查看在SQL Server 2005中模拟MERGE语句。

2008-09-20 15:49:03

MS SQL Server 2008引入了MERGE语句，我认为它是SQL:2003标准的一部分。正如许多人所表明的那样，处理一行情况并不是什么大问题，但当处理大型数据集时，就需要游标，随之而来的是所有性能问题。MERGE语句在处理大型数据集时将非常受欢迎。

2008-10-12 12:25:23

请看我对之前一个非常相似的问题的详细回答

@Beau Crawford's在SQL 2005及以下是一个很好的方法，尽管如果你授予rep它应该去第一个人SO它。唯一的问题是对于插入，它仍然是两个IO操作。

MS Sql2008引入了SQL:2003标准的合并:

merge tablename with(HOLDLOCK) as target
using (values ('new value', 'different value'))
    as source (field1, field2)
    on target.idfield = 7
when matched then
    update
    set field1 = source.field1,
        field2 = source.field2,
        ...
when not matched then
    insert ( idfield, field1, field2, ... )
    values ( 7,  source.field1, source.field2, ... )

现在它真的只是一个IO操作，但糟糕的代码:-(

2008-10-28 15:09:45

虽然现在评论这个有点晚了，但我想添加一个使用MERGE的更完整的示例。

这样的Insert+Update语句通常被称为“Upsert”语句，可以在SQL Server中使用MERGE实现。

这里举了一个很好的例子: http://weblogs.sqlteam.com/dang/archive/2009/01/31/UPSERT-Race-Condition-With-MERGE.aspx

上面还解释了锁定和并发场景。

我将引用同样的内容作为参考:

ALTER PROCEDURE dbo.Merge_Foo2
      @ID int
AS

SET NOCOUNT, XACT_ABORT ON;

MERGE dbo.Foo2 WITH (HOLDLOCK) AS f
USING (SELECT @ID AS ID) AS new_foo
      ON f.ID = new_foo.ID
WHEN MATCHED THEN
    UPDATE
            SET f.UpdateSpid = @@SPID,
            UpdateTime = SYSDATETIME()
WHEN NOT MATCHED THEN
    INSERT
      (
            ID,
            InsertSpid,
            InsertTime
      )
    VALUES
      (
            new_foo.ID,
            @@SPID,
            SYSDATETIME()
      );

RETURN @@ERROR;

2010-01-21 05:47:51

Before everyone jumps to HOLDLOCK-s out of fear from these nafarious users running your sprocs directly :-) let me point out that you have to guarantee uniqueness of new PK-s by design (identity keys, sequence generators in Oracle, unique indexes for external ID-s, queries covered by indexes). That's the alpha and omega of the issue. If you don't have that, no HOLDLOCK-s of the universe are going to save you and if you do have that then you don't need anything beyond UPDLOCK on the first select (or to use update first).

scproc通常在非常受控的条件下运行，并假设有可信的调用者(中间层)。这意味着如果一个简单的upsert模式(更新+插入或合并)看到重复的PK，这意味着在中间层或表设计中存在错误，SQL将在这种情况下调用错误并拒绝记录。在这种情况下，放置HOLDLOCK除了降低性能外，还等于吃掉异常并接收潜在的错误数据。

话虽如此，使用MERGE或UPDATE然后INSERT在您的服务器上更容易，而且更容易出错，因为您不必记得在第一次选择时添加(UPDLOCK)。此外，如果您正在小批量地进行插入/更新，则需要了解数据，以便决定某个事务是否合适。如果它只是一个不相关记录的集合，那么额外的“包络”交易将是有害的。

2010-07-21 01:19:07

如果您首先尝试更新，然后插入，那么竞态条件真的重要吗? 假设你有两个线程想要为key key设置一个值:

线程1:value = 1 线程2:value = 2

竞态条件场景示例

键没有定义线程1更新失败线程2更新失败线程1或线程2中的一个成功插入。例如线程1 另一个线程插入失败(错误重复键)-线程2。结果:要插入的两个步骤中的“第一个”决定值。期望结果:最后一个线程写入数据(更新或插入)应该决定值

但;在多线程环境中，操作系统调度器决定线程执行的顺序——在上面的场景中，我们有这个竞争条件，是操作系统决定执行的顺序。从系统的观点来看，说“线程1”或“线程2”是“第一个”是错误的。

当线程1和线程2的执行时间非常接近时，竞态条件的结果并不重要。唯一的要求应该是其中一个线程应该定义结果值。

对于实现:如果更新后插入导致错误的“重复键”，这应该被视为成功。

此外，我们当然不应该假定数据库中的值与您最后写入的值相同。

2011-07-20 11:07:43

如果执行UPDATE If -no-rows-updated then INSERT路由，考虑先执行INSERT以防止竞争条件(假设没有插入DELETE)

INSERT INTO MyTable (Key, FieldA)
   SELECT @Key, @FieldA
   WHERE NOT EXISTS
   (
       SELECT *
       FROM  MyTable
       WHERE Key = @Key
   )
IF @@ROWCOUNT = 0
BEGIN
   UPDATE MyTable
   SET FieldA=@FieldA
   WHERE Key=@Key
   IF @@ROWCOUNT = 0
   ... record was deleted, consider looping to re-run the INSERT, or RAISERROR ...
END

除了避免竞争条件之外，如果在大多数情况下记录已经存在，那么这将导致INSERT失败，浪费CPU。

在SQL2008以后使用MERGE可能更可取。

2011-08-25 06:43:09

您可以使用这个查询。适用于所有SQL Server版本。它简单明了。但是您需要使用两个查询。如果不能使用MERGE，可以使用

    BEGIN TRAN

    UPDATE table
    SET Id = @ID, Description = @Description
    WHERE Id = @Id

    INSERT INTO table(Id, Description)
    SELECT @Id, @Description
    WHERE NOT EXISTS (SELECT NULL FROM table WHERE Id = @Id)

    COMMIT TRAN

注意:请解释否定答案

2012-08-13 09:47:02

许多人会建议您使用MERGE，但我提醒您不要使用它。默认情况下，它不会像多条语句那样保护你不受并发性和竞态条件的影响，它还会带来其他危险:

注意SQL Server的MERGE语句那么，你想使用MERGE，嗯?

即使使用这种“更简单”的语法，我仍然更喜欢这种方法(为简洁起见，省略了错误处理):

BEGIN TRANSACTION;

UPDATE dbo.table WITH (UPDLOCK, SERIALIZABLE) 
  SET ... WHERE PK = @PK;

IF @@ROWCOUNT = 0
BEGIN
  INSERT dbo.table(PK, ...) SELECT @PK, ...;
END

COMMIT TRANSACTION;

请停止使用此UPSERT反模式

很多人会这样建议:

SET TRANSACTION ISOLATION LEVEL SERIALIZABLE;

BEGIN TRANSACTION;

IF EXISTS (SELECT 1 FROM dbo.table WHERE PK = @PK)
BEGIN
  UPDATE ...
END
ELSE
BEGIN
  INSERT ...
END
COMMIT TRANSACTION;

但是这样做的目的是确保您可能需要读取表两次来定位要更新的行。在第一个示例中，您只需要定位一次行。(在这两种情况下，如果从初始读取中没有找到行，则会发生插入。)

其他人会这样建议:

BEGIN TRY
  INSERT ...
END TRY
BEGIN CATCH
  IF ERROR_NUMBER() = 2627
    UPDATE ...
END CATCH

但是，如果不考虑其他原因，让SQL Server捕获您本来可以在第一个位置防止的异常代价要高得多，那么这就有问题了，除非在几乎所有插入都失败的罕见情况下。我在这里证明:

在进入TRY/CATCH之前检查潜在的约束违反不同错误处理技术对性能的影响

2014-01-18 20:12:46

/*
CREATE TABLE ApplicationsDesSocietes (
   id                   INT IDENTITY(0,1)    NOT NULL,
   applicationId        INT                  NOT NULL,
   societeId            INT                  NOT NULL,
   suppression          BIT                  NULL,
   CONSTRAINT PK_APPLICATIONSDESSOCIETES PRIMARY KEY (id)
)
GO
--*/

DECLARE @applicationId INT = 81, @societeId INT = 43, @suppression BIT = 0

MERGE dbo.ApplicationsDesSocietes WITH (HOLDLOCK) AS target
--set the SOURCE table one row
USING (VALUES (@applicationId, @societeId, @suppression))
    AS source (applicationId, societeId, suppression)
    --here goes the ON join condition
    ON target.applicationId = source.applicationId and target.societeId = source.societeId
WHEN MATCHED THEN
    UPDATE
    --place your list of SET here
    SET target.suppression = source.suppression
WHEN NOT MATCHED THEN
    --insert a new line with the SOURCE table one row
    INSERT (applicationId, societeId, suppression)
    VALUES (source.applicationId, source.societeId, source.suppression);
GO

用您需要的任何东西替换表和字段名。注意使用状态。然后在DECLARE行中为变量设置适当的值(和类型)。

欢呼。

2014-10-28 15:28:45

我尝试了下面的解决方案，它为我工作，当插入语句发生并发请求时。

begin tran
if exists (select * from table with (updlock,serializable) where key = @key)
begin
   update table set ...
   where key = @key
end
else
begin
   insert table (key, ...)
   values (@key, ...)
end
commit tran

2015-07-03 12:14:10

这取决于使用模式。一个人必须在不迷失在细节的情况下看到使用的大局观。例如，如果使用模式是在创建记录后99%更新，那么'UPSERT'是最佳解决方案。

在第一次插入(hit)之后，它将全部是单个语句更新，没有if或but。插入的'where'条件是必要的，否则它将插入重复的数据，并且您不希望处理锁定。

UPDATE <tableName> SET <field>=@field WHERE key=@key;

IF @@ROWCOUNT = 0
BEGIN
   INSERT INTO <tableName> (field)
   SELECT @field
   WHERE NOT EXISTS (select * from tableName where key = @key);
END

2015-11-07 22:35:50

您可以使用MERGE语句，此语句用于插入不存在的数据或更新存在的数据。

MERGE INTO Employee AS e
using EmployeeUpdate AS eu
ON e.EmployeeID = eu.EmployeeID`

2016-10-12 18:03:17

假设您想要插入/更新单行，最优的方法是使用SQL Server的REPEATABLE READ事务隔离级别:

SET TRANSACTION ISOLATION LEVEL REPEATABLE READ;
BEGIN TRANSACTION

    IF (EXISTS (SELECT * FROM myTable WHERE key=@key)
        UPDATE myTable SET ...
        WHERE key=@key
    ELSE
        INSERT INTO myTable (key, ...)
        VALUES (@key, ...)

COMMIT TRANSACTION

当当前运行的事务处于打开状态时，此隔离级别将阻止/阻止后续可重复读事务访问同一行(WHERE key=@key)。另一方面，对另一行的操作不会被阻塞(WHERE key=@key2)。

2020-09-01 13:49:51

你可以使用:

INSERT INTO tableName (...) VALUES (...) 
ON DUPLICATE KEY 
UPDATE ...

使用这个，如果已经有一个特定键的条目，那么它将更新，否则，它将插入。

2022-05-06 00:24:25

SQL Server上插入或更新的解决方案

推荐文章

最新文章

标签