我正在寻求帮助,使用BULK INSERT将.csv文件导入SQL Server,我有一些基本的问题。
问题:
CSV文件的数据可能有,(逗号)之间(Ex: description),那么我如何使导入处理这些数据?
如果客户端从Excel中创建CSV,那么有逗号的数据被括在“”(双引号)[如下例],那么导入如何处理这一点?
我们如何跟踪某些行是否有坏数据,哪些导入被跳过?(导入会跳过不可导入的行)
下面是带标题的CSV示例:
Name,Class,Subject,ExamDate,Mark,Description
Prabhat,4,Math,2/10/2013,25,Test data for prabhat.
Murari,5,Science,2/11/2013,24,"Test data for his's test, where we can test 2nd ROW, Test."
sanjay,4,Science,,25,Test Only.
和SQL语句导入:
BULK INSERT SchoolsTemp
FROM 'C:\CSVData\Schools.csv'
WITH
(
FIRSTROW = 2,
FIELDTERMINATOR = ',', --CSV field delimiter
ROWTERMINATOR = '\n', --Use to shift the control to next row
TABLOCK
)
基于SQL Server的CSV导入
1) CSV文件数据之间可能有,(逗号)(例如:
描述),那么我如何才能使导入处理这些数据?
解决方案
如果使用,(逗号)作为分隔符,则无法区分作为字段结束符的逗号和数据中的逗号。我会使用不同的FIELDTERMINATOR,如||。代码看起来就像。这将完美地处理逗号和单斜杠。
2)如果客户端从excel中创建了csv,那么有数据
逗号被括在"…(双引号)[如下所示
那么导入如何处理这个问题呢?
解决方案
如果你使用BULK插入,那么没有办法处理双引号,数据将
用双引号插入行。
在将数据插入表后,您可以将这些双引号替换为"。
update table
set columnhavingdoublequotes = replace(columnhavingdoublequotes,'"','')
3)我们如何跟踪某些行是否有坏数据,哪些导入被跳过?
导入会跳过不可导入的行吗?
解决方案
处理由于无效数据或格式而未加载到表中的行,可以是
使用ERRORFILE属性,指定错误文件名,它将写入行
有错误到错误文件。代码应该像这样。
BULK INSERT SchoolsTemp
FROM 'C:\CSVData\Schools.csv'
WITH
(
FIRSTROW = 2,
FIELDTERMINATOR = ',', --CSV field delimiter
ROWTERMINATOR = '\n', --Use to shift the control to next row
ERRORFILE = 'C:\CSVDATA\SchoolsErrorRows.csv',
TABLOCK
)