我正在寻求帮助,使用BULK INSERT将.csv文件导入SQL Server,我有一些基本的问题。
问题:
CSV文件的数据可能有,(逗号)之间(Ex: description),那么我如何使导入处理这些数据?
如果客户端从Excel中创建CSV,那么有逗号的数据被括在“”(双引号)[如下例],那么导入如何处理这一点?
我们如何跟踪某些行是否有坏数据,哪些导入被跳过?(导入会跳过不可导入的行)
下面是带标题的CSV示例:
Name,Class,Subject,ExamDate,Mark,Description
Prabhat,4,Math,2/10/2013,25,Test data for prabhat.
Murari,5,Science,2/11/2013,24,"Test data for his's test, where we can test 2nd ROW, Test."
sanjay,4,Science,,25,Test Only.
和SQL语句导入:
BULK INSERT SchoolsTemp
FROM 'C:\CSVData\Schools.csv'
WITH
(
FIRSTROW = 2,
FIELDTERMINATOR = ',', --CSV field delimiter
ROWTERMINATOR = '\n', --Use to shift the control to next row
TABLOCK
)
Import the file into Excel by first opening excel, then going to DATA, import from TXT File, choose the csv extension which will preserve 0 prefixed values, and save that column as TEXT because excel will drop the leading 0 otherwise (DO NOT double click to open with Excel if you have numeric data in a field starting with a 0 [zero]). Then just save out as a Tab Delimited Text file. When you are importing into excel you get an option to save as GENERAL, TEXT, etc.. choose TEXT so that quotes in the middle of a string in a field like YourCompany,LLC are preserved also...
BULK INSERT dbo.YourTableName
FROM 'C:\Users\Steve\Downloads\yourfiletoIMPORT.txt'
WITH (
FirstRow = 2, (if skipping a header row)
FIELDTERMINATOR = '\t',
ROWTERMINATOR = '\n'
)
我希望我可以使用FORMAT和Fieldquote功能,但在我的SSMS版本中似乎不支持
基于SQL Server的CSV导入
1) CSV文件数据之间可能有,(逗号)(例如:
描述),那么我如何才能使导入处理这些数据?
解决方案
如果使用,(逗号)作为分隔符,则无法区分作为字段结束符的逗号和数据中的逗号。我会使用不同的FIELDTERMINATOR,如||。代码看起来就像。这将完美地处理逗号和单斜杠。
2)如果客户端从excel中创建了csv,那么有数据
逗号被括在"…(双引号)[如下所示
那么导入如何处理这个问题呢?
解决方案
如果你使用BULK插入,那么没有办法处理双引号,数据将
用双引号插入行。
在将数据插入表后,您可以将这些双引号替换为"。
update table
set columnhavingdoublequotes = replace(columnhavingdoublequotes,'"','')
3)我们如何跟踪某些行是否有坏数据,哪些导入被跳过?
导入会跳过不可导入的行吗?
解决方案
处理由于无效数据或格式而未加载到表中的行,可以是
使用ERRORFILE属性,指定错误文件名,它将写入行
有错误到错误文件。代码应该像这样。
BULK INSERT SchoolsTemp
FROM 'C:\CSVData\Schools.csv'
WITH
(
FIRSTROW = 2,
FIELDTERMINATOR = ',', --CSV field delimiter
ROWTERMINATOR = '\n', --Use to shift the control to next row
ERRORFILE = 'C:\CSVDATA\SchoolsErrorRows.csv',
TABLOCK
)