我想将数据从CSV文件导入到现有的数据库表中。我不想保存CSV文件,只是从它的数据,并把它放入现有的表。我使用Ruby 1.9.2和Rails 3。
这是我的桌子:
create_table "mouldings", :force => true do |t|
t.string "suppliers_code"
t.datetime "created_at"
t.datetime "updated_at"
t.string "name"
t.integer "supplier_id"
t.decimal "length", :precision => 3, :scale => 2
t.decimal "cost", :precision => 4, :scale => 2
t.integer "width"
t.integer "depth"
end
你能给我一些代码,告诉我最好的方法,谢谢。
最好将数据库相关的进程包装在事务块中。代码片段blow是将一组语言播种到语言模型的完整过程,
require 'csv'
namespace :lan do
desc 'Seed initial languages data with language & code'
task init_data: :environment do
puts '>>> Initializing Languages Data Table'
ActiveRecord::Base.transaction do
csv_path = File.expand_path('languages.csv', File.dirname(__FILE__))
csv_str = File.read(csv_path)
csv = CSV.new(csv_str).to_a
csv.each do |lan_set|
lan_code = lan_set[0]
lan_str = lan_set[1]
Language.create!(language: lan_str, code: lan_code)
print '.'
end
end
puts ''
puts '>>> Languages Database Table Initialization Completed'
end
end
下面的代码片段是languages.csv文件的一部分,
aa,Afar
ab,Abkhazian
af,Afrikaans
ak,Akan
am,Amharic
ar,Arabic
as,Assamese
ay,Aymara
az,Azerbaijani
ba,Bashkir
...
最好将数据库相关的进程包装在事务块中。代码片段blow是将一组语言播种到语言模型的完整过程,
require 'csv'
namespace :lan do
desc 'Seed initial languages data with language & code'
task init_data: :environment do
puts '>>> Initializing Languages Data Table'
ActiveRecord::Base.transaction do
csv_path = File.expand_path('languages.csv', File.dirname(__FILE__))
csv_str = File.read(csv_path)
csv = CSV.new(csv_str).to_a
csv.each do |lan_set|
lan_code = lan_set[0]
lan_str = lan_set[1]
Language.create!(language: lan_str, code: lan_code)
print '.'
end
end
puts ''
puts '>>> Languages Database Table Initialization Completed'
end
end
下面的代码片段是languages.csv文件的一部分,
aa,Afar
ab,Abkhazian
af,Afrikaans
ak,Akan
am,Amharic
ar,Arabic
as,Assamese
ay,Aymara
az,Azerbaijani
ba,Bashkir
...
smarter_csv gem是专门为这个用例创建的:从CSV文件读取数据并快速创建数据库条目。
require 'smarter_csv'
options = {}
SmarterCSV.process('input_file.csv', options) do |chunk|
chunk.each do |data_hash|
Moulding.create!( data_hash )
end
end
您可以使用chunk_size选项一次读取N个csv-行,然后在内部循环中使用Resque生成将创建新记录的作业,而不是立即创建它们——这样您就可以将生成条目的负载分散到多个工作者。
参见:
https://github.com/tilo/smarter_csv
下面的模块可以在任何模型上进行扩展,它将根据CSV中定义的列标题导入数据。
注意:
这是一个很棒的内部工具,对于客户使用,我建议添加安全措施和消毒
CSV中的列名必须与DB模式完全相同,否则将无法工作
通过使用表名获取头信息,而不是在文件中定义头信息,可以进一步改进
创建一个名为“csv_importer”的文件。在您的模型/关注点文件夹中
module CsvImporter
extend ActiveSupport::Concern
require 'csv'
def convert_csv_to_book_attributes(csv_path)
csv_rows = CSV.open(csv_path).each.to_a.compact
columns = csv_rows[0].map(&:strip).map(&:to_sym)
csv_rows.shift
return columns, csv_rows
end
def import_by_csv(csv_path)
columns, attributes_array = convert_csv_to_book_attributes(csv_path)
message = ""
begin
self.import columns, attributes_array, validate: false
message = "Import Successful."
rescue => e
message = e.message
end
return message
end
end
将扩展CsvImporter添加到您想要扩展此功能的任何模型中。
在你的控制器中,你可以像下面这样使用这个功能:
def import_file
model_name = params[:table_name].singularize.camelize.constantize
csv = params[:file].path
@message = model_name.import_by_csv(csv)
end