如何在熊猫数据框架的列迭代运行回归

我在Python中使用Pandas编写了以下代码:

all_data = {}
for ticker in ['FIUIX', 'FSAIX', 'FSAVX', 'FSTMX']:
    all_data[ticker] = web.get_data_yahoo(ticker, '1/1/2010', '1/1/2015')

prices = DataFrame({tic: data['Adj Close'] for tic, data in all_data.iteritems()})  
returns = prices.pct_change()

我知道我可以像这样进行回归:

regs = sm.OLS(returns.FIUIX,returns.FSTMX).fit()

但是我如何为数据框架中的每一列做到这一点呢?具体来说，我如何遍历列，以便在每个列上运行回归?

具体来说，我想在FSTMX上回归彼此的股票代码(FIUIX, FSAIX和FSAVX)，并存储每次回归的残差。

我尝试过以下几种方法，但没有一种能达到预期的效果:

resids = {}
for k in returns.keys():
    reg = sm.OLS(returns[k],returns.FSTMX).fit()
    resids[k] = reg.resid

代码的返回[k]部分有问题吗?如何使用k值访问列?或者还有更简单的方法吗?

当前回答

假设x因素，y标签(多列):

columns = [c for c in _df.columns if c in ['col1', 'col2','col3']]  #or '..c not in..'
_df.set_index(columns, inplace=True)
print( _df.index)

X, y =  _df.iloc[:,:4].values, _df.index.values

2021-12-12 09:20:42

其他回答

根据已接受的答案，如果还需要与每列对应的索引:

for i, column in enumerate(df):
    print i, df[column]

上面的df[column]类型是Series，它可以简单地转换为numpy ndarray:

for i, column in enumerate(df):
    print i, np.asarray(df[column])

2018-04-23 17:36:27

你可以使用ix根据数据帧列的位置建立索引。

df1.ix[:,1]

例如，这将返回第一列。(0是索引)

df1.ix[0,]

这将返回第一行。

df1.ix[:,1]

这将是第0行和第1列的交点:

df1.ix[0,1]

等等。因此，您可以enumerate() returns.keys():并使用该数字来索引数据帧。

2015-01-29 15:51:24

假设x因素，y标签(多列):

columns = [c for c in _df.columns if c in ['col1', 'col2','col3']]  #or '..c not in..'
_df.set_index(columns, inplace=True)
print( _df.index)

X, y =  _df.iloc[:,:4].values, _df.index.values

2021-12-12 09:20:42

大多数答案都是通过列名，而不是直接迭代列。如果有多个具有相同名称的列，也会出现问题。如果你想迭代列，我建议:

for series in (df.iloc[:,i] for i in range(df.shape[1])):
   ...

2022-11-07 01:31:03

for column in df:
    print(df[column])

2015-09-14 06:42:27

如何在熊猫数据框架的列迭代运行回归

推荐文章

最新文章

标签