我有以下代码来做到这一点,但我如何能做得更好?现在我认为它比嵌套循环更好,但是当您在列表理解中使用生成器时,它开始变得像perl一行程序。
day_count = (end_date - start_date).days + 1
for single_date in [d for d in (start_date + timedelta(n) for n in range(day_count)) if d <= end_date]:
print strftime("%Y-%m-%d", single_date.timetuple())
笔记
我不是用这个来打印的。这只是为了演示。
start_date和end_date变量是datetime。date对象,因为我不需要时间戳。(它们将用于生成报告)。
样例输出
开始日期为2009-05-30,结束日期为2009-06-09:
2009-05-30
2009-05-31
2009-06-01
2009-06-02
2009-06-03
2009-06-04
2009-06-05
2009-06-06
2009-06-07
2009-06-08
2009-06-09
您可以简单而可靠地使用pandas库在两个日期之间生成一系列日期
import pandas as pd
print pd.date_range(start='1/1/2010', end='1/08/2018', freq='M')
您可以通过设置“freq”为D, M, Q, Y来改变生成日期的频率
(每天,每月,每季,每年
)
Numpy的arange函数可以应用于日期:
import numpy as np
from datetime import datetime, timedelta
d0 = datetime(2009, 1,1)
d1 = datetime(2010, 1,1)
dt = timedelta(days = 1)
dates = np.arange(d0, d1, dt).astype(datetime)
astype的用途是从numpy转换。Datetime64到datetime数组。datetime对象。
下面是一个通用日期范围函数的代码,类似于Ber的答案,但更灵活:
def count_timedelta(delta, step, seconds_in_interval):
"""Helper function for iterate. Finds the number of intervals in the timedelta."""
return int(delta.total_seconds() / (seconds_in_interval * step))
def range_dt(start, end, step=1, interval='day'):
"""Iterate over datetimes or dates, similar to builtin range."""
intervals = functools.partial(count_timedelta, (end - start), step)
if interval == 'week':
for i in range(intervals(3600 * 24 * 7)):
yield start + datetime.timedelta(weeks=i) * step
elif interval == 'day':
for i in range(intervals(3600 * 24)):
yield start + datetime.timedelta(days=i) * step
elif interval == 'hour':
for i in range(intervals(3600)):
yield start + datetime.timedelta(hours=i) * step
elif interval == 'minute':
for i in range(intervals(60)):
yield start + datetime.timedelta(minutes=i) * step
elif interval == 'second':
for i in range(intervals(1)):
yield start + datetime.timedelta(seconds=i) * step
elif interval == 'millisecond':
for i in range(intervals(1 / 1000)):
yield start + datetime.timedelta(milliseconds=i) * step
elif interval == 'microsecond':
for i in range(intervals(1e-6)):
yield start + datetime.timedelta(microseconds=i) * step
else:
raise AttributeError("Interval must be 'week', 'day', 'hour' 'second', \
'microsecond' or 'millisecond'.")
一般来说,Pandas非常适合时间序列,并直接支持日期范围。
import pandas as pd
daterange = pd.date_range(start_date, end_date)
然后你可以循环daterrange来打印日期:
for single_date in daterange:
print (single_date.strftime("%Y-%m-%d"))
它也有很多选择,让生活更轻松。例如,如果您只想要工作日,您只需交换bdate_range。看到http://pandas.pydata.org/pandas-docs/stable/timeseries.html generating-ranges-of-timestamps
Pandas的强大之处在于它的数据框架,它支持向量化操作(很像numpy),使得跨大量数据的操作非常快速和简单。
编辑:
你也可以完全跳过for循环,直接打印出来,这样更简单、更高效:
print(daterange)