我有以下代码来做到这一点,但我如何能做得更好?现在我认为它比嵌套循环更好,但是当您在列表理解中使用生成器时,它开始变得像perl一行程序。
day_count = (end_date - start_date).days + 1
for single_date in [d for d in (start_date + timedelta(n) for n in range(day_count)) if d <= end_date]:
print strftime("%Y-%m-%d", single_date.timetuple())
笔记
我不是用这个来打印的。这只是为了演示。
start_date和end_date变量是datetime。date对象,因为我不需要时间戳。(它们将用于生成报告)。
样例输出
开始日期为2009-05-30,结束日期为2009-06-09:
2009-05-30
2009-05-31
2009-06-01
2009-06-02
2009-06-03
2009-06-04
2009-06-05
2009-06-06
2009-06-07
2009-06-08
2009-06-09
一般来说,Pandas非常适合时间序列,并直接支持日期范围。
import pandas as pd
daterange = pd.date_range(start_date, end_date)
然后你可以循环daterrange来打印日期:
for single_date in daterange:
print (single_date.strftime("%Y-%m-%d"))
它也有很多选择,让生活更轻松。例如,如果您只想要工作日,您只需交换bdate_range。看到http://pandas.pydata.org/pandas-docs/stable/timeseries.html generating-ranges-of-timestamps
Pandas的强大之处在于它的数据框架,它支持向量化操作(很像numpy),使得跨大量数据的操作非常快速和简单。
编辑:
你也可以完全跳过for循环,直接打印出来,这样更简单、更高效:
print(daterange)
你可以使用箭头:
这是一个来自文档的例子,在几个小时内迭代:
from arrow import Arrow
>>> start = datetime(2013, 5, 5, 12, 30)
>>> end = datetime(2013, 5, 5, 17, 15)
>>> for r in Arrow.range('hour', start, end):
... print repr(r)
...
<Arrow [2013-05-05T12:30:00+00:00]>
<Arrow [2013-05-05T13:30:00+00:00]>
<Arrow [2013-05-05T14:30:00+00:00]>
<Arrow [2013-05-05T15:30:00+00:00]>
<Arrow [2013-05-05T16:30:00+00:00]>
要在几天内迭代,你可以这样使用:
>>> start = Arrow(2013, 5, 5)
>>> end = Arrow(2013, 5, 5)
>>> for r in Arrow.range('day', start, end):
... print repr(r)
(没有检查你是否能通过datetime。日期对象,但无论如何箭头对象通常更容易)
下面做一个按天递增的范围怎么样:
for d in map( lambda x: startDate+datetime.timedelta(days=x), xrange( (stopDate-startDate).days ) ):
# Do stuff here
startDate和stopDate是datetime。日期对象
对于通用版本:
for d in map( lambda x: startTime+x*stepTime, xrange( (stopTime-startTime).total_seconds() / stepTime.total_seconds() ) ):
# Do stuff here
startTime和stopTime是datetime。日期或datetime。datetime对象
(两者应是同一类型)
stepTime是一个timedelta对象
注意.total_seconds()只在python 2.7之后才被支持。如果你被早期版本困住了,你可以写自己的函数:
def total_seconds( td ):
return float(td.microseconds + (td.seconds + td.days * 24 * 3600) * 10**6) / 10**6
您可以简单而可靠地使用pandas库在两个日期之间生成一系列日期
import pandas as pd
print pd.date_range(start='1/1/2010', end='1/08/2018', freq='M')
您可以通过设置“freq”为D, M, Q, Y来改变生成日期的频率
(每天,每月,每季,每年
)